depth-based-compression/combine_images.py

# from __future__ import division
import sys
from PIL import Image
import os
import numpy as np
from util import load_image, array2PIL
import argparse
from scipy.stats import percentileofscore

parser = argparse.ArgumentParser()

parser.add_argument('-image'            , type=str , default= 'image.png')
parser.add_argument('-map'              , type=str , default= './output/msroi_map.jpg')
parser.add_argument('-output_directory' , type=str , default= 'output')
parser.add_argument('-modifier'         , type=str , default= '')
parser.add_argument('-find_best'        , type=int , default=1)

# change the threshold % to 1, if doing metric comparison against standard JPEG. 
# Images will have limited discernibility but fairer comparison against standard.
parser.add_argument('-threshold_pct'    , type=int , default=20)

# if you have Imagemagick installed, use convert it is faster
parser.add_argument('-use_convert'      , type=int , default=0)

# try at multiple values. 50 is standard for our paper
parser.add_argument('-jpeg_compression' , type=int , default=50)

# there are various models from 1 to 6 on how best to mix different JPEG Qualities
parser.add_argument('-model'            , type=int , default=4)
parser.add_argument('-single'           , type=int , default=1)
parser.add_argument('-dataset'          , type=str , default='kodak')

# printing metrics requires https://github.com/Rolinh/VQMT
parser.add_argument('-print_metrics'    , type=int , default=0)
args = parser.parse_args()


def make_quality_compression(original,sal):
    if args.print_metrics:
        print (args.image)
    # if the size of the map is not the same original image, then blow it
    if original.size != sal.size:
        sal = sal.resize(original.size)

    sal_arr = np.asarray(sal)
    img_qualities = []
    quality_steps = [i*i for i in range(1,11)]
    #quality_steps = [1, 2, ]
    #quality_steps = [i for i in range(1,11)] #modified
    print('quality steps')
    print(quality_steps)
    # this temp directory will be deleted, do not use this to store your files
    os.makedirs('temp_xxx_yyy')
    for q in quality_steps:
        name = 'temp_xxx_yyy/temp_' + str(q) + '.jpg'
        if args.use_convert:
            os.system('convert -colorspace sRGB -filter Lanczos -interlace Plane -type truecolor -quality ' + str(q) + ' ' + args.image + ' ' + name)
        else:
            original.save(name, quality=q)
        img_qualities.append(np.asarray(Image.open(name)))
        os.remove(name)
    os.rmdir('temp_xxx_yyy')
                   
    k = img_qualities[-1][:] # make sure it is a copy and not reference
    shape = k.shape 
    #k.flags.writeable = True prev version?
    k.setflags(write=1)
    mx, mn = np.max(sal_arr), np.mean(sal_arr)
    sal_flatten = sal_arr.flatten()

    q_2,q_3,q_5,q_6,q_9 = map(lambda x: np.percentile(sal_arr, x), [20,30,50,60,90])
    
    q_a = [np.percentile(sal_arr, j) for j in quality_steps]
    print("percentile split ups")
    print(q_a)
    low, med, high = 2, 5, 9


    data_final = []
    data_final = np.zeros((shape[0], shape[1], shape[2]))
    filter_size = 4
    temp = []
    for i in range(shape[0]):
        for j in range(shape[1]):
            for l in range(filter_size):
                if i + l - filter_size < 0 or i + l - filter_size > shape[0] - 1:
                    for c in range(filter_size):
                        temp.append(0)
                else:
                    if j + l - filter_size < 0 or j + filter_size > shape[1] - 1:
                        temp.append(0)
                    else:
                        for m in range(filter_size):
                            temp.append(sal_arr[i + l - filter_size, j + m - filter_size, 0])
                

            temp.sort()
            data_final[i, j, 0] = float(temp[len(temp) // 2])
            temp = []
    
    print(data_final)
    img = Image.fromarray( data_final[:,:,0].reshape((shape[0], shape[1])))
    #img.show()
    #out_img = array2PIL(data_final)
    #rgb_out = out_img.convert('RGB')
    #out_name = args.output_directory + '/' + '_filter_' + args.image.split('/')[-1] + '_' + '.png'
    
    #out_img.save(out_name)
    #img = Image.fromarray(data_final)
    #img.show()
    
    for i in range(shape[0]):
        for j in range(shape[1]):
            for l in range(shape[2]):
                #print("shape")
                #print(shape[2])
                #ss = sal_arr[i,j,0]
                ss = data_final[i, j, 0]
                if args.model == 1:
                    # model -1 
                    # hard-coded model
                    if ss > mn: qq = 9
                    else: qq = 6

                elif args.model == 2:
                    # model -2 
                    # linearly scaled technique
                    qq = (ss * 10 // mx) -1  + 3
                
                elif args.model == 3:
                    # model -3 
                    # percentile based technique
                    # qq = int(percentileofscore(sal_flatten, ss)/10)
                    for index, q_i in enumerate(q_a):
                        #print("Temp");
                        #print(ss);
                        #print(q_i);
                        if ss < q_i: 
                            qq = index+2
                            #print("assign");
                            #print(qq);
                            break
                    #print(qq)
                elif args.model == 4:
                    # model -4 
                    # discrete percentile based technique
                    # if   ss < q_2: qq = 4 
                    if ss < q_2: qq = 1 
                    #elif ss < q_3: qq = 1
                    elif ss < q_5: qq = 2 
                    #elif ss < q_6: qq = 4
                    elif ss < q_6: qq = 4 
                    else: qq = 7

                elif args.model == 5:
                    # model -5
                    # two way percentile
                    if ss <  q_5: qq = 1
                    else: qq = 5

                elif args.model == 6:
                    # model -6
                    # two way percentile - higher coverage
                    if ss <  q_5: qq = 7
                    else: qq = 9
                    
                else:
                    raise Exception("unknown model number")

                if qq < low : qq = low
                if qq > high: qq = high 
                
                k[i,j,l] = img_qualities[qq][i,j,l]
                

    # save the original file at the given quality level
    compressed = args.output_directory + '/' + '_original_' + args.image.split('/')[-1] + '_' + str(args.jpeg_compression) + '.jpg'
    #original.save(compressed, quality=args.jpeg_compression)
    original.save(compressed, quality=args.jpeg_compression)
   
    
    original_size = os.path.getsize(compressed)
    os.system('convert ' + args.image + " " + args.output_directory + '/temp.png')
    uncompressed_size = os.path.getsize(args.output_directory + '/temp.png')
    os.remove(args.output_directory + '/temp.png')

    out_img = array2PIL(k)
    rgb_out = out_img.convert('RGB')
    if args.find_best:
        out_name = args.output_directory + '/' + '_compressed_' + args.image.split('/')[-1] + '_' + '.jpg'
        for qual in range(4,2,-1):
            rgb_out.save(out_name, quality=50)
            current_size = os.path.getsize(out_name)
            if current_size<= original_size*(1 + args.threshold_pct/100.0): 
                if args.print_metrics:
                    print (args.model, uncompressed_size, original_size, current_size, args.jpeg_compression, qual,' | ')
                break
        else:
            if args.print_metrics:
                print (args.model, uncompressed_size, original_size, current_size, args.jpeg_compression, qual,' | ')
            pass

    else:
        final_quality = [100, 85, 65, 45]
        for fq in final_quality:
            out_name = args.output_directory + '/' + args.modifier + args.image.split('/')[-1] + '_' + str(fq) + '.jpg'
            out_img.save(out_name, quality=fq)
    return compressed, out_name


from glob import glob
# make the output directory to store the Q level images, 
if not os.path.exists(args.output_directory):
    os.makedirs(args.output_directory)

if args.print_metrics:
    from get_metrics import get_metrics

if False:
#if args.single:
    original = Image.open(args.image)
    original_rgb = original.convert('RGB')
    sal = Image.open(args.map)
    sal_rgb = sal.convert('RGB')
    a,b = make_quality_compression(original_rgb, sal_rgb)

    if args.print_metrics:
        get_metrics(args.image,a,b, original.size)

else:
    
    if args.dataset == 'kodak':
        image_path = 'images_directory/kodak/*.png'
    elif args.dataset == 'large':
        image_path = 'images_directory/output_large/ori_*.png'
    else:
        assert Exception("Wrong dataset choosen")
    image_path = "examples/*.jpg"

    for image_file in glob(image_path):
        if args.dataset == 'large':
            map_file = 'images_directory/output_large/map' + image_file.split('/')[-1][3:-4] 
        elif args.dataset == 'kodak':
            map_file = 'images_directory/output_kodak/map_' + image_file.split('/')[-1] + '.jpg'
        map_file = 'depth-map/' + image_file.split('/')[1].split('.')[0] + '.png'
        args.image = image_file
        args.map   = map_file
        original = Image.open(args.image)
        sal = Image.open(args.map)
        a,b = make_quality_compression(original,sal)
        if args.print_metrics:
            get_metrics(args.image,a,b, original.size)