PengliDu / SwinIC

Image Compression Using Swin Transformer

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

SwinIC

Image Compression Using Swin Transformer 项目依赖在文件requirement.txt中

训练集DIV2K train(800)&val(100) 解压到dataset/DIV2K/DIV2K_train_HR中(train和val放到一起 共900张)。 下载链接 http://data.vision.ee.ethz.ch/cvl/DIV2K/DIV2K_train_HR.zip http://data.vision.ee.ethz.ch/cvl/DIV2K/DIV2K_valid_HR.zip

测试集Kodak 已在dataset/kodak

首先使用utils.py将训练数据集进行预处理 900张图随机裁剪384

请在train.py 中配置真实数据集路径

parser.add_argument(
        "--train_path", default='dataset/DIV2K/DIV2K_train_HR_sub', type=str,
        help='train dataset path')
parser.add_argument(
        "--val_path", default='dataset/kodak', type=str,
        help='val dataset path')

运行train进行训练 命令如下

需要完成以下11组参数的训练

batchsize和使用的gpu数量需要自行调整

batchsize为4时约需要11G显存

高qp网络channel数为 低qp的两倍,会增加显存使用,需要根据情况调低batchsize

python train.py --batchsize 32 --gpu "0,1,2,3" --model_type 0 --qp 3
python train.py --batchsize 32 --gpu "0,1,2,3" --model_type 0 --qp 5
python train.py --batchsize 32 --gpu "0,1,2,3" --model_type 0 --qp 7

python train.py --batchsize 32 --gpu "0,1,2,3" --model_type 1 --qp 2
python train.py --batchsize 32 --gpu "0,1,2,3" --model_type 1 --qp 3
python train.py --batchsize 32 --gpu "0,1,2,3" --model_type 1 --qp 4

model_type 0 损失为MSE model_type 1 损失为MS-SSIM

About

Image Compression Using Swin Transformer


Languages

Language:Python 100.0%