WHU数据集的图片分辨率，数量和是否要crop增强，crop size的大小

Question

WHU数据集的图片分辨率，数量和是否要crop增强，crop size的大小

yaohusama opened this issue 2 months ago · comments

我想问一下，当WHU数据集输入SAM-CD网络时，WHU数据集的分辨率是多少呢？
我看这个仓库里提供的下载链接的WHU数据集划分的图是256x256的分辨率的，那是否网络输入图片分辨率就是256x256呢？那是否还要crop图增强，如果要crop图，crop size多大呢？
另外，我看下载链接里的WHU数据集的train文件夹，包括了val文件夹下的图片，这是正确的吗？论文里提到we divide the dataset into training, validation and test sets with 6096, 762 and 762 pairs of image patches (each with a spatial size of 256×256, respectively.
而我看提供下载链接里的whu数据集的val是743张图，train是6691张，test743张，为什么和论文里提到的数量不一致呢。

Lei · Answer 1 · Sat Jun 15 2024 12:33:58 GMT+0800 (China Standard Time)

我想问一下，当WHU数据集输入SAM-CD网络时，WHU数据集的分辨率是多少呢？我看这个仓库里提供的下载链接的WHU数据集划分的图是256x256的分辨率的，那是否网络输入图片分辨率就是256x256呢？那是否还要crop图增强，如果要crop图，crop size多大呢？另外，我看下载链接里的WHU数据集的train文件夹，包括了val文件夹下的图片，这是正确的吗？论文里提到we divide the dataset into training, validation and test sets with 6096, 762 and 762 pairs of image patches (each with a spatial size of 256×256, respectively. 而我看提供下载链接里的whu数据集的val是743张图，train是6691张，test743张，为什么和论文里提到的数量不一致呢。

您好，感谢关注。
1.WHU-CD 的分辨率请查阅数据集发布说明。
2.本文未进行crop，仅使用了flip增强
3.本文实验设置沿用了其他文章的实验设置数据集也不是我们处理，只是为了便利查找，给出了网盘链接。实际实验的训练测试划分是按照论文的，把train目录的val图片删除即可。

quarterMoon · Answer 2 · Sat Jun 15 2024 13:13:58 GMT+0800 (China Standard Time)

谢谢。我用网盘链接里的WHU数据集跑了SAM-CD，没用crop增强，分辨率是256x256，只达到了截图里的指标。和论文里的相差很多，请问是因为levir cd数据集和whu数据集的训练超参不一样吗，比如学习率或者优化器的不同，epoch的不同吗？我该怎么复现出论文里的指标呢？或者可以提供whu数据集上的训练权重吗？我看仓库里目前只有levir cd数据集的训练权重。

Lei · Answer 3 · Sat Jun 15 2024 13:18:29 GMT+0800 (China Standard Time)

谢谢。我用网盘链接里的WHU数据集跑了SAM-CD，没用crop增强，分辨率是256x256，只达到了截图里的指标。和论文里的相差很多，请问是因为levir cd数据集和whu数据集的训练超参不一样吗，比如学习率或者优化器的不同，epoch的不同吗？我该怎么复现出论文里的指标呢？或者可以提供whu数据集上的训练权重吗？我看仓库里目前只有levir cd数据集的训练权重。

文章里的指标是mF1，之所以选取该指标也是沿用了其他文章的实验设置。
权重我近期整理下开放。

quarterMoon · Answer 4 · Sat Jun 15 2024 13:26:34 GMT+0800 (China Standard Time)

仓库里是levir cd的训练代码，那我用仓库的代码改跑WHU数据集只有95.62的mf1，而论文里报的是97.58的mF1，那这种差别如果不是因为随机性的话，那是不是因为某些训练超参不一样呢，可以告诉我是需要修改哪些超参来达到论文相近的指标吗？麻烦大佬了！