deepglint / unicom

[ICLR 2023] Unicom: Universal and Compact Representation Learning for Image Retrieval

Home Page:https://arxiv.org/pdf/2304.05884.pdf

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

关于数据集制作

KeyaoZhao opened this issue · comments

您好!我想请问一下在新的小数据集上finetune时可能会遗忘学过的LAION 400M,导致finetune后的模型泛化性能下降。所以我计划在finetune时也加入部分LAION 400M数据,但是我使用LAION 400M聚类到1M时的类id可能和您训练时的不同,这是否会产生冲突呢?请问数据集的这些信息或者原始的制作方法您可以公布下吗?非常感谢~

马上会把,做数据集的脚本和100w类中心的权重放出来。

请问能否先release一下400M特征时的聚类算法?想学习一下数据集如何制作,非常感谢!

马上会把,做数据集的脚本和100w类中心的权重放出来。

你好,请问有最近的计划了吗