小数据finetune large-chinese rouge 为0

Question

小数据finetune large-chinese rouge 为0

yxk9810 opened this issue a year ago · comments

hi，我使用100条数据，按照custom的数据阻止方式，同时val，test 和train 数据一样，其他使用默认的参数，发现val打印的rouge 都为0，看到results.json里面的所有的pred也为空，请问可能是什么原因引起的？是否有其他参数需要调整，数据就是随机的cmrc的以query作为source，答案句作为target进行生成的。rouge里面打印的fix_tokenization 返回有结果，但是duplication ration 后的buf就为空了，是因为生成的太多重复了么？

Yu · Answer 1 · Sat Mar 18 2023 17:00:05 GMT+0800 (China Standard Time)

中文要分词吧，不然rouge一直是，我今天刚遇到这个问题

JackieWu · Answer 2 · Mon Mar 20 2023 10:09:22 GMT+0800 (China Standard Time)

应该不是这个原因，因为所有的pred过了判断重复的预测都是为空，所以rouge为0，我想在小数据上过拟合来着，调整学习率也不行