THUDM / GLM

GLM (General Language Model)

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

小数据finetune large-chinese rouge 为0

yxk9810 opened this issue · comments

hi,我使用100条数据,按照custom的数据阻止方式,同时val,test 和train 数据一样,其他使用默认的参数,发现val打印的rouge 都为0,看到results.json里面的所有的pred也为空,请问可能是什么原因引起的?是否有其他参数需要调整,数据就是随机的cmrc的以query作为source,答案句作为target进行生成的。rouge里面打印的fix_tokenization 返回有结果,但是duplication ration 后的buf就为空了,是因为生成的太多重复了么?

commented

中文要分词吧,不然rouge一直是,我今天刚遇到这个问题

应该不是这个原因,因为所有的pred过了判断重复的预测都是为空,所以rouge为0,我想在小数据上过拟合来着,调整学习率也不行