我基于10B模型做继续训练,loss只从11下降到5
TccccD opened this issue · comments
Chudong Tian commented
shuangt commented
Chudong Tian commented
superhg commented
继续训练是如何做的?
Paul commented
gavinL commented
请问您对这个问题有答案了吗?loss一般到什么水平算作合格呢
AlanGreen commented
GLM (General Language Model)
TccccD opened this issue · comments
继续训练是如何做的?
请问您对这个问题有答案了吗?loss一般到什么水平算作合格呢