finetune结果模型只有13M

Question

jiangliqin opened this issue a year ago · comments

训练日志没有异常信息，但是最终cpm_bee_finetune-delta-best.pt只有13m

Zhi Zheng · Answer 1 · Tue Jun 13 2023 19:34:29 GMT+0800 (China Standard Time)

因为使用了增量微调（--use-delta参数），只保存了LoRA的权重

hashen · Answer 2 · Wed Jun 14 2023 10:01:47 GMT+0800 (China Standard Time)

是的，text_generation.py有Lora使用说明，谢谢~

hashen · Answer 3 · Wed Jun 14 2023 10:03:27 GMT+0800 (China Standard Time)

请问是否支持多任务的finetune,讲数据构造成多任务的格式？

Jeffrey G. · Answer 4 · Mon Jun 19 2023 15:42:11 GMT+0800 (China Standard Time)

您可以将每种任务设计一种数据格式，然后把所有任务的数据混合起来微调即可

fengcai24 · Answer 5 · Sun Jun 25 2023 11:50:57 GMT+0800 (China Standard Time)

您可以将每种任务设计一种数据格式，然后把所有任务的数据混合起来微调即可

请问预训练脚本要用什么数据格式呢？