在预训练模型上训练
lvelvelve0504 opened this issue · comments
你好,我想在用您的预训练模型进行训练而不是从头训练,请问该如何操作
不建议在目前的模型上进行继续训练,原因如下:
- 过度的训练可能会使提取器失去作用(可以理解成过拟合),这个我在之后会想办法改进。
- hisd的训练cost并不是很大,单卡一天就基本可以达到效果,如果单个tag的话需要的时间更少。
另外,代码是支持断点续训的,你只需要在你原本训练的args中加入--resume即可,会自动找寻你目前config文件代表的输出文件夹中最新的checkpoint进行读取并继续训练的。
好的 非常感谢!