Magicoder: Source Code Is All You Need
Home Page:https://arxiv.org/abs/2312.02120
Geek Repo:Geek Repo
Github PK Tool:Github PK Tool
tusiqi1 opened this issue 3 months ago · comments
因为README-DEV.md脚本直接使用accelerate提示训练内存不足,故修改为deepspeed-stage1启动,其余参数均为默认。因是8卡迭代步长缩小了1/4。
经过实验后我发现:
想咨询下机器不同,且增加了deepspeed有可能让结果变差这么多吗?