多机多卡运行 stage2 和stage3，stage3的训练时间是stage2的25倍，这结果合理吗

Question

yangzhipeng1108 opened this issue 10 months ago · comments

logCong · Answer 1 · Sun Jan 07 2024 17:57:37 GMT+0800 (China Standard Time)

stage3你是是否开了offload cpu，如果开了，速度会变得很慢