单卡正常,多卡报错
SCU-JJkinging opened this issue · comments
我也碰到了相同问题
相同的问题,单卡正常,设置多卡时,子进程会被kill。搞不清楚原因
感觉是不是内存吃满了,然后服务自动kill了
基于ChatGLM-6B、ChatGLM2-6B、ChatGLM3-6B模型,进行下游具体任务微调,涉及Freeze、Lora、P-tuning、全参微调等
SCU-JJkinging opened this issue · comments
我也碰到了相同问题
相同的问题,单卡正常,设置多卡时,子进程会被kill。搞不清楚原因
感觉是不是内存吃满了,然后服务自动kill了