千文模型的三阶段和二阶段微调

Question

lyc728 opened this issue 3 months ago · comments

2024/3/21

qwen-vl的微调

qwen-vl的三阶段微调和二阶段微调是那个脚本呢？

finetune/ds_config_zero2.json这个脚本和finetune/ds_config_zero3.json是分别代表二三阶段吗？

文档没有介绍

三阶段说会冻住vit进行训练，没有看到代码进行介绍；还有二阶段多任务的数据也可以用于三阶段进行指令微调吗

little train · Answer 1 · Wed Mar 27 2024 20:44:18 GMT+0800 (China Standard Time)

没有三阶段和两阶段吧， zero2 和 zero3 只是deepspeed 训练的设置,根据自己的硬件条件选择即可。冻住vit应该是fix_vit参数设置为True即可， finetune/finetune_ds.sh 中默认设置为True的

lyc728 · Answer 2 · Mon Apr 01 2024 09:27:09 GMT+0800 (China Standard Time)

没有三阶段和两阶段吧， zero2 和 zero3 只是deepspeed 训练的设置,根据自己的硬件条件选择即可。冻住vit应该是fix_vit参数设置为True即可， finetune/finetune_ds.sh 中默认设置为True的

技术报告中是讲了分为3个阶段进行训练的哦

QwenLM / Qwen-VL