有在中文为主的模型上进行dpo训练吗?感觉很难找到dpo的中文数据集,用英文的会有效吗?
no-execution opened this issue · comments
王昊天 commented
potter commented
有一些的,可以翻译成中文,或者自己构造
Firefly: 大模型训练工具,支持训练Qwen2、Yi1.5、Phi-3、Llama3、Gemma、MiniCPM、Yi、Deepseek、Orion、Xverse、Mixtral-8x7B、Zephyr、Mistral、Baichuan2、Llma2、Llama、Qwen、Baichuan、ChatGLM2、InternLM、Ziya2、Vicuna、Bloom等大模型
no-execution opened this issue · comments
有一些的,可以翻译成中文,或者自己构造