📌 SakuraLLM Roadmap

Question

pipixia244 opened this issue 6 months ago · comments

模型训练

neko7055 · Answer 1 · Mon Apr 08 2024 18:22:25 GMT+0800 (China Standard Time)

或許也可以使用在日文語料訓練微調過的模型試試，此 repo 整理了許多日文的模型，其中 rinna/nekomata-14b 是 qwen-14b continual pre-training在日文語料的模型，可能能增強模型性能

SakuraUmi · Answer 2 · Tue Apr 16 2024 20:19:37 GMT+0800 (China Standard Time)

或許也可以使用在日文語料訓練微調過的模型試試，此 repo 整理了許多日文的模型，其中 rinna/nekomata-14b 是 qwen-14b continual pre-training在日文語料的模型，可能能增強模型性能

这类模型普遍是日英数据微调，中文能力很差/弱化严重，暂时不做考虑。

Xie Zejian · Answer 3 · Sat Jun 08 2024 12:35:27 GMT+0800 (China Standard Time)

是否有计划开源全精度模型，这样可以借助现在的一些开源推理工具进行部署，它们很多宣传速度已经超过了vllm