你好,没有找到hfl/chinese-roberta-wwm-ext的small版,只找到了base和large,请问train_m3e.py是在这个roberta-wwm基础上训练得到的吗?
huangjiaheng opened this issue · comments
huangjiaheng commented
🐛 bug 说明
你好,没有找到hfl/chinese-roberta-wwm-ext的small版,只找到了base和large,请问train_m3e.py是在这个roberta-wwm基础上训练得到的吗?
Python Version
None
yuxin.wang commented
抱歉没有在文档中说清楚,small 版本使用的基础模型是 uer/chinese_roberta_L-4_H-512
LIYIBO commented
如果我想更换更小的roberta基础模型去做m3e的训练,应该如何操作
yuxin.wang commented
可以参考 https://github.com/wangyuxinwhy/uniem/blob/main/scripts/train_m3e.py
这个训练脚本,准备好数据和模型,运行脚本就可以了