wangyuxinwhy / uniem

unified embedding model

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

你好,没有找到hfl/chinese-roberta-wwm-ext的small版,只找到了base和large,请问train_m3e.py是在这个roberta-wwm基础上训练得到的吗?

huangjiaheng opened this issue · comments

🐛 bug 说明

你好,没有找到hfl/chinese-roberta-wwm-ext的small版,只找到了base和large,请问train_m3e.py是在这个roberta-wwm基础上训练得到的吗?

Python Version

None

抱歉没有在文档中说清楚,small 版本使用的基础模型是 uer/chinese_roberta_L-4_H-512

commented

如果我想更换更小的roberta基础模型去做m3e的训练,应该如何操作

可以参考 https://github.com/wangyuxinwhy/uniem/blob/main/scripts/train_m3e.py
这个训练脚本,准备好数据和模型,运行脚本就可以了