模型训练的代码方便放出来吗

Question

模型训练的代码方便放出来吗

changleilei opened this issue 3 years ago · comments

changleilei commented 3 years ago

给的模型连接，是你们已经训练好的吗？

Sun Yi · Answer 1 · Thu Sep 16 2021 16:09:42 GMT+0800 (China Standard Time)

您好，模型是从由Google, UER, 和HFL等机构训练的原始BERT模型，只要经过NSP任务预训练就可以，不是我们自己训练的

chen hao · Answer 2 · Sat Sep 18 2021 15:41:37 GMT+0800 (China Standard Time)

@sunyilgdx 首先感谢大佬的项目，
您的意思是不是，不需要训练了已经，也甚至不需要 finetuning , 直接down 网上开元的预训练的model就ok吗？
比如说文本分类问题：
只需要把训练数据制作成对应的pattern, 然后输入到预训练model中，比较[CLS]的概率就ok吗？

Sun Yi · Answer 3 · Sat Sep 18 2021 16:01:57 GMT+0800 (China Standard Time)

是的，不需要任何训练
是把验证集和测试集数据与prompt template做成句子对，输入到模型中
同时，不是[CLS]的概率，是[CLS]连接的NSP head的输出概率
@chenhaoenen

chen hao · Answer 4 · Sat Sep 18 2021 16:08:25 GMT+0800 (China Standard Time)

感谢回复！！！厉害了大佬， amazing work !