关于模型初始化和超参数

Question

关于模型初始化和超参数

li-aolong opened this issue 3 years ago · comments

在main.py文件里开始训练的时候需要加载模型，模型内容包括了训练时的参数'args'，但是初次训练的话并没有这个参数，请问该如何获得？

bert_ckpt= torch.load(args.bert_path)
bert_args = bert_ckpt['args']

而且，在加载模型的时候需要bert_args.embed_dim这些参数，代码里也没有找到，想问一下是否能够开源一个已经训练好的模型？

bert_model = BERTLM(device, bert_vocab, bert_args.embed_dim, bert_args.ff_embed_dim, bert_args.num_heads, \
                                     bert_args.dropout, bert_args.layers, bert_args.approx)

另外，模型训练的超参数是和train.sh里一致的吗？

lismin · Answer 1 · Tue Aug 10 2021 10:49:04 GMT+0800 (China Standard Time)

看下bert的实现代码吧，看了就知道这些参数信息了，虽然本人也还没认真看过bert的源码。

chaohen · Answer 2 · Thu Sep 09 2021 20:05:00 GMT+0800 (China Standard Time)

看下bert的实现代码吧，看了就知道这些参数信息了，虽然本人也还没认真看过bert的源码。

你好请问这个模型有成功运行吗？求一下运行方法

lismin · Answer 3 · Thu Sep 09 2021 20:06:24 GMT+0800 (China Standard Time)

可以成功的

…

------------------ 原始邮件 ------------------ 发件人: ***@***.***>; 发送时间: 2021年9月9日(星期四) 晚上8:05 收件人: ***@***.***>; 抄送: "(∩_∩) ***@***.***>; ***@***.***>; 主题: Re: [lipiji/TtT] 关于模型初始化和超参数 (#1) 看下bert的实现代码吧，看了就知道这些参数信息了，虽然本人也还没认真看过bert的源码。你好请问这个模型有成功运行吗？ — You are receiving this because you commented. Reply to this email directly, view it on GitHub, or unsubscribe.

fujunying2018 · Answer 4 · Thu Sep 16 2021 18:58:45 GMT+0800 (China Standard Time)

您好，您在下面的代码模块儿做了哪些处理呢，可以举个例子吗
bert_ckpt= torch.load(args.bert_path)
bert_args = bert_ckpt['args']

Aolong · Answer 5 · Thu Sep 16 2021 19:13:16 GMT+0800 (China Standard Time)

您好，您在下面的代码模块儿做了哪些处理呢，可以举个例子吗
bert_ckpt= torch.load(args.bert_path)
bert_args = bert_ckpt['args']

@lixumin-zai

fujunying2018 · Answer 6 · Fri Sep 17 2021 15:50:37 GMT+0800 (China Standard Time)

在main.py文件里开始训练的时候需要加载模型，模型内容包括了训练时的参数'args'，但是初次训练的话并没有这个参数，请问该如何获得？
bert_ckpt= torch.load(args.bert_path)
bert_args = bert_ckpt['args']
而且，在加载模型的时候需要bert_args.embed_dim这些参数，代码里也没有找到，想问一下是否能够开源一个已经训练好的模型？
bert_model = BERTLM(device, bert_vocab, bert_args.embed_dim, bert_args.ff_embed_dim, bert_args.num_heads, \
                                     bert_args.dropout, bert_args.layers, bert_args.approx)
另外，模型训练的超参数是和train.sh里一致的吗？

您好，您这块儿运行起来了吗？如果运行起来是否可以分享下这块儿的修改代码

Aolong · Answer 7 · Fri Sep 17 2021 16:07:23 GMT+0800 (China Standard Time)

@fujunying2018 没跑起来，最近也没看了，上边有人说成功了，我给你@了

fujunying2018 · Answer 8 · Fri Sep 17 2021 16:09:27 GMT+0800 (China Standard Time)

好的，谢谢

Piji Li · Answer 9 · Wed Dec 08 2021 11:29:14 GMT+0800 (China Standard Time)

Will release it before 31 Dec.