THUDM / GLM

GLM (General Language Model)

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

generate_samples.py问题

taofennanhai opened this issue · comments

commented

1.glm10B-chinese的position_embeddings问题。为何从模型加载点获取的模型最大位置编码矩阵为[1025,4096],而不是脚本定义的[1024,4096]?
@XLNEW1PN_%)XBEKGJHZ_GM
2.通过更改最大位置编码为1025后,可以运行。但是输入一个句子预测后,发生piece id is out of range错误
%@AKV3{N9C}ZTJKG(B W})1
2YM~_ZT$T_D9VHRO{L_)K_4
我设置的模型参数如下
图片