Giters
THUDM
/
GLM
GLM (General Language Model)
Geek Repo:
Geek Repo
Github PK Tool:
Github PK Tool
Stargazers:
3162
Watchers:
46
Issues:
192
Forks:
321
THUDM/GLM Issues
ds_finetune_superglue.sh 脚本如何配置流水线并行
Updated
a month ago
110M的模型有huggingface版本吗?
Updated
3 months ago
建议上架ollama
Updated
3 months ago
ms-swift支持了glm-4v-9b多模态大模型的微调(finetune)🚀😊
Closed
3 months ago
Comments count
2
模型的分词逻辑
Updated
4 months ago
运行bash scripts/generate_block.sh config_tasks/model_blocklm_10B_chinese.sh报错
Updated
5 months ago
Comments count
1
Add special_token
Updated
5 months ago
在没有InfiniBand情况下能训练glm-large吗
Updated
5 months ago
Comments count
3
Few-shot tests on GLM-10B
Updated
6 months ago
Eligibility for Commercial Use
Updated
8 months ago
Comments count
1
What is the license of Pretrained Models?
Updated
8 months ago
bug report!rouge-1 = 0.0000 rouge-2 = 0.0000 rouge-l = 0.0000
Closed
8 months ago
Comments count
1
如果用glm-chinese-large 版本进行微调,相关的配置需要更改吗?
Closed
8 months ago
请教一下大家,glm0.3b有什么可用的推理加速的方法吗?目前我的推理任务要3秒钟一个,耗时太长
Updated
8 months ago
Comments count
1
mpi4py库
Closed
10 months ago
ImportError: cannot import name 'container_abcs' from 'torch._six' (/root/anaconda3/envs/lss/lib/python3.8/site-packages/torch/_six.py)
Updated
10 months ago
Comments count
1
使用glm-large-chinese微调分类任务
Updated
10 months ago
微调glm-large-chinese,不能使用deepspeed吗?
Updated
10 months ago
在使用glm-large-chinese微调分类任务时报错
Updated
10 months ago
使用glm-2b时候,跟随readme提供的例子,得到很糟糕的输出
Updated
10 months ago
Comments count
2
运行 GLM-10B 的最低配置是多少?
Updated
10 months ago
Comments count
1
使用GLM-2b推理时生成无意义内容
Updated
a year ago
请发布一个小参数版本的ChatGLM,与ChatGLM-6B共享Tokenizer,让RLHF最后一步PPO能够最大可能提速
Updated
a year ago
Comments count
4
使用glm-10b-chinese调用generate方法有时时会出错
Updated
a year ago
Comments count
1
我基于10B模型做继续训练,loss只从11下降到5
Updated
a year ago
Comments count
6
使用Zero-1+cpu_offload=true时,出现错误?
Updated
a year ago
Comments count
2
MP_size大于1 continue pretrained后的模型 怎么转换成transformer模型进行测试
Updated
a year ago
调用glm模型,遇到modeling_glm.py的bug:attention_mask初始化device设置遗漏
Updated
a year ago
Comments count
1
请问有人使用GLM跑通过Continual Pre-training么?
Updated
a year ago
glm-10b-chinese原始模型推理报错
Updated
a year ago
在预训练Pretrain时报no valid `self._rcvd_idx` is found错误
Updated
a year ago
Comments count
3
有对glm-10b-chinese这个模型做过评测的吗?
Updated
a year ago
Comments count
1
如何将GLM10B封装成对话式API
Updated
a year ago
Comments count
3
用transformers包,下载文件到本地后无法加载AutoTokenizer
Updated
a year ago
glm-10b / tokenization_glm.py
Updated
a year ago
预训练的数据格式可以给个示例吗,可以不显示数据,就想看下格式
Updated
a year ago
Comments count
1
block_lm_ratio参数
Closed
a year ago
Comments count
1
parameter SCB
Updated
a year ago
Comments count
1
求问glm-10b-chinese推理所需最低配置
Updated
a year ago
用"THUDM/glm-10b-chinese"做分类任务出错
Closed
a year ago
Comments count
2
请问微调模型的 参考资料哪里可以学习借鉴
Updated
a year ago
GLM-10B中文版预训练权重下载后解压失败
Updated
a year ago
数据集格式是怎么样的?能否把一篇一万字的文档整体塞进去训练?另外对显卡要求是多高
Updated
a year ago
GLM-10B-Chinese模型文件太大无法解压
Closed
a year ago
Comments count
1
.
Closed
a year ago
请问 glm-10b-chinese 模型初始loss是多少,我的是1.7左右合理吗
Updated
a year ago
glm-10b-chinese模型的预训练数据量
Updated
a year ago
GLM 10B和ChatGLM 6B模型架构的差别
Updated
a year ago
Comments count
3
环境问题:python 版本号与 requirements.txt 中的版本号,以及一些依赖
Updated
a year ago
关于GLM的有以下两个问题?1.为什么predict的时候没有加linear映射到词表维度,而是直接与word_embeddings相乘映射到词表维度了。 2.GLM加载使用AutoModelForSeq2SeqLM,而没有使用AutoModelForCausualLM,原因是什么?
Updated
a year ago
Previous
Next