sunzeyeah / RLHF

Implementation of Chinese ChatGPT

sunzeyeah/RLHF Issues

基于ChatGLM2的RLHF训练问题
Updated 11 days ago2
Pangu 2.6b 启动失败。
Updated 13 days ago3
请问为什么我在基于Chatglm-6b模型执行train_sft.sh训练时，启用deepspeed没有效果
Closed 5 months ago2
pretrain_data_v1.jsonl 文件在哪里
Closed 7 months ago5
后续会考虑RLHF平替方案的集成么
Closed a year ago2
有这个推理的代码吗
Updated a year ago
No module named 'transformers_modules.sunzeyeah.pangu-2'
Closed a year ago4
rlhf deepspeed和trlx能否支持 sft chatglm 6b
Closed a year ago13
reward推理问题
Closed a year ago5
chatglm+RLHF
Closed a year ago1
请问支持lora方式吗
Closed a year ago1
train_rlhf-trlx.py代码问题
Closed a year ago3
关于取最后一个token作为reward分数的方式
Closed a year ago2
用chatGLM-6B训RW的时候loss不收敛
Closed a year ago7
请教一下有考虑加IDEA-CCNL/Wenzhong2.0-GPT2-3.5B-chinese这个模型做评测比较吗
Closed a year ago1
有对比不加RLHF和加入RLHF的效果吗
Closed a year ago1
reward model的实现问题
Closed a year ago1
RLHF第三步进行训练时，在modeling_glm.py如下代码位置会显示“size mismatch, got 1028, 1028x1024,0”
Closed a year ago4
使用LoRA的GLM-10B-chinese模型是如何保存的
Closed a year ago3
用GLM-10B-chinese训练RLHF过程，有没有模型并行的方式？
Closed a year ago4
RLHF相关问题
Closed a year ago4
deepspeed速度
Closed a year ago
训练相关
Closed a year ago2
为什么训练的时候要加入<sep> token？
Closed a year ago3
加入RW后模型的效果
Closed a year ago2