zhaoyingjun / general

Alignment成为GPT类大模型微调的必须环节,深度强化学习是Alignment的核心。本项目是一个支持非gym环境训练、支持可视化配置的深度强化学习应用编程框架,30分钟上手强化学习编程。

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

zhaoyingjun/general Issues