territoryfan / chatgpt-corpus

ChatGPT 中文语料库 对话语料 小说语料 客服语料 用于训练大模型

Home Page:https://chat.aimakex.com/

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

chatgpt-corpus

chatgpt 中文语料库

交流群:558195310

项目合作洽谈请联系微信 (点击下面的链接即可,请注明来意,如有关于仓库问题需讨论请参考上文入群讨论,不要加此微信)。

https://work.weixin.qq.com/kfid/kfc6913bb4906e0e597

中文指南

https://github.com/PlexPt/awesome-chatgpt-prompts-zh

GPT生成

问题表

由 ChatGPT3.5 生成,共约67万个中文问题,欢迎拿去炼丹。

300万GPT3.5自问自答数据

下载地址 https://github.com/PlexPt/chatgpt-corpus/releases/tag/3

image

客服语料

由 ChatGPT3.5 生成的客服问答,总数约约约约 200万条

预览和下载 https://github.com/PlexPt/chatgpt-corpus/tree/main/kefu

ChatGPT3.5 生成的小说和小说大纲

下载地址

预览

网络小说

共约7000中文网络小说。太大了这里传不了。需要的请联系 https://work.weixin.qq.com/kfid/kfc6913bb4906e0e597

古书资源

共 2T+古书资源。太大了这里传不了。需要的请联系 https://work.weixin.qq.com/kfid/kfc6913bb4906e0e597

更新

更多语料正在清洗中,洗干净了更新... 更多消息请关注公众号

其他语料库

https://github.com/codemayq/chinese_chatbot_corpus

https://github.com/chenking2020/FindTheChatGPTer

https://github.com/esbatmop/MNBVC

About

ChatGPT 中文语料库 对话语料 小说语料 客服语料 用于训练大模型

https://chat.aimakex.com/

License:GNU General Public License v3.0