finetune_dataset_maker

注：新版的openai包改了api接口的用法，要使用现有代码请安装旧版，pip install openai==0.28.0

pip安装最新版的streamlit和openai，执行这一句即可运行（port可以随便改）

streamlit run dataset.py --server.port 2323

支持以下ChatGLM微调项目的格式

主要功能是读取用户写在txt的问题，并通过GPT生成回答，或者用户自行撰写回答，然后保存为微调需要的json文件

首先打开网页，我们可以选择要回答的问题，选定之后填写答案，也可以选择使用GPT的api来流式生成回答，确认并进入下一个问题

如果回答为空的话，就会删掉未保存的对应回答

保存全部回答，可以将回答序列化写入本地文件以便下次读取。

导出Json的话，会将所有已保存回答写到本地而未保存的回答就会忽略。

用代理的同学记得按照左边的端口号修改代码，不用代理请删掉这两行

改这里切换输出json的格式

About

为ChatGLM设计的微调数据集生成工具，速来制作自己的猫娘。

MIT License

Language:Python 100.0%