LC1332 / CamelBell-Chinese-LoRA

CamelBell(驼铃) is be a Chinese Language Tuning project based on LoRA. CamelBell is belongs to Project Luotuo(骆驼), an open sourced Chinese-LLM project created by 冷子昂 @ 商汤科技 & 陈启源 @ 华中师范大学 & 李鲁鲁 @ 商汤科技

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

训练数据集预处理问题

yungangwu opened this issue · comments

作者好,我看到你们采用了一个80个问答的数据集来训练LoRa权重,想问下你们这个文本数据集是自己手动构建的吗?如果我有一个中文的文本,如何将其快速的构建成这样一个标准数据集呢?