superB (hexixiang)

hexixiang

Geek Repo

Github PK Tool:Github PK Tool

superB's repositories

dataharvest

DataHarvest 是一个专为构建大型语言模型数据集而设计的工具集。它提供了一系列的数据获取、清洗和处理的pipeline,旨在为中文大模型提供高质量的训练数据。

Language:PythonStargazers:2Issues:0Issues:0
Stargazers:0Issues:0Issues:0
Language:PythonLicense:Apache-2.0Stargazers:0Issues:0Issues:0