Tao Wang's starred repositories
text-classification-cn
中文文本分类实践,基于搜狗新闻语料库,采用传统机器学习方法以及预训练模型等方法
Awesome-Chinese-NLP
A curated list of resources for Chinese NLP 中文自然语言处理相关资料
nlp_chinese_corpus
大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP
WanJuan1.0
万卷1.0多模态语料
All_Dictionaries
宇宙最全在线词典网站导航
SikuBERT-for-digital-humanities-and-classical-Chinese-information-processing
SikuBERT:四库全书的预训练语言模型(四库BERT) Pre-training Model of Siku Quanshu
Chinese-LlaMA2
Repo for adapting Meta LlaMA2 in Chinese! META最新发布的LlaMA2的汉化版! (完全开源可商用)
Llama-Chinese
Llama中文社区,Llama3在线体验和微调模型已开放,实时汇总最新Llama3学习资料,已将所有代码更新适配Llama3,构建最好的中文Llama大模型,完全开源可商用
Fengshenbang-LM
Fengshenbang-LM(封神榜大模型)是IDEA研究院认知计算与自然语言研究中心主导的大模型开源体系,成为中文AIGC和认知智能的基础设施。
Awesome-Chinese-LLM
整理开源的中文大语言模型,以规模较小、可私有化部署、训练成本较低的模型为主,包括底座模型,垂直领域微调及应用,数据集与教程等。
sentence-transformers
Multilingual Sentence & Image Embeddings with BERT