yz-liu's repositories
aigc
《构筑大语言模型应用:应用开发与架构设计》一本关于 LLM 在真实世界应用的开源电子书,介绍了大语言模型的基础知识和应用,以及如何构建自己的模型。其中包括Prompt的编写、开发和管理,探索最好的大语言模型能带来什么,以及LLM应用开发的模式和架构设计。
Awesome-Chinese-LLM
整理开源的中文大语言模型,以规模较小、可私有化部署、训练成本较低的模型为主,包括底座模型,垂直领域微调及应用,数据集与教程等。
chatgpt-corpus
ChatGPT 中文语料库 对话语料 小说语料 客服语料 用于训练大模型
codon
Codon:高性能Python编译器,可将Python代码编译成本机代码,无需任何运行时开销。单线程对Python的典型加速10-100倍或更多,其的性能通常与C/C + +相当(有时甚至更好)A high-performance, zero-overhead, extensible Python compiler using LLVM
ColossalAI
Colosse-AI开源方案发布:快速复制 ChatGPT训练过程Making big AI models cheaper, easier, and more scalable
CPM-1-Generate
Chinese Pre-Trained Language Models (CPM-LM) Version-I
cupy
NumPy & SciPy for GPU
DB-GPT
DB-GPT: 用私有化LLM技术定义数据库下一代交互方式
Deductive-MWP
解数学应用题
DeepSpeedExamples
Example models using DeepSpeed
FasterTransformer
Transformer related optimization, including BERT, GPT
Fengshenbang-LM
Fengshenbang-LM(封神榜大模型)是IDEA研究院认知计算与自然语言研究中心主导的大模型开源体系,成为中文AIGC和认知智能的基础设施。
flashlight
flashlight:快速、灵活的C++机器学习库,由Facebook AI研究语音团队及Torch和Deep Speech的创作者用C++编写
kogito
kogito:Python的NLP常识推理工具A Python Knowledge Inference Toolkit
LangChain-Chinese-Getting-Started-Guide
LangChain 的中文入门教程
langchainzh
langchain中文网是langchain的中文文档
lightseq
LightSeq: A High Performance Library for Sequence Processing and Generation
milvus
向量数据库:A cloud-native vector database, storage for next generation AI applications
modelscope
ModelScope is committed to empowering a wide-spectrum of developers to leverage AI models from various domains. (致力于通过开放的社区合作,开源AI模型以及相关创新技术,推动基于模型即服务的生态繁荣发展。)
Modern-CMake-zh_CN
著名 CMake 教程的简体中文翻译,中文版 Gitbook :https://modern-cmake-cn.github.io/Modern-CMake-zh_CN/ Chinese(simplified) translation of famous cmake tutorial Modern CMake. GitHub Pages : https://modern-cmake-cn.github.io/Modern-CMake-zh_CN/
NLP-Interview-Notes
该仓库主要记录 NLP 算法工程师相关的面试题
openmlsys-zh
机器学习系统:设计和实现《Machine Learning Systems: Design and Implementation》- Chinese Version
PromptCLUE
PromptCLUE, 全中文任务支持零样本学习模型
PyCIL
类别增量学习 PyCIL: A Python Toolbox for Class-Incremental Learning
T2Ranking
T2Ranking由超过 30 万的真实查询和 200 万的互联网段落构成,并且包含了由专业标注人员提供的 4 级细粒度相关性标注。A large-scale Chinese benchmark for passage ranking.
the-algorithm
推特开源推荐代码Source code for Twitter's Recommendation Algorithm
the-algorithm-ml
推特开源推荐代码Source code for Twitter's Recommendation Algorithm
torchscale
Transformers at any scaleorchScale 是一个 PyTorch 库,允许科研和开发人员更高效地训练 Transformer 大模型。同时,它有效地提升了建模的性能和通用性,提高了 Transformer 的稳定性和训练效率
transformers_tasks
该项目集成了基于 transformers 库实现的多种 NLP 任务 NLP Algorithms with transformers lib. Supporting Text-Classification, Text-Generation, Information-Extraction, Text-Matching, RLHF etc.
waitress
高性能跨平台基于python的服务器 Waitress - A WSGI server for Python 3