zqqqqq1

Firefly: 大模型训练工具，支持训练Qwen2、Yi1.5、Phi-3、Llama3、Gemma、MiniCPM、Yi、Deepseek、Orion、Xverse、Mixtral-8x7B、Zephyr、Mistral、Baichuan2、Llma2、Llama、Qwen、Baichuan、ChatGLM2、InternLM、Ziya2、Vicuna、Bloom等大模型

Language:Python5495 54 273

reading-code-of-nginx-1.9.2

nginx-1.9.2源码通读分析注释，带详尽函数中文分析注释以及相关函数流程调用注释，最全面的nginx源码阅读分析中文注释，更新完毕

Language:CGPL-3.04135 246 7

Awesome-ChatGPT

ChatGPT资料汇总学习，持续更新......

4043 79 4

prompt-patterns

Prompt 编写模式：如何将思维框架赋予机器，以设计模式的形式来思考 prompt

2901 21 5

DecryptPrompt

总结Prompt&LLM论文，开源数据&模型，AIGC应用

2499 54 2

JittorLLMs

计图大模型推理库，具有高性能、配置要求低、中文支持好、可移植等特点

Language:PythonApache-2.02339 28 180

statistic

collecting books, papers and docs.

2187 85 7

FindTheChatGPTer

ChatGPT爆火，开启了通往AGI的关键一步，本项目旨在汇总那些ChatGPT的开源平替们，包括文本大模型、多模态大模型等，为大家提供一些便利

2013 56 7

AlgoNotes

【浅梦学习笔记】文章汇总:包含排序&CXR预估，召回匹配，用户画像&特征工程，推荐搜索综合计算广告，大数据，图算法，NLP&CV，求职面试等内容

1550 310

WebCPM

Official codes for ACL 2023 paper "WebCPM: Interactive Web Search for Chinese Long-form Question Answering"

Language:HTMLApache-2.0969 24 26

R-Drop

Language:Python863 5 32

AGIEval

Language:PythonMIT674 9 27

awesome-chinese-ner

中文命名实体识别。包含目前最新的中文命名实体识别论文、中文实体识别相关工具、数据集，以及中文预训练模型、词向量、实体识别综述等。

569 30

libai

LiBai(李白): A Toolbox for Large-Scale Distributed Parallel Training

Language:PythonApache-2.0384 42 79

hanzi_chaizi

汉字拆字库，可以将汉字拆解成偏旁部首，在机器学习中作为汉字的字形特征

Language:PythonApache-2.0320 4 9

PersonGraphDataSet

PersonGraphDataSet, nearly 10 thousand person2person relationship facts。人物图谱数据集，近十万的人物关系图谱事实数据库，通过人物关系抽取算法抽取+人工整理得出，可用于人物关系搜索、查询、人物关系多跳问答，以及人物关系推理等场景提供基础数据。

231 11 3

ss_on_decoding_steps.

codes for "Scheduled Sampling Based on Decoding Steps for Neural Machine Translation" (long paper of EMNLP-2022)

Language:Python19 2 1

Awesome-APIKeyan

Language:Python4 1 1