Zqqqq's starred repositories
HowToLiveLonger
程序员延寿指南 | A programmer's guide to live longer
awesome-python-cn
Python资源大全中文版,包括:Web框架、网络爬虫、模板引擎、数据库、数据可视化、图片处理等,由「开源前哨」和「Python开发者」微信公号团队维护更新。
Chinese-LLaMA-Alpaca
中文LLaMA&Alpaca大语言模型+本地CPU/GPU训练部署 (Chinese LLaMA & Alpaca LLMs)
GPT2-Chinese
Chinese version of GPT2 training code, using BERT tokenizer.
pycorrector
pycorrector is a toolkit for text error correction. 文本纠错,实现了Kenlm,T5,MacBERT,ChatGLM3,LLaMA等模型应用在纠错场景,开箱即用。
reading-code-of-nginx-1.9.2
nginx-1.9.2源码通读分析注释,带详尽函数中文分析注释以及相关函数流程调用注释,最全面的nginx源码阅读分析中文注释,更新完毕
Awesome-ChatGPT
ChatGPT资料汇总学习,持续更新......
prompt-patterns
Prompt 编写模式:如何将思维框架赋予机器,以设计模式的形式来思考 prompt
JittorLLMs
计图大模型推理库,具有高性能、配置要求低、中文支持好、可移植等特点
developer-roadmap
developer-roadmap
entity-recognition-datasets
A collection of corpora for named entity recognition (NER) and entity recognition tasks. These annotated datasets cover a variety of languages, domains and entity types.
NLP_pytorch_project
Embedding, NMT, Text_Classification, Text_Generation, NER etc.
hanzi_chaizi
汉字拆字库,可以将汉字拆解成偏旁部首,在机器学习中作为汉字的字形特征
PersonGraphDataSet
PersonGraphDataSet, nearly 10 thousand person2person relationship facts。 人物图谱数据集,近十万的人物关系图谱事实数据库,通过人物关系抽取算法抽取+人工整理得出,可用于人物关系搜索、查询、人物关系多跳问答,以及人物关系推理等场景提供基础数据。
ss_on_decoding_steps.
codes for "Scheduled Sampling Based on Decoding Steps for Neural Machine Translation" (long paper of EMNLP-2022)