bitallin's repositories
BMInf
Low-cost Inference Package for Big Pretrained Language Models (PLMs)
pinyin-data
汉字拼音数据
nlp-fluency
评估自然语言的流畅度
UER-py
Open Source Pre-training Model Framework in PyTorch & Pre-trained Model Zoo
Synonyms
:herb: 中文近义词:聊天机器人,智能问答工具包
SimpleChinese2
SimpleChinese2 集成了包括拼音汉字转换、近义词、繁简转换等在内的许多基本的中文自然语言处理功能,使基于 Python 的中文文字处理和信息提取变得简单方便。
GNNPapers
Must-read papers on graph neural networks (GNN)
NLPer-Arsenal
收录NLP相关竞赛经验贴(当前赛事、往期赛事、训练赛)、NLP会议时间、常用自媒体、GPU推荐等,持续更新中
talib-document
talib学习 talib中文翻译 talib中文文档
CLUECorpus2020
Large-scale Pre-training Corpus for Chinese 100G 中文预训练语料
ReaLiSe
A Multi-modal Model Chinese Spell Checker Released on ACL2021.
social-media-chinese-words
社交媒体中文词库。 涵盖社交媒体领域特有的专有名词和新词。
Text-Cluster
Text cluster
pytorch-multi-class-focal-loss
A simple pytorch implementation for multi-class focal loss
d2l-zh
《动手学深度学习》:面向中文读者、能运行、可讨论。中英文版被全球175所大学采用教学。
xmnlp
xmnlp:提供中文分词, 词性标注, 命名体识别,情感分析,文本纠错,文本转拼音,文本摘要,偏旁部首等功能
SunLP
SunLP: NLP、分词、序列标注、文本分类、关系抽取、新词发现、文本生成
nlp-public-dataset
Chinese, English NER, English-Chinese machine translation dataset. 中英文实体识别数据集,中英文机器翻译数据集, 中文分词数据集
Github-DNS
通过配置DNS,解决github访问慢,github图片打不开等问题
NLP_pytorch_project
Embedding, NMT, Text_Classification, Text_Generation, NER etc.
zh-NER-TF
A very simple BiLSTM-CRF model for Chinese Named Entity Recognition 中文命名实体识别 (TensorFlow)
awesome-nlp-sentiment-analysis
:book: 收集NLP领域相关的数据集、论文、开源实现,尤其是情感分析、情绪原因识别、评价对象和评价词抽取方面。
pycorrector
pycorrector is a toolkit for text error correction. It was developed to facilitate the designing, comparing, and sharing of deep text error correction models.
albert_zh
A LITE BERT FOR SELF-SUPERVISED LEARNING OF LANGUAGE REPRESENTATIONS, 海量中文预训练ALBERT模型
auto-argparse
Automatically create argparse parsers.
fucking-algorithm
刷算法全靠套路,认准 labuladong 就够了!English version supported! Crack LeetCode, not only how, but also why.
CppForDataStructure
CppForDataStructure