杜杜里's starred repositories
CLUEPretrainedModels
高质量中文预训练模型集合:最先进大模型、最快小模型、相似度专门模型
FQA-question-answer
基于深度学习的FAQ式问答系统
nlp_paper_study_qa
仓库主要记录 NLP 算法工程师相关的顶会论文研读笔记【问答篇】
ChineseEmbedding
Chinese Embedding collection incling token ,postag ,pinyin,dependency,word embedding.中文自然语言处理向量合集,包括字向量,拼音向量,词向量,词性向量,依存关系向量.共5种类型的向量
CoSENT_Pytorch
CoSENT、STS、SentenceBERT
Chinese-Word-Vectors
100+ Chinese Word Vectors 上百种预训练中文词向量
sharpened-cosine-similarity
An alternative to convolution in neural networks
atec2018-nlp
2018年蚂蚁金服金融大脑赛题分享
Chinese-BERT-wwm
Pre-Training with Whole Word Masking for Chinese BERT(中文BERT-wwm系列模型)
roberta_zh
RoBERTa中文预训练模型: RoBERTa for Chinese
ChatGLM-6B
ChatGLM-6B: An Open Bilingual Dialogue Language Model | 开源双语对话语言模型
ShortTextMatching
基于lucene全文检索引擎实现的短文本匹配系统
RoFormer_pytorch
RoFormer V1 & V2 pytorch
CLUEDatasetSearch
搜索所有中文NLP数据集,附常用英文NLP数据集
CLUECorpus2020
Large-scale Pre-training Corpus for Chinese 100G 中文预训练语料
nCoV-2019-sentence-similarity
天池-新冠疫情相似句对判定大赛 Rank8
epidemic-sentence-pair
天池 疫情相似句对判定大赛 线上第一名方案
kkndme_tianya
天涯 kkndme 神贴聊房价
text_matching
常用文本匹配模型tf版本,数据集为QA_corpus,持续更新中
deep_text_matching
implementation several deep text match (text similarly) models for keras . cdssm, arc-ii,match_pyramid, mvlstm ,esim, drcn ,bimpm, bert, albert, raberta
nlp-basictasks
A simple framework for building some basic NLP tasks
SimCSE-Pytorch
中文数据集下SimCSE+ESimCSE的实现
chinese_sentence_embeddings
bert_avg,bert_whitening,sbert,consert,simcse,esimcse 中文句向量表示