Veeei's starred repositories
longformer
Longformer: The Long-Document Transformer
DL_EventExtractionPapers
2015年以来基于深度学习方法的事件抽取论文整理
Chinese-Tokenization
利用传统方法(N-gram,HMM等)、神经网络方法(CNN,LSTM等)和预训练方法(Bert等)的中文分词任务实现【The word segmentation task is realized by using traditional methods (n-gram, HMM, etc.), neural network methods (CNN, LSTM, etc.) and pre training methods (Bert, etc.)】
edge-oriented-graph
Source code for the EMNLP 2019 paper: "Connecting the Dots: Document-level Relation Extraction with Edge-oriented Graphs"
Text2Event
Text2Event: Controllable Sequence-to-Structure Generation for End-to-end Event Extraction
insuranceqa-corpus-zh
:helicopter: 保险行业语料库,聊天机器人
nlp-notebook
NLP 领域常见任务的实现,包括新词发现、以及基于pytorch的词向量、中文文本分类、实体识别、摘要文本生成、句子相似度判断、三元组抽取、预训练模型等。
KnowledgeGraphCourse
东南大学《知识图谱》研究生课程
ngramUsingNLTK
Calculate ngram for given dataset consisting of some sentences.
Bert-Chinese-Text-Classification-Pytorch
使用Bert,ERNIE,进行中文文本分类
TOP250movie_douban
TOP250豆瓣电影短评:Scrapy 爬虫+数据清理/分析+构建中文文本情感分析模型
TextInfoExp
自然语言处理实验(sougou数据集),TF-IDF,文本分类、聚类、词向量、情感识别、关系抽取等
CLUEDatasetSearch
搜索所有中文NLP数据集,附常用英文NLP数据集
nlg-yongzhuo
中文文本生成(NLG)之文本摘要(text summarization)工具包, 语料数据(corpus data), 抽取式摘要 Extractive text summary of Lead3、keyword、textrank、text teaser、word significance、LDA、LSI、NMF。(graph,feature,topic model,summarize tool or tookit)
TPlinker-ycy
Tplinker注释,中文数据集适配版本