timeahead's starred repositories
365-days-get-xuanwulab-job
Get a job from Xuanwu Lab in 365 days
Pretrained-Language-Model
Pretrained language model and its related optimization techniques developed by Huawei Noah's Ark Lab.
pumpkin-book
《机器学习》(西瓜书)公式详解
awesome-knowledge-graph
整理知识图谱相关学习资料
kgtk-notebooks
Tutorial and hands-on notebook on using the Knowledge Graph Toolkit (KGTK)
nlp_chinese_corpus
大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP
ChainKnowledgeGraph
ChainKnowledgeGraph, 产业链知识图谱包括A股上市公司、行业和产品共3类实体,包括上市公司所属行业关系、行业上级关系、产品上游原材料关系、产品下游产品关系、公司主营产品、产品小类共6大类。 上市公司4,654家,行业511个,产品95,559条、上游材料56,824条,上级行业480条,下游产品390条,产品小类52,937条,所属行业3,946条。
Beijing-House
面向北京码农同胞的从0开始的买房踩盘实录,目标只有一个: 每一分钱都花的明白(持续补充和完善ing…)
cail2019_track2
**法研杯CAIL2019要素抽取任务第三名方案分享
word-discovery
速度更快、效果更好的中文新词发现
trend_ml_toolkit_xgboost
基于xgboost调参、模型训练,以及对各模型之间性能比较进行画图
GeneralNewsExtractor
新闻网页正文通用抽取器 Beta 版.
book-ml-sem
《机器学习:软件工程方法与实现》Method and implementation of machine learning software engineering
BERT-NER-MSRA
A Chinese BERT NER MSRA method
AGAC-Track
wapiti/BiLSTM-CNN_CRF
word-discovery
速度更快、效果更好的中文新词发现
ChineseHomophones
中文谐音词/字库(同音词/字)Chinese Homophones
bert_crf_sequence_annotation
基于Pytorch+BERT+CRF的NLP序列标注模型,目前包括分词,词性标注,命名实体识别等
nlp_tutorial
NLP超强入门指南,包括各任务sota模型汇总(文本分类、文本匹配、序列标注、文本生成、语言模型),以及代码、技巧
meena-chatbot
Google's Meena transformer chatbot implementation
Entity-Matching-Literature
A list of entity resolution and entity alignment papers on the table data and knowledge graph data.