liutianling's repositories
CLUEDatasetSearch
搜索所有中文NLP数据集,附常用英文NLP数据集
ner-english
:computer: 英文命名实体识别(NER)的研究
AttentionOCR
Scene text recognition
CRAFT-pytorch
Official implementation of Character Region Awareness for Text Detection (CRAFT)
CRNN-ATTENTION
crnn feature net + attention 机制
Data-Competition-TopSolution
Data competition Top Solution 数据竞赛top解决方案开源整理
Deep-learning-books
Books for machine learning, deep learning, math, NLP, CV, RL, etc. 一些机器学习、深度学习等相关话题的书籍。
entity-recognition-datasets
A collection of corpora for named entity recognition (NER) and entity recognition tasks. These annotated datasets cover a variety of languages, domains and entity types.
HotNewsAnalysis
利用文本挖掘技术进行新闻热点关注问题分析
ICDAR2019-ArT-Recognition-Alchemy
PKU Team Zero's code for participation in ICDAR2019 ArT Recognition track (Champion)
Information-Extraction-Chinese
Chinese Named Entity Recognition with IDCNN/biLSTM+CRF, and Relation Extraction with biGRU+2ATT 中文实体识别与关系提取
Keyword_Extraction
神策杯2018高校算法大师赛(中文关键词提取)第二名代码方案
ML-NLP
此项目是机器学习(Machine Learning)、深度学习(Deep Learning)、NLP面试中常考到的知识点和代码实现,也是作为一个算法工程师必会的理论基础知识。
nlp-public-dataset
Chinese, English NER, English-Chinese machine translation dataset. 中英文实体识别数据集,中英文机器翻译数据集, 中文分词数据集
PytorchOCR
基于Pytorch的OCR工具库,支持常用的文字检测和识别算法
Semantic-Role-Labeling
使用LSTM进行端到端的语义角色标注(theano)
sentence-transformers
Sentence Embeddings with BERT & XLNet
single-pass-clustering-for-chinese-text
针对中文的话题(主题)聚类,采用single pass聚类算法
songs_recommendation
基于语义信息和行为信息的歌曲推荐。包括歌曲信息爬取、数据处理、word2vec歌曲向量表示、数据存储、歌曲推荐、web可视化展示。(Python、Java)
tensorflow_practice
tensorflow实战练习,包括强化学习、推荐系统、nlp等
text_matching
常用文本匹配模型tf版本,数据集为QA_corpus,持续更新中
textClassifier
tensorflow implementation