moshilangzi's repositories
nlp-journey
NLP 相关的一些文档、论文及代码, 包括主题模型(Topic Model)、词向量(Word Embedding)、命名实体识别(Named Entity Recognition)、文本分类(Text Classificatin)、文本生成(Text Generation)、文本相似性(Text Similarity)计算、机器翻译(Machine Translation)等,涉及到各种与nlp相关的算法,基于keras和tensorflow。
assister
Private Open General Assistant Platform
Automatic-generation-of-text-summaries
使用两种方法(抽取式Textrank和概要式seq2seq)自动提取文本摘要
avbook
AV 电影管理系统, avmoo , javbus , javlibrary 爬虫,线上 AV 影片图书馆,AV 磁力链接数据库,Japanese Adult Video Library,Adult Video Magnet Links - Japanese Adult Video Database
BERT-BiLSTM-CRF-NER
Tensorflow solution of NER task Using BiLSTM-CRF model with Google BERT Fine-tuning And private Server services
Chinese-Text-Classification-Pytorch
中文文本分类,TextCNN,TextRNN,FastText,TextRCNN,BiLSTM_Attention,DPCNN,Transformer,基于pytorch,开箱即用。
CLUEDatasetSearch
搜索所有中文NLP数据集,附常用英文NLP数据集
coding_interviews
《剑指Offer》题目汇总&常考题总结(Python实现)
course-nlp
A Code-First Introduction to NLP course
Customer_Satisfaction_Analysis
基于在线民宿UGC数据的意见挖掘项目,包含数据挖掘和NLP相关的处理,负责数据采集、主题抽取、情感分析等任务。开发的目的是克服用户打分和评论不一致,实时对重庆地区在线民宿的满意度进行评测,使用Python实现了在线评论采集和情感可视化分析。搭建了百度地图POI查询入口,可以进行自动化的批量查询POI信息的功能;构建了基于在线民宿语料的Word2vec主题聚类模型,利用主题中心词能找出对应的主题属性字典;以用户打分作为标注,然后通过实验贝叶斯、SVM、决策树等多种分类模型,最后选用贝叶斯模型进行情感分析,将情感分类概率分布作为情感趋势,最后通过POI热力图的方式对不同地域的民宿满意度进行展示。软件版本请见链接。
data_mining_models
Basic data mining model, including feature importance display
DjangoBlog
😱一款基于Django和Boostrap框架的个人博客网站源码
FastBERT
对ACL2020 FastBERT论文的复现,论文地址:https://arxiv.org/pdf/2004.02178.pdf
google-research
Google Research
Jiagu
Jiagu深度学习自然语言处理工具 知识图谱关系抽取 中文分词 词性标注 命名实体识别 情感分析 新词发现 关键词 文本摘要 文本聚类
KBQA-BERT
基于知识图谱的问答系统,BERT做命名实体识别和句子相似度,分为online和outline模式
KnowledgeGraphData
史上最大规模1.4亿中文知识图谱开源下载
machine_learning_beginner
机器学习初学者公众号作品
MatchZoo
Facilitating the design, comparison and sharing of deep text matching models.
ML-NLP
此项目是机器学习(Machine Learning)、深度学习(Deep Learning)、NLP面试中常考到的知识点和代码实现,也是作为一个算法工程师必会的理论基础知识。
papers
机器学习,深度学习,自然语言处理方面的顶级期刊会议论文
python_data_structures_and_algorithms
Python 中文数据结构和算法教程
Real_Time_DataMining_Sortware
一款能实时进行文本挖掘的软件,包含数据的实时采集/数据清洗/结构化保存/UGC数据主题提取/情感分析/后结构化可视化等技术的综合性演示Demo。基于在线民宿UGC数据的意见挖掘项目,包含数据挖掘和NLP相关的处理,负责数据采集、主题抽取、情感分析等任务。主要克服用户打分和评论不一致,实时对携程和美团在线民宿的满意度进行评测以及对额外数据进行可视化的综合性工具,多维度的对在线UGC进行数据挖掘并可视化,demo演示见链接。
sentiment_analysis
一个基于LSTM,TextCNN,fasttext实现的购物网站评论情感分析(文本分类),使用tf_serving和flask部署模型