Matthew's repositories
ChineseNlpCorpus
搜集、整理、发布 中文 自然语言处理 语料/数据集,与 有志之士 共同 促进 中文 自然语言处理 的 发展。
conv_arithmetic
A technical report on convolution arithmetic in the context of deep learning
awesome-bots
The most awesome list about bots ⭐️🤖
Awesome-Chinese-NLP
A curated list of resources for Chinese NLP 中文自然语言处理相关资料
awesome-rnn
Recurrent Neural Network - A curated list of resources dedicated to RNN
ChatterBot
ChatterBot is a machine learning, conversational dialog engine for creating chat bots
ChinaMobilePhoneNumberRegex
Regular expressions that match the mobile phone number in mainland China. / 一组匹配**大陆手机号码的正则表达式。
Dialog_Corpus
用于训练中英文对话系统的语料库 Datasets for Training Chatbot System
event_role_aff_pred
This is the dataset of event role level affective prediction.
funNLP
中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量、公司名字大全、古诗词库、IT词库、财经词库、成语词库、地名词库、历史名人词库、诗词词库、医学词库、饮食词库、法律词库、汽车词库、动物词库、中文聊天语料、中文谣言数据、百度中文问答数据集、句子相似度匹配算法集合、bert资源、文本生成&摘要相关工具、cocoNLP信息抽取工具、国内电话号码正则匹配、清华大学XLORE:中英文跨语言百科知识图谱、清华大学人工智能技术系列报告、自然语言生成、NLP太难了系列、自动对联数据及机器人、用户名黑名单列表、罪名法务名词及分类模型、微信公众号语料、cs224n深度学习自然语言处理课程、中文手写汉字识别、中文自然语言处理 语料/数据集、变量命名神器、分词语料库+代码、任务型对话英文数据集、ASR 语音数据集 + 基于深度学习的中文语音识别系统、笑声检测器、Microsoft多语言数字/单位/如日期时间识别包。
HealthyDiet
合理饮食,健康吃出来。
ialp2016_Shared_Task
This paper introduces Aicyber’s system for the Dimensional Sentiment Analysis of Chinese Words in IALP 2016 Shared task
JDDC-Dialog-Solution
2018 JDDC 对话大赛亚军(并列亚军,成绩排第三)
NonparametricKNN
A KNN regressor that gives predictions based on customized loss function.
O2O-Coupon-Usage-Forecast
1st Place Solution for O2O Coupon Usage Forecast
py-corenlp
Python wrapper for Stanford CoreNLP
pytorch-semseg
Semantic Segmentation Architectures Implemented in PyTorch
sentiment_analysis_corpora
Corpora of sentient analysis, including word level, sentence/document level, aspect level and entity level.
seq2seq-couplet
Play couplet with seq2seq model. 用深度学习对对联。
Small-Chinese-Corpus
Some useful Chinese corpus datasets 中文语料小数据
textfilter
敏感词过滤的几种实现+某1w词敏感词库