minglei's repositories
support.996.ICU
Microsoft and GitHub Workers Support 996.ICU
Synonyms
中文近义词工具包
Chinese-Names-Corpus
中文人名语料库。中文姓名,姓氏,名字,称呼,日本人名,翻译人名,英文人名。成语词典。
Company-Names-Corpus
公司名语料库。机构名语料库。公司简称,缩写,品牌词,企业名。
chinese-poetry
最全中华古诗词数据库, 唐宋两朝近一万四千古诗人, 接近5.5万首唐诗加26万宋诗. 两宋时期1564位词人,21050首词。
RandomData
随机生成各种需要使用到的数据(如:身份证号码,姓名,手机号码等)
HarvestText
领域自适应文本挖掘工具(新词发现、情感分析、实体链接等),基于少量种子词和背景知识
hardNLU
NLU is hard!!!
id-number-util
使用Python随机生成身份证号码及校验,识别,扫描
funNLP
中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量、公司名字大全、古诗词库、IT词库、财经词库、成语词库、地名词库、历史名人词库、诗词词库、医学词库、饮食词库、法律词库、汽车词库、动物词库、中文聊天语料、中文谣言数据、百度中文问答数据集、句子相似度匹配算法集合、bert资源、文本生成&摘要相关工具、cocoNLP信息抽取工具
music163-spiders
网易云音乐歌曲评论爬虫
NeteaseCloudMusicApi
网易云音乐 Node.js API service
python-data-science-cheatsheet
Python数据科学速查表
ZhihuDailyPurify
Purified version of Zhihu Daily - 更纯净的知乎日报
sensitive
敏感词查找,验证,过滤和替换 🤓 FindAll, Validate, Filter and Replace words.
attribute_charge
The source code of our COLING'18 paper "Few-Shot Charge Prediction with Discriminative Legal Attributes".
python_for_data_analysis_2nd_chinese_version
《利用Python进行数据分析·第2版》
xpinyin
translate chinese hanzi to pinyin by python
SecuritySite
收集了一些安全公司的博客
DesktopNaotu
桌面版脑图(百度脑图离线版,思维导图工具)开箱即用,跨平台支持 Windows/Linux/Mac OS
pyecharts
🎨 Python Echarts Plotting Library
WechatSogou
基于搜狗微信搜索的微信公众号爬虫接口
high-speed-downloader
百度网盘不限速下载 支持Windows和Mac 2018年1月16日更新
mygitbook
gitbook
fljk
法律即可
pydata-book
Materials and IPython notebooks for "Python for Data Analysis" by Wes McKinney, published by O'Reilly Media
awesome-spider
爬虫集合
opensource
【编程随想】收藏的开源项目清单