uuleaf's repositories
AbstractKnowledgeGraph
AbstractKnowledgeGraph, a systematic knowledge graph that concentrate on abstract thing including abstract entity and action. 抽象知识图谱,目前规模50万,支持名词性实体、状态性描述、事件性动作进行抽象。目标于抽象知识,包括抽象实体,抽象动作,抽象事件。基于该知识图谱,可以进行不同层级的实体抽象和动作抽象,这与人类真实高度概括的认知是一致的。
Agriculture_KnowledgeGraph
农业知识图谱(AgriKG):农业领域的信息检索,命名实体识别,关系抽取,智能问答,辅助决策
chinese-gushiwen
中华古诗文数据库和API。包含10000首古文(诗、词、歌、赋以及其它形式的文言文),近4000名作者,10000名句
chinese-poetry
最全中华古诗词数据库, 唐宋两朝近一万四千古诗人, 接近5.5万首唐诗加26万宋诗. 两宋时期1564位词人,21050首词。
chinese-poetry-mysql
基于 chinese-poetry 数据整理的一份 mysql 格式数据
chinese-poetry-npm
《中华古诗词数据》用于前端 & Node.js 相关项目。唐宋两朝近一万四千古诗人,接近5.5万首唐诗加26万宋诗,两宋时期1564位词人,21050首词。
chinese-poetry-zhCN
chinese-poetry [古诗] 简体中文版本
ECommerceCrawlers
实战🐍多种网站、电商数据爬虫🕷。包含🕸:淘宝商品、微信公众号、大众点评、招聘网站、闲鱼、阿里任务、博客园、微博、百度贴吧、豆瓣电影、包图网、全景网、豆瓣音乐、某省药监局、搜狐新闻、机器学习文本采集、fofa资产采集、汽车之家、国家统计局、百度关键词收录数、蜘蛛泛目录、今日头条、豆瓣影评❤️❤️❤️。微信爬虫展示项目:
gitbook-plugin-flowchart-full
Flowchart plugin for gitbook
gitbook-plugin-mathjax-full
Mathjax plugin for gitbook
gitbook-plugin-mermaid-full
Mermaid plugin for gitbook
LawCrimeMining
Law Crime Mining Based on Corpus build and content analysis by NLP methods. 基于领域语料库构建与NLP方法的裁判文书与犯罪案例文本挖掘项目
liebian
微云网址裂变
MedicalNamedEntityRecognition
Medical Named Entity Recognition implement using bi-directional lstm and crf model with char embedding.CCKS2017中文电子病例命名实体识别项目,主要实现使用了基于字向量的四层双向LSTM与CRF模型的网络.该项目提供了原始训练数据样本(一般醒目,出院情况,病史情况,病史特点,诊疗经过)与转换版本,训练脚本,预训练模型,可用于序列标注研究.把玩和PK使用.
MiningZhiDaoQACorpus
ZhiDaoChatCorpus, zhidao QA pairs crawled from Baidu zhidao which contains more than 5,800,000 question and 9,830,000 answers with certain tags。百度知道问答语料库,包括超过580万的问题,938万的答案,5800个分类标签。基于该问答语料库,可支持多种应用,如闲聊问答,逻辑挖掘。
pic_zhanqun
图片站群
poetry
china ancient poetry project data
Poetry-1
非常全的古诗词数据,收录了从先秦到现代的共计85万余首古诗词。
ProductKnowledgeGraph
GoodsKG, a knowledge graph that contains the product-product hierarchy and producer sales goods relationship, which sum up to 1300 products and more than 90000 brands, 基于京东网站的商品上下级概念,商品品牌之间关系,商品描述维度等知识库,基于该知识库可以支持商品属性库构建,商品销售问答,品牌物品生产等知识查询服务,也可用于情感分析等下游应用.
school-data
通过高德API获取全国中小学数据,包括省市区三级数据
seogjc
站群关键词堆叠
WechatSogou
基于搜狗微信搜索的微信公众号爬虫接口
xiaoshuotxt
小说站
yunconglabel
云聪智能标引平台
yuyiqian.github.io
我是句子迷