dongdongyu / awesome-knowledge-graph

整理知识图谱相关学习资料

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

awesome-knowledge-graph

整理知识图谱相关学习资料,提供系统化的知识图谱学习路径。


目录

理论及论文

图谱及数据集

开放知识图谱

中文开放知识图谱(OpenKG.CN)

中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用,包括了众多的数据集以及工具。

领域知识图谱

学术知识图谱AceKG

最新发布的Acemap知识图谱(AceKG)描述了超过1亿个学术实体、22亿条三元组信息,涵盖了全面的学术信息。具体而言,AceKG包含了61,704,089篇paper、52,498,428位学者、50,233个研究领域、19,843个学术研究机构、22,744个学术期刊、1,278个学术会议以及3个学术联盟(如C9联盟)。

同时,AceKG也为每个实体提供了丰富的属性信息,在网络拓扑结构的基础上加上语义信息,旨在为众多学术大数据挖掘项目提供全面支持。

数据集

SQuAD

YAGO

YAGO是由德国马普研究所研制的链接数据库。YAGO主要集成了Wikipedia、WordNet和GeoNames三个来源的数据。YAGO将WordNet的词汇定义与Wikipedia的分类体系进行了融合集成,使得YAGO具有更加丰富的实体分类体系。YAGO还考虑了时间和空间知识,为很多知识条目增加了时间和空间维度的属性描述。目前,YAGO包含1.2亿条三元组知识。YAGO是IBM Watson的后端知识库之一。由于完成的YAGO数据集过于庞大,在使用过程中经常会选取其中一部分进行,比如可以抽取中带有时间注释(time annotations)的部分形成YAGO11k数据集。

WikiData

WikiData的目标是构建一个免费开放、多语言、任何人或机器都可以编辑修改的大规模链接知识库。WikiData由维基百科于2012年启动,早期得到微软联合创始人Paul Allen、Gordon Betty Moore基金会以及Google的联合资助。WikiData继承了Wikipedia的众包协作的机制,但与Wikipedia不同,WikiData支持的是以三元组为基础的知识条目(Items)的自由编辑。一个三元组代表一个关于该条目的陈述(Statements)。

NLPCC 2017 KBQA

该任务来自NLPCC 2017评测任务,开放域问答评价任务主要包括三项子任务,基于知识库的问答(kbqa),基于文档的问答(dbqa),和基于表的问答(tbqa)。kbqa的任务是基于知识库的中文问题回答。dbqa的任务是通过选择一个或多个句子从一个给定的文档,作为答案回答中文问题。tbqa的任务是一个全新的QA任务,旨在通过从收集的表格中抽取一个或多个表回答英语问题。

下载链接

工具

根据知识图谱的通用基本构建流程为依据,每个阶段都整理部分工具。

知识建模

知识抽取

Deepdive

DeepDive是

知识推理

知识表示

OpenKE

清华大学NLP实验室基于TensorFlow开发的知识嵌入平台,实现了大部分知识表示学习方法。

知识融合

白皮书及报告

机构及人物

本部分介绍在知识图谱领域前沿研究或者有一定影响力的机构以及个人。

机构

人物

视频课程

小象学院知识图谱课程

贪心学院知识图谱课程

炼数成金知识图谱课程

CSDN视频课

会议及讲座

专栏合集

知乎集合

简书集合

评测竞赛

会议交流

AICon

BDTC

其他

项目案例

教育领域知识图谱

金融领域知识图谱

利用网络上公开的数据构建一个小型的证券知识图谱/知识库

医疗领域知识图谱

农业领域知识图谱

使用爬虫获取Wikidata数据构建

佛学知识图谱

知识工程领域知识图谱

About

整理知识图谱相关学习资料