henson / DouBan-KGQA

豆瓣书籍,电影类别的知识图谱问答系统

Home Page:https://weizhixiaoyi.com/archives/380.html

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

本项目构建了完整的基于豆瓣电影、书籍的知识图谱问答系统,包括从豆瓣原始数据的爬取豆瓣原始数据转换得到RDF数据三元组数据的存储与检索问句理解和答案推理微信公众号部署等环节,在此分享给大家,共同学习。为帮助理解,可参考以下文章进行实现知识图谱问答系统,文章已更新完成。

  1. 电影知识图谱问答(一)|爬取豆瓣电影与书籍详细信息
  2. 电影知识图谱问答(二)|生成298万条RDF三元组数据
  3. 电影知识图谱问答(三)|Apache Jena知识存储及SPARQL知识检索
  4. 电影知识图谱问答(四)| 问句理解及答案推理
  5. 电影知识图谱问答(五)| BM-KGQA Demo

要求: Ubuntu or MacOS, python3.6, [jieba, refo, SPARQLWrapper, web]依赖包

使用方法

1.下载数据

因数据文件过大,所以将文件放到百度云,链接: https://pan.baidu.com/s/1bKIrrzoezuAQf-EK5ISG_Q 提取码: prcq。下载完成后放入到data/文件夹内即可。

2. 修改配置文件路径

修改DouBan-KGQA/json2jena/rdf2jena/apache-jena-fuseki-3.10.0.2/run/configuration/fuseki_conf.ttl中ja:rulesFrom和tdb:location路径地址。

3.启动Apache Server

进入到DouBan-KGQA/json2jena/rdf2jena/apache-jena-fuseki-3.10.0.2/路径下,启动fuseki-server。

cd DouBan-KGQA/json2jena/rdf2jena/apache-jena-fuseki-3.10.0.2/ 
./fuseki-server

4.启动query_main.py

启动query_main.py进行知识图谱问答。

python query_main.py

About

豆瓣书籍,电影类别的知识图谱问答系统

https://weizhixiaoyi.com/archives/380.html


Languages

Language:Python 62.9%Language:HTML 10.0%Language:Ruby 8.2%Language:JavaScript 7.6%Language:Shell 6.5%Language:TSQL 1.7%Language:CSS 1.3%Language:Batchfile 1.0%Language:Smarty 0.6%Language:XSLT 0.2%