船舶知识图谱

前置依赖

【kg_building/code/main】运行buildSpecFromRawText.py。基于规范文本(ship_text.txt)解析，生成规范原文.json（包含条目和规范正文）；
【kg_building/code/main】运行extract_main.py。基于规范原文.json，进行知识图谱识别，识别出其中的实体和三元组关系，生成knowledge_triple.json；
【kg_building/code/main】运行filter.py。基于词典库(resource/lexicon.csv)，对knowledge_triple.json进行过滤，把不包含在词典库的关系过滤掉，生成新的lexicon.json；
【kg_building/code/main】运行filter_repeat.py去除lexicon.json中的重复内容，生成lexicon.json；
【kg_building/code/main】运行renew_spec.py。基于规范原文.json和lexicon.json，一个句子可能对应多个三元组，重新梳理，使每个句子的三元组的实体词汇都对应到相应句子中（用于网站标红），生成spec.json；
【neo4jGraph】运行write2neo4j.py。将lexicon.json输入到neo4j，进行知识图谱存储和生成知识图谱（有向的，write2neo4j(undir).py是生成无向图的，即双向的）；
【kg_django】搭建的网站，是基于在neo4j存储的知识图谱（用于知识图谱关键词搜索、路径查询及整体的显示）和spec.json（用于规范原文信息以及标红的显示）。