Zessay / novel_analysis

The codes used to analysis novel and comic

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

用来分析小说和漫画的代码

注:bookspider文件夹目前暂时对于主程序没有影响,可忽略。

安装说明

安装环境

Python环境

python版本>=3.7

建议在conda环境下新建一个环境(比如名字可以是novel),然后再安装requirements.txt中相关的python包

安装pyhanlp说明

先执行 conda install -c conda-forge jpype1==0.7.0,再执行pip install pyhanlp

Java环境

安装jdk-1.8并设置JAVA_HOME环境变量

前端环境(可选)

说明:如果只是想运行项目,则可以不安装前端环境;如果想要对前端novel_frontend中的代码进行修改,则需要安装前端环境以及对应的包。

安装node.js

配置Vue相关工具

(1)安装vue-cli用来创建脚手架

npm install -g vue-cli

创建Vue项目的方法:vue init webpack 项目名

(2)安装必要的工具包

# 安装element-ui
npm i element-ui -S

# 安装axios用于前后端分离
npm install --save axios

代码说明

识别人名

目前识别人名使用的是pyhanlp中识别人名的模型,需要安装jdk环境,具体参考pyhanlp安装说明

运行包含前端的整个项目

该项目是一个前后端分离的系统,前端基于vue.js,后端基于flask。如果想要直接运行带前端的项目,则:

  • 在命令行进入当前目录;
  • 激活之前安装了包的python环境;
  • flask run即可。

windows运行脚本实例

python run_process_outline.py --source_dir="D:\学习\实验室\网络小说信息抽取\【AI识别打标资料】作品大纲或脚本等文字资料(1月15)" --file_name="《极品战兵》大纲.docx" --w2v_file="D:\BaiduNetdiskDownload\sgns.literature.word.bz2" --to_dir="D:\学习" --to_file="小说标签.xlsx"

linux运行脚本

  • 首先需要修改run_outline2label.sh中词向量、输入和输出文件夹以及文件等参数;
  • 然后sh run_outline2label.sh

About

The codes used to analysis novel and comic


Languages

Language:Python 91.5%Language:JavaScript 5.8%Language:Vue 2.6%Language:HTML 0.1%Language:Shell 0.1%