KittenCN / get_words

AI小说洗文工具

Home Page:https://www.coderfan.com

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

本项目为了方便的从网页提取小说构建

本项目部分功能依托于小说生成软件,有需要的,可以点击试用/购买

目前支持的软件如下:

主要功能 (带*的功能需要依托于小说生成软件才能完全实现)

  • 从网页提取小说
  • 去除所有不必要的标签
  • 去除所有标点符号
  • 控制每行的字数
  • 生成txt小说文件
  • 增加gpt洗文功能,支持第三方gpt
  • 增加Gemini洗文功能
  • *增加自动生成小说草稿功能,可使用生成软件直接导入后出图。
  • 增加洗文后文章分析功能,能找出可能逻辑问题,以便修改
  • 增加自定义代理服务器功能

使用方法

  1. 安装Python3 请移步这里查看详细步骤
    我这里就不赘述了,能找到这个项目的人应该都会安装Python3 请务必安装3.10以上版本!
  2. 下载本项目文件 请点击右上角的绿色按钮,选择Download ZIP,或者使用git clone下载
  3. 安装依赖 在项目文件夹下打开终端(cmd或者shell),输入以下命令
    pip install -r requirements.txt
  4. 执行程序,自动初始化
        python get_words.py
    执行完成后,当前目录下将自动出现config.ini文件,用于配置GPT/Gemini参数, 以及contents文件夹,用于存放需要提取的小说网页 如果初始化失败,请重新下载所有完整的仓库文件

也可使用Releases中的exe文件,跳过上述1-5步骤,如果是非windows系统,请严格按照1-5步骤执行

  1. 配置
    • 在config.ini中配置你的GPT/Gemini参数,格式如下

      ; GPT版本
      ai_gpt_ver=4
      ; 第三方GPT-3 API地址和API Key
      ai_addr=https://api.xxxx.xxx/v1
      ai_api_key=sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
      ; Google API Key
      google_ai_addr=null
      google_ai_api_key=xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
      ; 提示词
      pre_prompts=xxxxxxxxxxxxxxxxxxxxxxxxxx
      sutui_db_addr=C:/Users/XXXX/AppData/Roaming/text2video/book2video/database_v2.sqlite zx_index = "【系统提词】解读正向词助手(升级版)" cj_index = "【系统场景】解读场景词助手(升级版)"

    • 创建contents文件夹,将需要提取的小说网页(html扩展名)保存在contents文件夹下

  2. 运行
    • 在项目文件夹下打开终端,输入以下命令

      python get_words.py
    • 程序会提示当前最新的文件是什么,如果确认,就直接回车;如果不是,输入需要提取的文件名,再回车

      Enter the content name (default: xxxx):

    • 程序会提示选择功能:

      1: pre process html file: (预处理html文件)
      2: process txt file with gpt: (ai 洗文)
      3: test AI: (测试AI) 4: 创建导入脚本

      请务必先预处理html文件,再进行洗文操作;预处理html会自动切断每行的字数,并去除没有必要的标点符号。

    • 如果选择ai洗文,下面系统会提示当前默认的ai是Gemini,如果需要切换使用GPT,请输入y,再回车

      Current AI is: GenMini
      Do you want to switch AI? (y/n):

    • 洗文完成后,会生成相应的txt文件,保存在contents文件夹下, gen为Gemini洗文,gpt为GPT洗文

      Extraction completed, saved to: ./contents/xxxx_gen.txt

About

AI小说洗文工具

https://www.coderfan.com


Languages

Language:Python 94.6%Language:HTML 5.4%