gumblex / wqxt_pdf

WQXT PDF Downloader

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

“文泉学堂”PDF下载

文泉学堂

  1. 安装 requirements.txt 里的依赖
  2. 找到你要的书,看地址栏的数字为 id
  3. 运行 python3 crawl_wqxt.py <id>

服务器生成图片需要时间,可能出现 not loaded,会稍候重试。若一直出现 not loaded(第二遍还是),请尝试重新运行,已下载的图片不会重新下载。

若需要清理缓存,请删除 wqxt.db 或自行更改其内容(SQLite 数据库)。

若需要登录,请自行在 crawl_wqxt.py 的 HEADERS(36行)里加 Cookie 等内容。

请合理使用服务器资源。版权问题概不负责。

imgautocompress.py 会对下载的图片判断是否为灰度、是否为黑白,并转成相应格式,减少图片大小。

要类似地减少其他扫描版 PDF 文件大小,可以使用 pdfreduce。要添加 OCR 层,可使用 ocrmypdf

About

WQXT PDF Downloader

License:GNU Lesser General Public License v3.0


Languages

Language:Python 100.0%