FuryMartin / GetPeoplesDailyPDF

获取人民日报每天的PDF文件并进行合并

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

获取人民日报PDF

0. 声明

本项目因本人收藏新闻的习惯而建立,能够便捷的下载某日报纸的单页PDF并合并为完整文件,目的是为了减少收藏新闻过程中繁琐的操作,请勿用于商业用途。

使用所获得的PDF文件,请遵守人民日报的版权声明:“《人民日报》(电子版)的一切内容(包括但不限于文字、图片、PDF、图表、标志、标识、商标、版面设计、专栏目录与名称、内容分类标准以及为读者提供的任何信息)仅供人民网读者阅读、学习研究使用,未经人民网股份有限公司及/或相关权利人书面授权,任何单位及个人不得将《人民日报》(电子版)所登载、发布的内容用于商业性目的,包括但不限于转载、复制、发行、制作光盘、数据库、触摸展示等行为方式,或将之在非本站所属的服务器上作镜像。否则,人民网股份有限公司将采取包括但不限于网上公示、向有关部门举报、诉讼等一切合法手段,追究侵权者的法律责任。”

1. 使用前准备

1.1 下载源码并解压

1.2 安装依赖包

打开cmd或powershell,切换到解压文件所在目录,输入pip install -r requirements.txt

2. 使用方法

2.1 基本命令

python main.py,下载当日报纸的PDF文件

python main.py 20200701 下载指定日期的PDF文件

python main.py 20200701 20210822 下载2020年7月1日至2021年8月22日的PDF文件

2.2 进阶使用:定时下载PDF文件

Win用户请参考本文:https://jingyan.baidu.com/article/9080802200cc15fd91c80fcf.html

macOS/Linux用户请自行寻找定时运行程序的办法

注意:

1.将paper.vbe文件设置为要启动的程序,并将起始于设置为paper.vbe文件所在目录

2.如果需要进入特定的conda环境,请编辑paper.bat并按注释修改

3. 已知问题

因人民日报网站规则在去年发生了变更,本项目仅能下载及合并2020年07月01日及以后的PDF文件

About

获取人民日报每天的PDF文件并进行合并

License:GNU General Public License v2.0


Languages

Language:Python 95.7%Language:Batchfile 4.3%