Aoteman0 / 18comic

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

爬取jm韩漫 将数据存储到mysql

album.py 默认爬取韩漫书名 类型 人气 并且保存到comicone数据库

photo.py 爬取每本漫画话数链接 并且保存comictwo数据库 向第一层数据库插入每本漫画的当前最新话aid

imgcomic.py 爬取每话每张图片的名称和url保存到comicthree数据库

down_img:拼凑完整图片的逻辑代码

dowm_one:单独下载每话

download:下载全数据库图片 并且保存本地

option_head: selenium头部导入文件

update:可以更新数据库漫画

xpathjson:存放爬取网址的xpath语句

mysql_db.py 创建mysql数据库comic和三个表 comicone,commictwo,comicthree

myran:随机获取一个user-agent

安装: python3.7+ 、 mysql

安装pillow 分割拼凑图片用

pip install pillow -i https://pypi.douban.com/simple

安装selenium 自动化测试工具

pip install selenium -i https://pypi.douban.com/simple

安装PyExecJS 在python中执行js

pip install PyExecJS

安装mysql-connector-python来创建mysql连接池

pip install mysql-connector-python

安装requests 获取网页数据

pip install requests

About


Languages

Language:Python 74.5%Language:JavaScript 25.5%