hahaha108 / Scrapy-FictionSpider

利用scrapy框架爬取http://www.quanshuwang.com/ 上所有小说,并创建层级文件夹分类存储

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

基于scrapy框架的小说爬虫

爬取小说网站下所有类别、图书以及各章节内容,并按层级分类存储,具体效果如下:

start.py为启动文件

默认保存路径为:C:\Users\Administrator\Desktop\book

About

利用scrapy框架爬取http://www.quanshuwang.com/ 上所有小说,并创建层级文件夹分类存储


Languages

Language:Python 100.0%