unodba / myCrawler

我的爬虫练习

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

myCrawler

我的爬虫练习

doubanBook

爬取豆瓣读书。只爬取了每个标签类别的首页的图书信息,若稍加修改,可以爬取任意页数的信息。

getWebpage

保存指定URL的页面到本地。

qiushibaike

爬取糗事百科的内容,输出到命令行。主要参考http://cuiqingcai.com/990.html ,略作修改。

About

我的爬虫练习


Languages

Language:HTML 94.9%Language:Python 5.1%