whwq2012 / Crawler

Some crawlers for getting data from the net.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

关于

  • 最近的兴趣方向不在这一块,可能更新的实例比较少。
  • 有些程序估计写的比较早,一些网站的验证机制估计也变了,只做参考用。
  • 这里我会收集一些爬虫技巧以及相关链接。并且将会长期维护。

爬虫实例

  • Readme_Luowang:关于如何爬取落网音乐,下载到本地的小程序。
  • Readme_Baidu:关于如何基于 Py2.7 根据关键词从百度下载图片的小程序。
  • Readme_Zhihu:关于如何抓取知乎上一些信息的程序。
  • Readme_One:关于如何爬取 One 网站上的每日一图以及 One 问答,并且存储在 LeanCloud 云后台。
  • Readme_Sujin:关于如何爬取素锦网站上的好文章,并且存储在 LeanCloud 云后台。

详细步骤可以阅读对应的 ReadMe 文件,相应代码都在本仓库中

爬虫基础

爬虫进阶

About

Some crawlers for getting data from the net.


Languages

Language:Python 100.0%