chenxingzhe / NewsSpider

网络爬虫之最基本的爬虫:爬取网易新闻排行榜

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

网络爬虫之最基本的爬虫:爬取网易新闻排行榜

一些说明:

  • 使用urllib2或requests包来爬取页面。
  • 使用正则表达式分析一级页面,使用Xpath来分析二级页面。
  • 将得到的标题和链接,保存为本地文件。

About

网络爬虫之最基本的爬虫:爬取网易新闻排行榜


Languages

Language:Python 100.0%