WeiXu94 / hupuspider

虎扑步行街爬虫

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

hupuspider

此代码主要用户爬取虎扑步行街JR的简要用户信息。

代码主要包括三部分: 1.获取步行街发帖主题的url 2.找出每个发帖主题里面的回帖jr的个人信息url 3.到每个jr的信息页去解析得到的信息

楼主写python时间也不长,代码写的比较乱,大家凑合着看,求轻拍砖! 此外,步行街此后可能会掀起一股爬虫热,大家悠着点,别把虎扑的服务器搞挂了。。 有jr问图是怎么做的,在此统一说下,很多第三方插件包括highcharts、echarts、d3都可以做很多既实用又美观的图,楼主这里用的是highcharts。 如果有意交流爬虫或其他有关数据、机器学习的知识也可与我交流。qq:317694563

About

虎扑步行街爬虫


Languages

Language:Python 100.0%