moodn / zhihu_spider

知乎问题回答的爬取

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

相关代码已经修改调试成功----2017-4-22

一、说明

1.目标网址:知乎登入后的首页

2.实现:如图字段的爬取

zhihu_question表:

zhihu_answer表:

3.数据:存放在百度网盘,有需要的可以拿取 链接:http://pan.baidu.com/s/1qYQ6rk4 密码:ociz

zhihu_question表结果:

zhihu_answer表结果:

二、运行

运行我就不多说了,直接运行main.py就好了,相关的参数变一下就好了。有点基础的应该都会。

三、学习笔记

本项目爬取知乎的问题和回答的相关信息。本项目和伯乐在线项目差不多,新知识就是一个模拟登录。

四、问题----欢迎留言提出问题

1.暂时没有很大的问题解决不了,后期如果遇到再贴出来


如果本项目对你有用请给我一颗star,万分感谢。

About

知乎问题回答的爬取


Languages

Language:Python 100.0%