guiyi / Spider

爬虫_链家合肥二手房情况

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

爬虫_链家合肥二手房情况

EXCEL数据链接:http://pan.baidu.com/s/1dFzPcOx 密码:f4vx

执行环境:Anaconda

no module named pymysql python -m pip install -U pip pip install pymysql 相关网址: https://pip.pypa.io/en/latest/installing/#id7

http://blog.csdn.net/yuhouji009/article/details/70856597?utm_source=itdadao&utm_medium=referral

5W2H

1.研究的目的(Why):

分析合肥二手房情况

2.研究的内容(What):

A.各区域二手房总数
B.各区域二手房价格区间 单价,总价

3.研究对象-分析谁(Who):

合肥二手房情况

4.调查设计(Where)与研究方法(How):

链家
数据采集方法 :Python爬虫
   main()入口函数
   lianjia1()合肥各区县各房型总数
   lianjia1()合肥各区县各房型总数-浏览器伪装
   connLinajia() 数据库连接
   insertLianjia() 文件写入数据库表
   truncate() 情况表
   makepie() 图标展示


   数据库表结构
  CREATE TABLE `lianjia_hefei` (
    `id` int(11) NOT NULL AUTO_INCREMENT,
    `area` varchar(30) DEFAULT NULL,
    `fangxing` varchar(10) DEFAULT NULL,
    `allhouse` int(10) DEFAULT NULL,
    `createdate` datetime DEFAULT NULL,
    PRIMARY KEY (`id`)
  ) ENGINE=MyISAM AUTO_INCREMENT=31 DEFAULT CHARSET=gbk;
	研究方法: Sql分组

5.项目周期-分析多久(When):

XXX

6.项目报价-花多少钱(When):

7.项目组成员-谁来分析(Who):

具体项目图表展示:https://zhuanlan.zhihu.com/p/26633979

R相关分析: https://github.com/guiyi/R/blob/master/mysql.R

:) Have Fun ~

About

爬虫_链家合肥二手房情况


Languages

Language:Python 100.0%