RanchoCooper / Crawler

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

title date
领英爬虫
2016-08-04 18:33

获取用户主页链接

目录结构

Profile ├── index.json # 记录历史位置的数据文件 └── profile.py # 爬虫文件

BitMap └── bitmap.py # 支持位图索引

功能介绍

  • 自动续爬
  • 统一编码
  • 进度条显示

待完成功能

  • 多线程 + 工作队列模型
  • 完善代码风格(生成器的迭代优化)

About


Languages

Language:Python 100.0%