luorock / 1688

扒取 1688 商家数据

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

1688

扒取 1688 商家数据

##步骤:

  1. 运行 getSearchKeyWords.py, 得到 searchKeyWords.txt 关键字列表
  2. 运行 initKeyWordsHistoryDB.py, 得到 keyWordsHistory.db 初始化关键字搜索的历史库
  3. 运行 getGoodsList.py, 得到 goods.db 商品库
  4. 运行 initGoodsHistory.db 得到 goodsHistory.db 初始化商品搜索历史库
  5. 运行 getCompanyInfo.py 得到最终的 company.db 公司信息库

还蛮好玩的,拿到了30万家公司的信息,不足点就是没开多线程,所以第5步太慢了...

About

扒取 1688 商家数据

License:Apache License 2.0


Languages

Language:Python 100.0%