HuimengZhang/TianYanCha

将需要爬取的文件打包成xlsx格式，Sheet名称为"Sheet2"，文件命名为company_list.xlsx
将文件放到当前目录下
修改crawler.py文件中的target_headers对象中的Cookie属性为自己浏览器的（需要先从浏览器手动登陆天眼查网站）
- 这一步是为了将请求伪装成真实的浏览器，所以如果修改Cookie后不能爬取的话，可以将target_headers对象所有的属性都修改为自己的
- 经女朋友反馈，对于非程序员来说，这一步可能需要提示才能操作，详细操作步骤如下(这里以Chrome浏览器为例)
  - 登陆天眼查->右键->检查->点击Network->点击F5刷新界面->双击Network中的第一行->点击Headers->向下拉到Request Headers
  - 将target_headers中的属性对应修改为自己浏览器的即可
运行crawler.py文件

python crawler.py

HuimengZhang / TianYanCha