yangmaozhe / caipanwenshu_spider

selenium裁判文书网爬虫,文书网登录

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

caipanwenshu_spider

爬取流程

  • 爬取文书每篇文书的docid
  • 依据docid爬取正文,概要和法律依据

感谢

  • 感谢李唐提供的部分代码

代码

注意事项

  • 想要爬的数据多,参数得做的全面
  • 本项目已于2019-2020年完成大规模爬取,请使用代理Ip

更新

About

selenium裁判文书网爬虫,文书网登录


Languages

Language:Python 57.8%Language:JavaScript 42.2%