kdming / baiduSpider

百度并发爬虫,练习go channel

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

百度爬虫

目录架构
spider 爬虫代码目录
static 爬虫任务分配和爬虫结果目录
static-job 爬虫任务目录,文件需以job.txt结尾
static-result 爬虫结果目录

爬取速度限制不在io,而在于网络,可根据实际情况调整
spider.go中Schedule方法爬虫并发数量

运行go run app.go

About

百度并发爬虫,练习go channel


Languages

Language:Go 100.0%