luckmc / UrlCollectionTools

一款根据关键词批量采集url的小脚本,支持多个关键词批量采集。

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

collect-url-tools-base-keywords

一款根据关键词批量采集url的工具,支持多个关键词,结果自动去重。

支持的搜索引擎

搜索引擎 多线程 时间
Bing国内版 X 2022-03-22
Bing国际版 X 2022-03-22

快速上手

python3的环境,安装依赖包。

pip3 install -r requirements.txt

创建mysql数据库,将sql.sql文件导入进mysql

detail

数据库结构

数据库名 表名 字段名1 字段名2
url url_tables id(int, primary key, auto) url(text, len(30))

启动

python3 main_tools.py

效果预览

2H2G4M的机器,十个小时约8w条url

更新消息

2022-03-22

  • 重写项目结构
  • 支持bing国内、国际搜索引擎
  • 新增多线程,可同时对多个搜索引擎采集

About

一款根据关键词批量采集url的小脚本,支持多个关键词批量采集。


Languages

Language:Python 100.0%