Miserial / DomainSpider

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

DomainSpider

此项目包含两种获取WHOIS信息的方法。

其一为通过python-whois 模块直连whois服务器43端口,其二为静态爬虫重复爬取。

var_HTTP

使用方法:

安装相应模块,配置./send_var_SMTP.py 中的SMTP服务,运行./main.py 。新队列输入1 ,更新提醒列表输入2

进一步可以把alram.sh 放入crontab.daily,配置工程位置实现每日检查。

附有一份流程简图观察文件流向

备注:
  • words.txt 来源于google-10000-english-no-swear 中筛选出的三位高频短单词

  • 此方法采用单进程

  • 目前仅提供一所网站的解析,已知 .gs 还有两个备选项。

var_Module

附有一份流程简图

备注:
  • 此方法采用多进程(注意:容易被BAN)
  • 目前只编写了核心程序获取 whois 信息,暂未添加后续处理。可自行根据数据修改调用var_HTTP 方法下的处理
  • 附有获取的两位字母数据集

About


Languages

Language:Python 97.1%Language:Shell 2.9%