SuPejkj / SecCrawler

一个方便安全研究人员获取每日安全日报的爬虫和推送程序,目前爬取范围包括先知社区、安全客、Seebug Paper、跳跳糖、奇安信攻防社区、棱角社区,持续更新中。

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

SecCrawler

SecCrawler

一个方便安全研究人员获取每日安全日报的爬虫和推送程序,目前爬取范围包括先知社区、安全客、Seebug Paper、跳跳糖、奇安信攻防社区、棱角社区,持续更新中。

Table of Contents

Introduction

SecCrawler 是一个跨平台的方便安全研究人员获取每日安全日报的爬虫和机器人推送程序,目前爬取范围包括先知社区、安全客、Seebug Paper、跳跳糖、奇安信攻防社区、棱角社区,持续更新中。

程序使用yml格式的配置文件,第一次运行时会在当前文件夹自动生成config.yml配置文件模板,在配置文件中设置爬取的网站和推送机器人相关配置,目前包括在内的网站和推送的机器人在Features中可以查看,可以设置每日推送的整点时间。

程序使用定时任务每天根据设置好的时间整点自动运行,编辑好相关配置后后台运行即可,示例运行命令:

$ nohup ./SecCrawler >> run.log 2>&1 &
# 或者使用screen
$ screen ./SecCrawler
$ ctrl a+d / control a+d # 回到主会话

注:由于在爬取先知安全社区时程序使用了 Selenium,用户需要手动下载ChromeDriverChrome浏览器。

ChromeDriver镜像站:http://npm.taobao.org/mirrors/chromedriver/

Chrome浏览器可以访问chrome://version/查看版本

命令行可以使用google-chrome-stable --version查看版本

程序旨在帮助安全研究者自动化获取每日更新的安全文章,适用于每日安全日报推送,爬取的安全社区网站范围和支持推送的机器人持续增加中,欢迎在issues中提供宝贵的建议。

🚀 目前 SecCrawler 已在MacOS Apple silicon 、Ubuntu 20.04运行测试通过。

Features

支持的爬取网站列表:

支持的推送机器人列表:

Install

你可以在Releases下载最新的SecCrawler。

或者从源码编译:

$ git clone https://github.com/Le0nsec/SecCrawler.git
$ cd SecCrawler
$ go build .

Config

config.yml配置文件模板:

############### CronSetting ###############
# 开启则一次性爬取后退出程序
Debug: false
# 设置每天整点爬取推送时间,范围 0 ~ 23(整数)
CronTime: 11
# 设置Selenium使用的ChromeDriver路径,支持相对路径或绝对路径(如果不爬取先知社区可以不用设置)
ChromeDriver: ./chromedriver/linux64


############### BotConfig ###############

# 企业微信群机器人
# https://work.weixin.qq.com/api/doc/90000/90136/91770
WecomBot:
  enabled: false
  key: xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx
  timeout: 2  # second

# 飞书群机器人
# https://open.feishu.cn/document/ukTMukTMukTM/ucTM5YjL3ETO24yNxkjN
FeishuBot:
  enabled: false
  key: xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx
  timeout: 2

# 钉钉群机器人
# https://open.dingtalk.com/document/robots/custom-robot-access
DingBot:
  enabled: false
  token: xxxxxxxxxxxxxxxxxxxxxx
  timeout: 2

# HexQBot
# https://github.com/Am473ur/HexQBot
HexQBot:
  enabled: false
  api: http://xxxxxx.com/send
  qqgroup: 000000000
  key: xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx
  timeout: 2

# Server酱
# https://sct.ftqq.com/
ServerChan:
  enabled: false
  sendkey: xxxxxxxxxxxxxxxxxxxxxx
  timeout: 2


############### SiteEnable ###############

# 棱角社区
# https://forum.ywhack.com/forum-59-1.html
EdgeForum:
  enabled: true

# 先知安全技术社区
# https://xz.aliyun.com/
XianZhi:
  enabled: true

# SeebugPaper(知道创宇404实验室)
# https://paper.seebug.org/
SeebugPaper:
  enabled: true

# 安全客
# https://www.anquanke.com/
Anquanke:
  enabled: true

# 跳跳糖
# http://tttang.com/
Tttang:
  enabled: true

# 奇安信攻防社区
# https://forum.butian.net/community/all/newest
QiAnXin:
  enabled: true

Demo

Contributing

如果您有高质量的安全社区网站希望被爬取,或者想推荐被广泛使用的推送机器人,欢迎联系我leonsec[at]h4ck.fun或提交issuePR

License

GNU General Public License v3.0

About

一个方便安全研究人员获取每日安全日报的爬虫和推送程序,目前爬取范围包括先知社区、安全客、Seebug Paper、跳跳糖、奇安信攻防社区、棱角社区,持续更新中。

License:GNU General Public License v3.0


Languages

Language:Go 100.0%