spider

There are 164 repositories under spider topic.

NaiboWang / EasySpider
A visual no-code/code-free web crawler/spider易采集：一个可视化浏览器自动化测试/数据采集/爬虫软件，可以无代码图形化的设计和执行爬虫任务。别名：ServiceWrapper面向Web应用的智能化服务封装系统。
code-free crawler gui layman spider parameters web www input-parameters frontend html batch-processing batch-script visual visualization visualprogramming scraper data-collection rpa robotics
Language:JavaScript 23640
gocolly / colly
Elegant Scraper and Crawler Framework for Golang
golang scraper framework crawler scraping crawling spider go
Language:Go 22300
facert / awesome-spider
爬虫集合
awesome python spider
21627
jhao104 / proxy_pool
Python ProxyPool for web spider
crawler proxy spider redis http
Language:Python 20367
shengqiangzhang / examples-of-web-crawlers
一些非常有趣的python爬虫例子,对新手比较友好,主要爬取淘宝、天猫、微信、微信读书、豆瓣、QQ等网站。(Some interesting examples of python crawlers that are friendly to beginners. )
crawler spider taobao tmall example python selenium pyquery stock fund multithreading agent-pool wechat wechat-report wereader
Language:Python 13556
crawlab
crawlab-team / crawlab
Distributed web crawler admin platform for spiders management regardless of languages and frameworks. 分布式爬虫管理平台，支持任何语言和框架
webcrawler scrapy crawlab spiders-management go scrapyd-ui spider crawler webspider web-crawler docker platform crawling-tasks
Language:Go 10861
s0md3v / Photon
Incredibly fast crawler designed for OSINT.
crawler spider python osint information-gathering
Language:Python 10547
guyueyingmu / avbook
AV 电影管理系统， avmoo , javbus , javlibrary 爬虫，线上 AV 影片图书馆，AV 磁力链接数据库，Japanese Adult Video Library,Adult Video Magnet Links - Japanese Adult Video Database
javbus avmoo javlibrary spider crawler laravel scraper adult magnet-link magnet database adult-video guzzlehttp
Language:PHP 9311
ssssssss-team / spider-flow
新一代爬虫平台，以图形化方式定义爬虫流程，不写代码即可完成爬虫。
spider crawler jsoup xpath web-spider webspider webcrawler web-crawler spider-flow
Language:Java 9096
andeya / pholcus
Pholcus is a distributed high-concurrency crawler software written in pure golang
spider crowler
Language:Go 7532
kangvcar / InfoSpider
INFO-SPIDER 是一个集众多数据源于一身的爬虫工具箱🧰，旨在安全快捷的帮助用户拿回自己的数据，工具代码开源，流程透明。支持数据源包括GitHub、QQ邮箱、网易邮箱、阿里邮箱、新浪邮箱、Hotmail邮箱、Outlook邮箱、京东、淘宝、支付宝、**移动、**联通、**电信、知乎、哔哩哔哩、网易云音乐、QQ好友、QQ群、生成朋友圈相册、浏览器浏览历史、12306、博客园、CSDN博客、开源**博客、简书。
python3 crawl spider selenium wxpython tkinter automation hotmail chrome csdn outlook
Language:Python 7380
luyishisi / Anti-Anti-Spider
越来越多的网站具有反爬虫特性，有的用图片隐藏关键数据，有的使用反人类的验证码，建立反反爬虫的代码仓库，通过与不同特性的网站做斗争（无恶意）提高技术。（欢迎提交难以采集的网站）（因工作原因，项目暂停）
python spider geek
Language:Python 7241
Douyin_TikTok_Download_API
Evil0ctal / Douyin_TikTok_Download_API
🚀「Douyin_TikTok_Download_API」是一个开箱即用的高性能异步抖音、快手、TikTok、Bilibili数据爬取工具，支持API调用，在线批量解析及下载。
python pywebio tiktok douyin api scraper fastapi no-watermark online-parsing async douyin-tiktok-api douyin-tiktok-download crawler spider web-scraping asgi asyncio tiktok-scraper douyin-scraper httpx
Language:Python 7117
bda-research / node-crawler
Web Crawler/Spider for NodeJS + server-side jQuery ;-)
crawler javascript spider extract-data cheerio jquery nodejs
Language:JavaScript 6625
lorien / awesome-web-scraping
List of libraries, tools and APIs for web scraping and data processing.
web-scraping captcha-bypass captcha-recaptcha crawling crawling-framework crawling-python crawling-tool scraping scraping-framework scraping-python scraping-tool webscraping crawler spider
Language:Makefile 6357
BruceDone / awesome-crawler
A collection of awesome web crawler,spider in different languages
web-crawler crawler web-scraper spider node-crawler scraper awesome
6142
SpiderClub / haipproxy
:sparkling_heart: High available distributed ip proxy pool, powerd by Scrapy and Redis
high-availability scrapy ipproxy distributed redis crawler scheduler spider
Language:Python 5406
tophubs / TopList
今日热榜，一个获取各大热门网站热门头条的聚合网站，使用Go语言编写，多协程异步快速抓取信息，预览:https://mo.fish
hot golang spider today-s-hot-list hotlist
Language:Go 4662
niespodd / browser-fingerprinting
Analysis of Bot Protection systems with available countermeasures 🚿. How to defeat anti-bot system 👻 and get around browser fingerprinting scripts 🕵️‍♂️ when scraping the web?
bot detection chromium stealth puppeteer scraper webscraping web automation chromium-browser bot-detection chromedriver fingerprinting crawler recaptcha spider browser-fingerprinting
Language:JavaScript 3917
201206030 / novel-plus
novel-plus 是一个多端（PC、WAP）阅读、功能完善的小说 CMS 系统。包括小说推荐、小说检索、小说排行、小说阅读、小说书架、小说评论、小说爬虫、会员中心、作家专区、充值订阅、新闻发布等功能。
novel crawl read book spider
Language:Java 3540
elliotgao2 / toapi
Every web site provides APIs.
html json api python web spider crawler flask toapi
Language:Python 3479
ihmily / DouyinLiveRecorder
可循环值守和多人录制的直播录制软件，支持抖音、TikTok、快手、虎牙、斗鱼、B站、小红书、pandatv、afreecatv、flextv、popkontv、twitcasting、winktv、百度、微博、酷狗、花椒、流星等平台直播录制，抓取多平台直播源地址
douyin-live video-downloader douyin-api douyulive live-recorder python tiktok-api tiktoklive spider afreecatv douyin tiktok flextv twitcasting pandatv douyu huya weibo-live
Language:Python 3222
Gerapy / Gerapy
Distributed Crawler Management Framework Based on Scrapy, Scrapyd, Django and Vue.js
scrapy distributed webspider scrapyd dashboard spider django vuejs gerapy vue docker
Language:Python 3220
wechatsync / Wechatsync
一键同步文章到多个内容平台，支持今日头条、WordPress、知乎、简书、掘金、CSDN、typecho各大平台，一次发布，多平台同步发布。解放个人生产力
chrome-extension chrome markdown multiplatform blog writer wechat-official-account spider vue
Language:JavaScript 3162
my8100 / scrapydweb
Web app for Scrapyd cluster management, Scrapy log analysis & visualization, Auto packaging, Timer tasks, Monitor & Alert, and Mobile UI. DEMO :point_right:
scrapy scrapyd scrapyd-ui scrapyd-api scrapyd-admin scrapyd-manage log-parsing log-analysis scrapyd-monitor scrapyd-keeper scrapyd-control scrapy-log-analysis scrapyd-log-analysis scrapy-visualization scrapyd-visualization dashboard spider scrapyd-cluster-management
Language:Python 3013
core
JAVClub / core
🔞 JAVClub - 让你的大姐姐不再走丢
jav javbus adult adult-content video-streaming google-drive javiewer porn spider japanese magnet
Language:JavaScript 2849
wkunzhi / Python3-Spider
Python爬虫实战 - 模拟登陆各大网站包含但不限于：滑块验证、拼多多、美团、百度、bilibili、大众点评、淘宝，如果喜欢请start ❤️
scrapy python crawl crawler geek spider taobao dianping meituan selenium pyppeteer splash scrapy-crawler
Language:Python 2833
CharlesPikachu / DecryptLogin
DecryptLogin: APIs for loginning some websites by using requests.
requests login python3 spider crawler zhihu bilibili weibo taobao jingdong twitter baiduyun stackoverflow 12306 xiami tencent pypi migu xiaomi baidu
Language:Python 2787
shiyanhui / dht
BitTorrent DHT Protocol && DHT Spider.
dht spider bittorrent-dht-protocol go
Language:Go 2708
DormyMo / SpiderKeeper
admin ui for scrapy/open source scrapinghub
scrapy dashboard scrapyd scrapy-ui scrapyd-dashboard scrapyd-ui spider
Language:Python 2705
jumper2014 / lianjia-beike-spider
链家网和贝壳网房价爬虫，采集北京上海广州深圳等21个**主要城市的房价数据（小区，二手房，出租房，新房），稳定可靠快速！支持csv,MySQL, MongoDB,Excel, json存储，支持Python2和3，图表展示数据，注释丰富，点星支持，仅供学习参考，请勿用于商业用途，后果自负。
lianjia spider crawler beike house
Language:Python 2704
DedSecInside / TorBot
Dark Web OSINT Tool
tor tor-network deepweb dark-web psnappz crawler spider dedsec-inside python-web-crawler security-tools security python3 python algorithm osint go projects hacking torbot hacktoberfest
Language:Python 2652
feapder
Boris-code / feapder
🚀🚀🚀feapder is an easy to use, powerful crawler framework | feapder是一款上手简单，功能强大的Python爬虫框架。内置AirSpider、Spider、TaskSpider、BatchSpider四种爬虫解决不同场景的需求。且支持断点续爬、监控报警、浏览器渲染、海量数据去重等功能。更有功能强大的爬虫管理系统feaplat为其提供方便的部署及调度
scrapy feapder spider crawler python feaplat
Language:Python 2648
jae-jae / QueryList
:spider: The progressive PHP crawler framework! 优雅的渐进式PHP采集框架。
querylist crawler spider scraper
Language:PHP 2631
wnma3mz / wechat_articles_spider
微信公众号文章的爬虫
wechat spider officialaccounts wechat-official-account python36
Language:Python 2623
howie6879 / owllook
owllook-小说搜索引擎
spider python crawler python3 ruia novel book asyncio asyncio-spider sanic qidian biquge owllook novels
Language:Python 2591

spider

NaiboWang / EasySpider

gocolly / colly

facert / awesome-spider

jhao104 / proxy_pool

shengqiangzhang / examples-of-web-crawlers

crawlab-team / crawlab

s0md3v / Photon

guyueyingmu / avbook

ssssssss-team / spider-flow

andeya / pholcus

kangvcar / InfoSpider

luyishisi / Anti-Anti-Spider

Evil0ctal / Douyin_TikTok_Download_API

bda-research / node-crawler

lorien / awesome-web-scraping

BruceDone / awesome-crawler

SpiderClub / haipproxy

tophubs / TopList

niespodd / browser-fingerprinting

201206030 / novel-plus

elliotgao2 / toapi

ihmily / DouyinLiveRecorder

Gerapy / Gerapy

wechatsync / Wechatsync

my8100 / scrapydweb

JAVClub / core

wkunzhi / Python3-Spider

CharlesPikachu / DecryptLogin

shiyanhui / dht

DormyMo / SpiderKeeper

jumper2014 / lianjia-beike-spider

DedSecInside / TorBot

Boris-code / feapder

jae-jae / QueryList

wnma3mz / wechat_articles_spider

howie6879 / owllook