scrapy-redis

There are 6 repositories under scrapy-redis topic.

zhangslob / awesome_crawl
腾讯新闻、知乎话题、微博粉丝，Tumblr爬虫、斗鱼弹幕、妹子图爬虫、分布式设计等
awesome crawl douyu golang python redis scrapy scrapy-redis tencent tumblr tumblr-bot websockets weibo zhihu
Language:Python 284
zhangslob / docs
《数据采集从入门到放弃》源码。内容简介：爬虫介绍、就业情况、爬虫工程师面试题；HTTP协议介绍； Requests使用；解析器Xpath介绍； MongoDB与MySQL；多线程爬虫； Scrapy介绍；Scrapy-redis介绍；使用docker部署；使用nomad管理docker集群；使用EFK查询docker日志
crawler docker efk-elastic-search--fluentd--kibana http mongodb mysql python requests scrapy scrapy-crawler scrapy-redis xpath
132
ihandmine / aioscpy
An asyncio + aiolibs crawler imitate scrapy framework
asyncio framework python3 scrapy aiohttp loguru scrapy-redis crawling
Language:Python 128
stormstone / SpiderSSS
🪲 一些爬虫的学习笔记资料。必应图片下载爬虫、豆瓣读书爬虫、当当图书爬虫、网易云用户信息爬虫、GitHub用户信息爬虫、 Twitter用户图片下载等等。
appium mitmproxy scrapy scrapy-redis selenium spider
Language:Jupyter Notebook 76
ConlinH / aio-scrapy
Implement scrapy with asyncio
aiohttp aioscrapy crawler httpx scrapy scrapy-redis scrapyd spider
Language:Python 51
crawlaio / scrapy-redis-sentinel
scrapy-redis-sentinel 基于 scrapy-redis 的基础上新增哨兵（sentinel）连接模式以及集群（cluster）连接模式。
scrapy scrapy-redis scrapy-redis-sentinel scrapy-redis-cluster
Language:Python 31
yangge11 / scrapy_pro
关于5000+站点的scrapy爬虫开发，涉及一些技术架构搭建以及各种反爬方案，详见readme文件
scrapy scrapy-redis crawler pa-c
Language:Python 29
dragonflylxp / crawler
python爬虫项目集合
scrapy scrapy-redis
Language:HTML 28
msft-vivi / JobNews-ElasticSearch-Scrapy_redis
项目整体分为scrapy-redis分布式爬虫爬取数据、基于ElasticSearch数据检索和前端界面展示三大模块。做此项目是为了熟悉scrapy-redis的基本流程，以及其背后的原理，同时熟悉ElasticSearch的使用。本项目可以作为一个基于ES存储的简单但是相对全面的全栈开发的Demo。项目中所采用的组件均在win10本地环境搭建（伪分布），旨在演示项目流程。你可以参考该项目，并将其扩展到多个主机上，实现分布式ES以及分布式Scrapy。
elasticsearch scrapy scrapy-redis django redis
Language:CSS 23
leffss / ScrapyRedisBloomFilterBlockCluster
Scrapy Redis with Bloom Filter，support redis sentinel and cluster
bloom redis redis-cluster scrapy scrapy-redis
Language:Python 22
xiaoe1314 / Python
Python实战项目：爬取糗事百科、拉勾网、boss直聘等等知名网站实战，搭建响应式网站、Python web项目。
python spider scrapy scrapy-redis selenium selenium-webdriver requests beatifulsoup
Language:HTML 20
ayueaa / Some-Spiders
Python3爬虫Scrapy实战练习：Boss直聘、bilibili弹幕、链家二手房在售已售、知乎、拉钩...
proxy python requests scrapy scrapy-redis
Language:Julia 10
nciefeiniu / totalstsation_scrapy
基于scrapy-redis scrapy-splash的通用爬虫（包括ajax请求的数据）
rediscrawlspider splash scrapy-redis scrapy-splash scrapy-redis-splash
Language:Python 8
cnyangkui / distributed-crawler
第六届中软杯赛题 - 分布式爬虫系统（经纬度团队作品）
distributed-crawler django mongodb redis scrapy-redis
Language:Roff 7
Dengqlbq / JDSpider
分布式爬取京东商品详情，评论和评论总结
scrapy-redis spider distributed python3 scrapy
Language:Python 7
Harhao / duSheCommunity
利用Fiddler抓包分析毒舌影评社区的APP api接口。单机版的scrapy爬虫，基于scrapy-redis
scrapy scrapy-redis python spiders
Language:Python 7
Danceiny / parser_engine
A parser engine born for scrapy
scrapy parser-library crawler scrapy-redis xpath jsonpath jsonpath-rw simplejson peewee parser-engine
Language:Python 5
KertinH / SearchForProgrammer_spiders
SearchForProgrammer（爬虫模块）
python3 scrapy-redis spiders elasticsearch-dsl elasticsearch
Language:Python 5
shanglinsl / JobSpider_lago
scrapy 拉钩网爬虫
python3 mysql scrapy-redis scrapy-spider
Language:Python 5
lnytx / jiayuan
python scrapy scrapy-redis
Language:Python 4
hz-heng / distributed_newscrawl
分布式新闻爬虫（电子报）
scrapy scrapy-redis
Language:Python 3
adamxy / wandoujia_comments
抓取豌豆荚应用和游戏的评论
scrapy redis scrapy-redis mongodb
Language:Python 2
fank-cd / dangdang_spider
爬取当当网的图书条目，使用Scrapy-Redis/MongoDB实现的一个分布式网络爬虫,底层存储MongoDB,分布式使用scrapy-Redis实现
python scrapy scrapy-redis
Language:Python 2
geebytes / GeeProxy
IP 代理池
ip-proxy python3 scrapy-redis scrapy proxy
Language:Python 2
EruDev / maitian_zuf
分布式爬取麦田租房全部信息
spider scrapy-redis mongodb redis
Language:Python 1
faiwongyip / binewslist_redis
分布式爬虫
scrapy scrapy-redis regexp sqlserver
Language:Python 1
JuneWaySue / learning_scrapy_5
【Scrapy学习心得】爬虫实战五（Scrapy-Redis分布式爬虫）
scrapy scrapy-redis
Language:Python 1
kiss4u / pawitch
scrapy+redis,film website sprider
python scrapy scrapy-redis
Language:Python 1
louremipsum / Virgil
A minimal search engine implementation
axios javascript mantine python react router-dom scrapy scrapy-crawler scrapy-redis vite
Language:Python 1
netflame / wscrape
Distributed netnews crawler based on scrapy
bloomfilter scrapy scrapy-redis
Language:Python 1
QiliWu / bilibili_spider
requests, scrapy, scrapy-redis三种方法实现bilibili用户信息爬虫
scrapy scrapy-redis requests python3
Language:Python 1
SCUTJcfeng / Scrapy-redis-Projects
scrapy-redis
Language:Python 1
worry1613 / csdn-blog-spider
CSDN博客爬虫
mongodb python3 scrapy-crawler scrapy-redis
Language:Python 1
xwk134 / myspider
scrapy scrapy-redis
Language:HTML 1
zhu733756 / Itchat-DBMovieComments
scrapy crawl douban.py
scrapy scrapy-redis itchat douban-crawler itchat-robot
Language:Python 1
VQHieu1012 / Distributed-Scraper
Distributed scraper system
distributed-systems playwright-python scrapy-redis
Language:Python

scrapy-redis

zhangslob / awesome_crawl

zhangslob / docs

ihandmine / aioscpy

stormstone / SpiderSSS

ConlinH / aio-scrapy

crawlaio / scrapy-redis-sentinel

yangge11 / scrapy_pro

dragonflylxp / crawler

msft-vivi / JobNews-ElasticSearch-Scrapy_redis

leffss / ScrapyRedisBloomFilterBlockCluster

xiaoe1314 / Python

ayueaa / Some-Spiders

nciefeiniu / totalstsation_scrapy

cnyangkui / distributed-crawler

Dengqlbq / JDSpider

Harhao / duSheCommunity

Danceiny / parser_engine

KertinH / SearchForProgrammer_spiders

shanglinsl / JobSpider_lago

lnytx / jiayuan

hz-heng / distributed_newscrawl

adamxy / wandoujia_comments

fank-cd / dangdang_spider

geebytes / GeeProxy

EruDev / maitian_zuf

faiwongyip / binewslist_redis

JuneWaySue / learning_scrapy_5

kiss4u / pawitch

louremipsum / Virgil

netflame / wscrape

QiliWu / bilibili_spider

SCUTJcfeng / Scrapy-redis-Projects

worry1613 / csdn-blog-spider

xwk134 / myspider

zhu733756 / Itchat-DBMovieComments

VQHieu1012 / Distributed-Scraper