letcheng / ProxyPool

针对反爬虫问题的自动代理池组件

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

ProxyPool

Build Status Release

针对反爬虫问题的自动代理池组件

特色

  • 支持 Proxy 自动持久化,一次加入,永久可使用
  • 自动将不可用的 Proxy 移出代理池
  • 线程安全,支持多线程同时使用代理池
  • 优先选择响应速度快的 Proxy
  • 出现 403 等状态码时,自动降低该 Proxy 的访问频率

使用

1.添加 Maven 库

<repositories>
    <repository>
        <id>jitpack.io</id>
        <url>https://jitpack.io</url>
    </repository>
</repositories>
<dependency>
    <groupId>com.github.letcheng</groupId>
    <artifactId>ProxyPool</artifactId>
    <version>x.x</version>
</dependency>

2.采取 add(init) -> borrow -> reback 的方式进行使用

ProxyPool proxyPool = new ProxyPool();

proxyPool.add("203.171.230.230", 80);
proxyPool.add("121.9.221.188", 80);

HttpProxy httpProxy = proxyPool.borrow(); // 从 ProxyPool 中获取一个Proxy

proxyPool.reback(httpProxy, HttpStatus.SC_OK); // 使用完成之后,归还 Proxy,并将请求结果的 http 状态码一起传入

proxyPool.allProxyStatus();  // 可以获取 ProxyPool 中所有 Proxy 的当前状态

3.enjoy!

About

针对反爬虫问题的自动代理池组件


Languages

Language:Java 100.0%