web-crawler

Java 网站爬虫，可以爬取 http://www.biquge.cm/ 上的小说，基于之前的 WebScraping_v2.0 项目进行重构。

详细内容见我的博客 Java 网络爬虫

Python 版本

Python 版本请见 crawler.py

git checkout master

基于 Spring Boot 的 Web 项目，启动后访问 http://localhost:8080/novel?index=12/12456 下载文件

git checkout v1.0

使用说明

Java web crawler for http://www.biquge.cm/

Language:HTML 80.6%Language:Java 19.4%