DeerLucky

DeerLucky

Geek Repo

0

followers

0

following

Github PK Tool:Github PK Tool

DeerLucky's starred repositories

hello-algorithm

🌍 针对小白的算法训练 | 包括四部分:①.大厂面经 ②.力扣图解 ③.千本开源电子书 ④.百张技术思维导图(项目花了上百小时,希望可以点 star 支持,🌹感谢~)推荐免费ChatGPT使用网站

Language:JavaStargazers:34983Issues:0Issues:0

spring-boot-projects

:fire: 该仓库中主要是 Spring Boot 的入门学习教程以及一些常用的 Spring Boot 实战项目教程,包括 Spring Boot 使用的各种示例代码,同时也包括一些实战项目的项目源码和效果展示,实战项目包括基本的 web 开发以及目前大家普遍使用的线上博客项目/企业大型商城系统/前后端分离实践项目等,摆脱各种 hello world 入门案例的束缚,真正的掌握 Spring Boot 开发。

Language:JavaLicense:Apache-2.0Stargazers:5270Issues:0Issues:0

Spring-Boot-In-Action

Spring Boot 系列实战合集

Language:JavaStargazers:4663Issues:0Issues:0

CodeGuide

:books: 本代码库是作者小傅哥多年从事一线互联网 Java 开发的学习历程技术汇总,旨在为大家提供一个清晰详细的学习教程,侧重点更倾向编写Java核心内容。如果本仓库能为您提供帮助,请给予支持(关注、点赞、分享)!

Language:ShellLicense:Apache-2.0Stargazers:10928Issues:0Issues:0

SpringBoot-Shiro-Vue

提供一套基于Spring Boot-Shiro-Vue的权限管理思路.前后端都加以控制,做到按钮/接口级别的权限。(当前新版本已移除shiro依赖,简化了配置)

Language:JavaLicense:MITStargazers:4513Issues:0Issues:0
Language:CSSStargazers:440Issues:0Issues:0
Language:JavaScriptStargazers:1Issues:0Issues:0

smart_login

各大网站登陆方式,有的是通过selenium登录,有的是通过抓包直接模拟登录(精力原因,目前不再继续维护)

Language:PythonLicense:MITStargazers:1012Issues:0Issues:0

webmagic

A scalable web crawler framework for Java.

Language:JavaLicense:Apache-2.0Stargazers:11333Issues:0Issues:0

SinaSpider

新浪微博爬虫(Scrapy、Redis)

Language:PythonStargazers:3255Issues:0Issues:0

Distributed_spider_pku_java

1. 主要分为三个模块,一个爬虫抓取模块,一个是数据处理模块,一个是用户模块。 2. 爬虫抓取模块主要是从直播吧、新浪体育、网易体育上爬取有关足球的新闻和用户关于足球的评论,利用集群HADOOP抓取网页,分析得出URL集,提取特征URL 3. 网页linux脚本过滤得到原始网页,然后二次过滤得到文本,并使用分布式储存。 4. 处理模块主要是根据训练集规则一和规则二,得到分词器,然后对文本进行操作,得出训练结果。 5. 通过特征脚本得到训练结果的特征词分类,然后提取出球队模糊集和球星模糊集。 6. 过滤得到球队精确集和球星精确集,并存入MYSQL数据库。 7. 从数据库中提取球星和球队的信息进行图表分析,并动态显示WIKI信息,调入显示模块中和用户进行交换

Language:JavaStargazers:159Issues:0Issues:0

WebCrawler

一个可以实现关键词搜索的网络爬虫

Language:JavaStargazers:10Issues:0Issues:0

java-spider

一个基于webmagic框架二次开发的java爬虫框架实战,已实现能爬取腾讯,搜狐,今日头条(单独集成功能)等资讯内容,配合elasticsearch框架用法,实现了自动爬虫,已投入线上生产使用。

Language:JavaStargazers:335Issues:0Issues:0

newscrawler

新闻网站爬虫,目前能够爬取网易,新浪,qq,搜狐等三家网站的新闻页面,并保存到本地。

Language:PythonStargazers:33Issues:0Issues:0

spider

a simple distributed spider in Java. Java编写的一个简单分布式爬虫

Language:JavaStargazers:159Issues:0Issues:0

spider

A configurable web spider with a easy-to-use web console

Language:JavaLicense:GPL-3.0Stargazers:988Issues:0Issues:0

zhihu-crawler

zhihu-crawler是一个基于Java的高性能、支持免费http代理池、支持横向扩展、分布式爬虫项目

Language:JavaLicense:NOASSERTIONStargazers:912Issues:0Issues:0

Graduation-Design

网络舆情爬虫 实现元搜索(MetaSearch)和随机URL(主要是五大门户网站)的抓取。

Language:JavaStargazers:13Issues:0Issues:0

spider

利用spring boot + webmagic 开发的java爬虫系统

Language:JavaStargazers:60Issues:0Issues:0

Analysis-of-Public-Opinion-Based-on-Microblogging-Reptile

这是我参加招商银行fintech精英选拔时,做的一个课题。用Python对新浪微博进行爬虫,然后进行舆情分析。爬虫之前,需要模拟登陆,这里采用RSA加密模块模拟登陆。舆情分析的时候,我直接调用腾讯文智的感情分析API。

Language:PythonStargazers:196Issues:0Issues:0

elasticsearch-sentiment

基于ElasticSearch的分布式舆情检索统计服务。

Language:JavaLicense:Apache-2.0Stargazers:11Issues:0Issues:0

mynote

涉华舆情信息爬虫

Language:JavaStargazers:8Issues:0Issues:0

networkPublicOpinionAnalysisSystem

网络舆情分析系统

Language:PythonStargazers:165Issues:0Issues:0

weibo-spider

新浪微博爬虫,采用Java语言开发,基于HTTPClient 4.0,采用MySQL存储爬取数据,支持多进程并发执行。功能包括:爬取微博、评论、转发、关注列表(层次)。根据数据需求,持续更新...

Language:JavaStargazers:352Issues:0Issues:0

Java

java项目实战练习

Language:JavaStargazers:3113Issues:0Issues:0