ericksonalves / newscrawler

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

News Crawler

Este é um projeto -Eclipse/Java- de um Coletor de notícias baseado em jsoup, mysql e php.

Como funciona?

  • Acessa cada um dos sites de notícias contidos na tabela sources;
  • Coleta todos os links e textos associados aos mesmos;

Mãos à massa!

Restaure a base de dados mysql a partir do arquivo: newscrawler.sql

Executando o robô:


java -cp .:/home/user/workspace/newscrawler/jsoup-1.9.2.jar Home

Encontrando a Moda:


java Stats 2016/10/26

Aplicações

  • Data Mining
  • Opinion Mining

About


Languages

Language:Java 100.0%