x0s / WiKiTrendsNoSQL

final project NoSQL - MS BDG 2016 - Telecom Paristech

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

WiKiTrendsNoSQL

Données

  • Input : données provenant de wikipedia
  • Output: top100 des pages les plus vues sur 2 temporalités (30 jours / 24 heures)

Datavisualisation

  • Website D3.js dans /datavizD3js
  • iPython Notebook avec connexion à un cluster Cassandra dans /notebook

Documentation

  • Documentation sur l'installation de l'infrastructure Cassandra-pySpark sur un cluster Amazon EC2
  • Slides de présentation

About

final project NoSQL - MS BDG 2016 - Telecom Paristech


Languages

Language:Jupyter Notebook 96.4%Language:JavaScript 2.0%Language:HTML 0.9%Language:Python 0.5%Language:CSS 0.3%