- Input : données provenant de wikipedia
- Output: top100 des pages les plus vues sur 2 temporalités (30 jours / 24 heures)
- Website D3.js dans /datavizD3js
- iPython Notebook avec connexion à un cluster Cassandra dans /notebook
- Documentation sur l'installation de l'infrastructure Cassandra-pySpark sur un cluster Amazon EC2
- Slides de présentation