grdscarabe / data-lessons

Data quality and data mining lessons.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

DATA LESSONS

Supports pour les cours «data quality» et «datamining» à l'EPSI de Nantes.

Installation

Installer reveal.js dans le répertoire courant (sous-répertoire reveal.js-2.5.0) : https://github.com/hakimel/reveal.js#installation

Ouvrir un fichier HTML de cours dans un browser pour visualisation.

Programme du cours «Qualité des données»

  • 18/09/2013 : Introduction (4h)

    • Intérêt des données de qualité
    • Impact des données de mauvaise qualité
    • Prise en main de Open Refine
    • Qu'est-ce qu'une donnée de qualité ?
    • Management de la qualité des données
  • 26/09/2013 : ETL / Pentaho Data Integration (4h)

    • Pourquoi les ETL ?
    • Automatisation des règles de qualité
    • Prise en main de Pentaho Data Integration
  • 2/10/2013 : NoSQL (8h)

    • SQL
    • Pourquoi NoSQL ?
    • Prise en main par la pratique : Redis et MongoDB
    • Map/Reduce

About

Data quality and data mining lessons.