KRLSMolina / European-Soccer-Data

Anàlisi sobre les dades de partits de futbol a les lligues europees

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

European Soccer Data

Aquest projecte s'ha realitzat amb l'objectiu d'entregar una pràctica amb els coneixements apresos sobre les tècniques de neteja i analisis sobre un conjunt de dades a l'assignatura Tipologia i cicle de vida de les dades, que es realitza dins el Màster de Ciència de Dades de la UOC. Concretament, en aquest repositori trobareu un estudi realitzat sobre les dades de partits de futbol a les lligues Europees desde la temporada 2008/2009 fins la temporada 2015/2016.

Membres de l'equip

Carlos Molina - @KRLSMolina

Carlos Gómez

Dataset

El dataset original es pot descarregar a la web data.world i ocupa uns 300Mb. Donada la limitació que té Github, aquest dataset original no s'ha pogut pujar pero pel bon funcionament del codi implementat al repository, hem de descarregar el dataset i desar-ho al directory data\soccer_database.sqlite.

Codi

El codi es presenta en format Jupyter Notbook seguint els punts de l'enunciat de la pràctica. Al directori codi/ es troba el fitxer amb tot el codi realitzat juntament amb parts explicatives del que s'està fent.

Fitxer ouptut

Els fitxers amb les dades obtingudes es troben a la carpeta data/output/df_XXX.csv

Full de respostes de l'exercici

El full de respostes de l'exercici es troba a pdf/practica02.pdf o en format html pdf/practica02.html

About

Anàlisi sobre les dades de partits de futbol a les lligues europees

License:Creative Commons Attribution Share Alike 4.0 International


Languages

Language:HTML 51.2%Language:Jupyter Notebook 48.8%