AngelValera / CC1920-Practica4

Repositorio para la práctica 4 de la asignatura de Cloud Computing en el Máster de Ingeniería Informática del curso 2019-2020

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

CC1920-Practica4

Máster de Ingeniería Informática.

Curso 2019-2020.

Repositorio para la práctica 4 de la asignatura de Cloud Computing.

En el desarrollo de esta práctica se estudiarán y pondrán en uso diferentes métodos y técnicas de procesamiento de datos para grandes volúmenes de datos. En concreto, el objetivo final será la resolución de un problema de clasificación a través del desarrollo de distintos modelos. Este trabajo implica el diseño conceptual, la programación y el despliegue de distintos modelos, apoyándose en los métodos implementados en la biblioteca MLLib. Para ello habrá que usar hábilmente distintas herramientas de los ecosistemas de Hadoop y Spark, desplegadas sobre distintos escenarios. Una vez diseñados e implementados se comparará el rendimiento de los distintos clasificadores para identificar cuál resulta ser el más adecuado para el problema en cuestión realizando un estudio empírico comparativo.

About

Repositorio para la práctica 4 de la asignatura de Cloud Computing en el Máster de Ingeniería Informática del curso 2019-2020

License:MIT License


Languages

Language:Python 100.0%