Máster de Ingeniería Informática.
Curso 2019-2020.
Repositorio para la práctica 4 de la asignatura de Cloud Computing.
En el desarrollo de esta práctica se estudiarán y pondrán en uso diferentes métodos y técnicas de procesamiento de datos para grandes volúmenes de datos. En concreto, el objetivo final será la resolución de un problema de clasificación a través del desarrollo de distintos modelos. Este trabajo implica el diseño conceptual, la programación y el despliegue de distintos modelos, apoyándose en los métodos implementados en la biblioteca MLLib. Para ello habrá que usar hábilmente distintas herramientas de los ecosistemas de Hadoop y Spark, desplegadas sobre distintos escenarios. Una vez diseñados e implementados se comparará el rendimiento de los distintos clasificadores para identificar cuál resulta ser el más adecuado para el problema en cuestión realizando un estudio empírico comparativo.