Alejandro-Casanova / Practicas_Ciencia_de_Datos

Mi solución a los ejercicios de la asignatura Ciencia de Datos, del máster de Software de Sistemas Distribuidos y Empotrados de la UPM.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Prácticas de la asignatura "Ciencia de Datos"

Máster en Software de Sistemas Distribuidos y Empotrados, Universidad Politécnica de Madrid

Ejercicio 1: Objetos en R y Análisis Estadístico Básico.

El objetivo de este ejercicio es familiarizarse con las funcionalidades básicas de R y las principales operaciones de análisis estadístico.

Ejemplo regresión lineal

Ejercicio 2: Segmentación de Datos - Clustering

Partiendo de una serie de datos poblacionales, se requiere hacer una segmentación en función de la variables "Edad", "Número de años de educación" y "Nivel de ingresos". También se tendrá en cuenta la relación de la variable "Raza" con los resultados de la segmentación.

Segmentación de Datos de educación-edad-ingresos

Ejercicio 3: Series Temporales - ARIMA

Para distintos datasets temporales, ajustar los correspondientes modelos ARIMA o ARIMA-estacional que permitan realizar las mejores predicciones.

Predicción de serie temporal, producción de leche

Ejercicio Final

Clustering:

Tenemos los datos de vinos de España de distintas denominaciones de origen, se requiere hacer una segmentación de vinos españoles en función de precio, calidad y acidez del vino.

Clustering de dataset de vinos (rating-price-acidity)

Series Temporales:

Tenemos los datos del precio de venta del excedente de sistemas fotovoltaicos a la red eléctrica nacional, para distintos periodos de tiempo y con distinta resolución temporal. Se pide ajustar un modelo a la serie y predecir futuros valores.

Predicción de serie temporal, precio de excedente eléctrico

About

Mi solución a los ejercicios de la asignatura Ciencia de Datos, del máster de Software de Sistemas Distribuidos y Empotrados de la UPM.

License:MIT License


Languages

Language:R 100.0%