alondraSanchezM / clustering

Aprendizaje no supervisado: Hierarchical y K-means

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

clustering

Aprendizaje no supervisado: Hierarchical y K-means

Ejercicio A. Clasificación de clientes de cereales para el desayuno

Ejercicio B. Comercialización para viajeros frecuentes


Exploración inicial de los datos

Al no tener conocimientos previos de los datos de los datasets proporcionados, se realiza exploraciones iniciales a este

Limpieza y preprocesamiento

  • Limpieza del dataset
  • Conversión de nombres de cereales a las filas para mejor visualización de los clusters
  • Escalamiento de los datos
  • Evaluación de la estabilidad de los datos mediante la estadística de Hopkins

Agrupamiento jerárquico y k-means

  • Utilizando como criterios de agregación: enlace único, completo y promedio
  • Comparación de dendogramas
  • Correlación de distancias cofenéticas
  • Determinación de k
  • Poda del árbol
  • Observación de centroides
  • Visualización de resultados
  • Generación de muestras
  • Ploteamiento

Actividad para la clase de Mineria de Datos FCC - BUAP | Datasets proporcionados por el profesor


Se recomienda trabajar bajo R 3.5.3 por las librerías consumidas

About

Aprendizaje no supervisado: Hierarchical y K-means


Languages

Language:R 100.0%