SkullkyAI / ML-CLASIFICACION-TITANIC-KAGGLE

Práctica de clasificación con Machine Learning en el dataset del Titanic, abordando exploración de datos, preprocesamiento, selección de métricas y modelos, con el objetivo de analizar detalladamente los resultados obtenidos.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Práctica de Clasificación con Machine Learning: Titanic

Objetivos

Los objetivos de esta práctica son:

  1. Aplicar los conocimientos adquiridos sobre clasificación, técnicas de imputación de valores faltantes y validación cruzada.
  2. Ser capaz de comparar diferentes modelos de clasificación.
  3. Ser capaz de realizar la búsqueda de hiperparámetros.
  4. Entender e implementar la validación cruzada.
  5. Analizar detalladamente los resultados obtenidos durante el aprendizaje de los diferentes modelos.

Bases de Datos

En esta práctica utilizaremos la base de datos del Titanic. El atributo que predeciremos es "Survived", el cual nos indica si cada pasajero sobrevivió o no.

Enlace a la base de datos: Titanic Dataset

Exploratory Data Analysis (EDA):

  • Análisis de tamaño y tipología de datos.
  • Primera valoración de correlaciones.
  • Análisis del atributo target.

Preprocesamiento:

  • Eliminación de valores nulos.
  • Codificación de variables categóricas.
  • Otras técnicas (PCA, normalización, etc.).

Selección de Métricas:

  • Selección de la mejor métrica para el problema.
  • Visualización de ROC/AUC.

Selección de Modelos con Crossvalidation:

  • Selección del mejor modelo.
  • Búsqueda de hiperparámetros.

Análisis Final

About

Práctica de clasificación con Machine Learning en el dataset del Titanic, abordando exploración de datos, preprocesamiento, selección de métricas y modelos, con el objetivo de analizar detalladamente los resultados obtenidos.


Languages

Language:Jupyter Notebook 100.0%