Adalab / bda-modulo-3-evaluacion-final-RaquelPedraza

bda-modulo-3-evaluacion-final-RaquelPedraza created by GitHub Classroom

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

bda-modulo-3-evaluacion-final-RaquelPedraza

bda-modulo-3-evaluacion-final-RaquelPedraza created by GitHub Classroom

Descripción General

Este proyecto está enfocado en demostrar los conocimientos adquiridos en el Módulo 3, 'Transformación de Datos'.
Se abordan problemas de limpieza de datos, visualización y análisis estadístico para proporcionar información valiosa de los datos a analizar.

Fases del Proyecto

Fase 1: Exploración y Limpieza de Datos

  1. Exploración Inicial
    Objetivo: Identificar posibles problemas en los datos, como valores nulos, atípicos o datos faltantes.

Tareas:

  • Utilizar funciones de Pandas para obtener información sobre la estructura de los datos.
  • Unir los dos conjuntos de datos proporcionados.
  1. Limpieza de Datos
    Objetivo: Asegurar que los datos estén completos, consistentes y preparados para el análisis.

Tareas:

  • Eliminar o tratar valores nulos.
  • Verificar la consistencia y corregir los datos.
  • Ajustar o convertir tipos de datos según sea necesario.

Fase 2: Visualización

Objetivo: Usar visualizaciones para responder preguntas específicas sobre los datos.

Tareas:

  1. Distribución de vuelos reservados por mes.
  2. Relación entre la distancia de los vuelos y los puntos acumulados.
  3. Distribución de clientes por provincia o estado.
  4. Comparación del salario promedio entre diferentes niveles educativos.
  5. Proporción de clientes con diferentes tipos de tarjetas de fidelidad.
  6. Distribución de clientes según estado civil y género.

Fase 3: Evaluación de Diferencias en Reservas de Vuelos por Nivel Educativo

  1. Preparación de Datos
    Objetivo: Filtrar datos relevantes para el análisis.

Tareas:
Incluir columnas relevantes: 'Flights Booked' y 'Education'.

  1. Análisis Descriptivo
    Objetivo: Calcular estadísticas descriptivas para vuelos reservados según nivel educativo.

Tareas:
Agrupar por nivel educativo y calcular promedio, desviación estándar, percentiles.

  1. Prueba Estadística
    Objetivo: Determinar si existen diferencias significativas en vuelos reservados entre niveles educativos.

Tareas:
Realizar prueba de hipótesis.

Datos Utilizados
Customer Loyalty History.csv: Historial de fidelidad de clientes.
Customer Flight Activity.csv: Actividad de vuelos de clientes.

About

bda-modulo-3-evaluacion-final-RaquelPedraza created by GitHub Classroom


Languages

Language:Jupyter Notebook 100.0%