BertaVives / Analisis-de-la-insuficiencia-cardiaca

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

EDA: Análisis de la insuficiencia cardíaca

Descripción

Las enfermedades cardiovasculares son la primera causa de muerte en todo el mundo. Representan el 31% de muertes en el mundo, de las cuales la insuficiencia cardíaca es una de las causas más comunes. Este trabajo se basa en analizar como varía la posibilidad de muerte por insuficiencia cardíaca según doce características.

Datos

El conjunto de datos contiene las siguientes características:

  • age: indica la edad de cada uno de los pacientes.
  • anaemia: informa de los pacientes que sufren de anemia.
  • creatinine_phosphokinase: muestra el nivel de la enzima creatina fosfoquinasa (CPK) en la sangre de cada paciente [mcg/L].
  • diabetes: indica los pacientes que tienen diabetes.
  • ejection_fraction: muestra el porcentaje de sangre que sale del corazón en cada contracción.
  • high_blood_pressure: indica si el paciente sufre de hipertensión.
  • platelets: presenta el número de plaquetas en la sangre de cada paciente (kiloplaquetas/mL).
  • serum_creatinine: indica el nivel de creatinina sérica en sangre (mg/dL).
  • serum_sodium: indica el nivel de sodio sérico en sangre (mEq/L).
  • sex: informa del género de cada paciente.
  • smoking: indica que pacientes fuman.
  • time: muestra los días que seguimiento de cada paciente.
  • DEATH_EVENT: informa de que pacientes han sufrido una insuficiencia cardíaca.

Estructura de carpetas

├── README.md         
│                      
└── src                
    ├── notebooks
    │   └── data-import.ipynb
    │   └── extras.ipynb
    |
    └── EDA.ipynb

Pasos del proyecto

  1. Introducción

  2. Análisis Exploratorio de Datos

    2.1. Limpieza de datos

    2.2. Feature Engineering

    2.3. Análisis de los datos

  3. Visualización de los datos

  4. Conclusiones

  5. Futuros pasos

Resultados

Una vez hecho el análisis de cada una de las características, podemos afirmar que cada una de ellas posee unos valores u otros según el género de cada paciente e influye de cierta forma en la probabilidad de muerte por insuficiencia cardíaca. Cabe destacar que la variable que cuantifica la cantidad de enzima CPK que hay en la sangre es la que menos varia e influye las variables de género y muerte. Pero, por otro lado, la característica que aumenta más de un 50% la probabilidad de muerte es un número muy elevado de creatinina sérica en sangre, lo cual causa un fallo renal.

Futuros pasos

En futuras ocasiones se podría analizar la relación que tiene la edad de cada uno de los pacientes con cada una de las características que pueden provocar una insuficiencia cardíaca, además de la relación entre esta misma variable y la probabilidad de sufrir una parada cardíaca. Asimismo, también sería interesante estudiar qué tipo de relación hay entre los días de seguimiento y el hecho de sufrir un paro cardíaco.

About


Languages

Language:Jupyter Notebook 100.0%