JoePortilla / IrisDataset-EDA

Análisis Exploratorio de Datos del dataset Iris

Home Page:https://www.kaggle.com/joeportilla/analisis-exploratorio-de-datos-dataset-iris/

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Análisis Exploratorio de Datos (EDA) del dataset Iris

logo

El dataset Iris es un conjunto de datos de clasificación multiclase clásico y muy sencillo. Introducido por el estadístico y biólogo británico Ronald Fisher en su artículo de 1936 "The use of multiple measurements in taxonomic problems". El conjunto de datos de Iris contiene cuatro características (longitud y anchura de sépalos y pétalos) de 50 muestras de tres especies de flores Iris (Iris setosa, Iris virginica e Iris versicolor).

logo

El objetivo es construir un modelo que utilice las características para clasificar las flores con un máximo de precisión.

Para alcanzar este objetivo, vamos a realizar un análisis exploratorio de datos para comprender los datos y elegir las mejores características. Este notebook se centra en explorar y visualizar el conjunto de datos utilizando bibliotecas como Seaborn y Matplotlib. El procesamiento de datos se realiza con Pandas.

Paquetes utilizados:

  • Procesamiento de datos: Pandas.
  • Visualización de datos: Seaborn y Matplotlib.

Referencias:

Instructor:

Joseph Santiago Portilla - Ingeniero Electrónico.