data-analysis data-science data-visualization exploratory-data-analysis iris-dataset python seaborn

Análisis Exploratorio de Datos (EDA) del dataset Iris

El dataset Iris es un conjunto de datos de clasificación multiclase clásico y muy sencillo. Introducido por el estadístico y biólogo británico Ronald Fisher en su artículo de 1936 "The use of multiple measurements in taxonomic problems". El conjunto de datos de Iris contiene cuatro características (longitud y anchura de sépalos y pétalos) de 50 muestras de tres especies de flores Iris (Iris setosa, Iris virginica e Iris versicolor).

El objetivo es construir un modelo que utilice las características para clasificar las flores con un máximo de precisión.

Para alcanzar este objetivo, vamos a realizar un análisis exploratorio de datos para comprender los datos y elegir las mejores características. Este notebook se centra en explorar y visualizar el conjunto de datos utilizando bibliotecas como Seaborn y Matplotlib. El procesamiento de datos se realiza con Pandas.

Paquetes utilizados:

Procesamiento de datos: Pandas.
Visualización de datos: Seaborn y Matplotlib.

Referencias:

Instructor:

Joseph Santiago Portilla - Ingeniero Electrónico.

GitHub: https://github.com/JoePortilla
Twitter: https://twitter.com/JoePortilla
LinkedIn: https://www.linkedin.com/in/PortillaJoe
Kaggle: https://www.kaggle.com/joeportilla

About

Análisis Exploratorio de Datos del dataset Iris

https://www.kaggle.com/joeportilla/analisis-exploratorio-de-datos-dataset-iris/

data-analysis data-science data-visualization exploratory-data-analysis iris-dataset python seaborn

MIT License

Languages

Language:Jupyter Notebook 100.0%