valerybriz / CursoPandas2020

Curso de pandas usando datos abiertos de carpetas de investigación de la CdMx

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Introducción al análisis y visualización de datos con python

Mariana Esther Martínez Sánchez

Curso básico para análisis de tablas de datos usando python y pandas.

Impartido:

  • Pyladies-México 13 y 14 de febrero de 2020

Requisitos:

  • Saber usar R, SAS, STATA o Excel avanzado.
  • Tener anaconda instalado.
  • Acceso a internet.

Índice

  1. Introducción a python

    1. Instalación de conda
    2. Jupyter notebooks
    3. Introducción a python
  2. Obtención de datos

    1. Descargar datos abiertos
    2. ¿Qué es un dato?
    3. Cargar los datos en python
      • Ubicacion en la carpeta
      • Excel, csv, pickle
  3. Limpieza de datos

    1. Pasos de un análisis de datos
    2. Exploración básica - pandas_profiling
    3. Operaciones básicas de pandas - slicing
      • Estructura de una tabla (index, columns, dtype, nan)
      • select column(s), row(s), head, tail, loc, iloc
      • sort
      • unique, nunique, value_counts
      • select by criteria (==, !=, isin, isna, notna, multiple statements)
    4. Limpieza de datos
      • Quitar columnas (drop, select)
      • Cambiar tipos de datos (datetime)
      • Modificar campos de texto (replace, title, unidecode)
      • Eliminar datos fuera de rango (map, replace)
      • Datos faltantes (fillna)
    5. Guardar datos
      • Excel y cs v * pickle
  4. Gráficación básica

    1. Tipos de gráficas (lines, bars, scatter, hist)
    2. Elementos de una gráfica (title, axis, etc)
    3. matplotlib
  5. Análisis de datos

    1. Estadística básica (count, sum, mean, median, moda, std)
    2. Agrupamiento (groupby, filter, aggregate)
    3. Tablas pivote (pivot_table)
    4. Respondiendo preguntas
  6. Extras

    1. Seaborn (distplot, heatmap, multiples)
    2. Estadística (corr, linear_regresion)
    3. Mapas (geopandas)
    4. Visualización de datos

Recursos útiles

About

Curso de pandas usando datos abiertos de carpetas de investigación de la CdMx

License:MIT License


Languages

Language:HTML 86.4%Language:Jupyter Notebook 13.6%