alexagaonaa / WebScraper

Este repositorio contiene todos los archivos referentes al proyecto final, el cual consiste en un Web Scraper de páginas de maquillaje.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

💄 Proyecto final: Web Scraper de maquillaje

Integrantes del equipo:
  • Gaona Amaya Silvia Alexa - https://github.com/alexagaonaa
  • León Morales Guadalupe - https://github.com/guadalupe30
  • ✏️ Descripción del proyecto

    Este proyecto consiste en la creación de un Web Scraper, que es un programa que tiene como finalidad extraer información de sitios web. En este caso en específico, nuestro proyecto tiene como finalidad extraer ciertos datos de sitios de maquillaje para poder hacer una comparación de tipo gráfica, y facilitar la lectura al usuario.

    ☑️ Pre-requisitos

    Para poder ejecutar nuestro proyecto necesitas:
  • Python
  • Anaconda (para poder instalar con mayor facilidad las librerías)
  • JupyterLab (para poder correr el código con un formato visualmente más ordenado)
  • Un chrome driver según la versión de Google Chrome que tengas instalada
  • Google Chrome

    📁 Funcionalidades del proyecto

  • Recolectar datos específicos (nombre y precios) de las páginas: Bellísima, Liverpool y Vorana.
  • Crear un dataframe por sitio con la información recolectada.
  • Convertir cada uno de los dataframes en archivos .csv para facilitar la lectura de ellos.
  • Concatenar todos los dataframes en uno solo para poder comparar los precios de los diferentes productos en cada sitio.
  • Se importan las librerias pertinentes para poder realizar consultas de SQL.
  • Crear gráficas comparando los precios promedio de cada producto en cada sitio web.
  • Crear una gráfica final comparando todos los precios promedio de todos los productos en los 3 sitios web.

    ⁉️ ¿Cómo ejecutar el proyecto?

    1. Instalar las paqueterías necesarias usando la terminal de anaconda
    2. Descargar el web driver (en este caso el chrome driver correspondiente a la versión instalada de chrome)
    3. Abrir el archivo .py en alguna terminal como spyder, o abrir el archivo .ipynb en JupyterLab
    4. Cambiar la ubicación del chrome driver, según donde la hayas descargado
    5. Si gustas cambiar los productos que buscará el Web Scraper, encontrarás algunas variables llamadas "Producto1, "Producto2", y así hasta el "Producto5"
    6. Listo, ahora sólo queda correr las líneas restantes del código, y este se encargará de crear:
      1. Tres archivos .csv (uno por cada sitio web) que rellenará con la información correspondiente de los 5 productos buscados.
      2. Un archivo .csv donde recolectará toda la información de los 3 sitios web
      3. Cinco gráficas(una por cada producto) donde se compara el precio promedio del producto en los 3 sitios web
      4. Una gráfica donde se compararán los precios promedios de todos los productos en los 3 sitios web.
      5. También tendrás la oportunidad de hacer consultas SQL al tener el dataframe final y la librería pandasql.
  • About

    Este repositorio contiene todos los archivos referentes al proyecto final, el cual consiste en un Web Scraper de páginas de maquillaje.


    Languages

    Language:Jupyter Notebook 93.0%Language:Python 7.0%