andresmore / EverydaySexismScraperEspanol

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Scraper - Everyday sexism en español

Este proyecto permite realizar el scraping de la página Everyday sexism para obtener los testimonios de relatos de sexismo en la vida cotidiana narrados por mujeres de los paises que hablan Español, disponibles en el sitio web: Argentina, España y México.

Mi objetivo al crear este scraper es proveer un conjunto de datos fácilmente procesables por cualquier persona interesada en el tema, para que puedan realizar análisis de texto, minería de datos, visualizaciones, etc. y así poder construir herramientas que ayuden a visibilizar y entender este fenómeno.

Todos los créditos de los testimonios obtenidos con este scraper deben ser atribuidos a la página Everyday sexism, ya que el objetivo de este proyecto es únicamente facilitar el acceso a los datos.

Uso del scraper

El scraper está escrito en Python y utiliza la librería Scrapy. Para ejecutarlo una vez Python esté instalado, primero debe instalar Scrapy. Puede hacerlo con el siguiente comando:

pip install scrapy

Una vez instalado Scrapy, puede ejecutar el scraper con el siguiente comando:

cd ed_sexism
scrapy crawl sexism_mex_arg_es -o output.json

En el repositorio, el archivo output.json contiene la salida ejecutada el dia 08/03/2024

About


Languages

Language:Python 100.0%