Análisis de metadata extraída de Stack Overflow a través del paradigma MapReduce de Big Data
Usar pip para instalar dependencias
pip install -r requirements.txt
python3 main.py
Este ejemplo de implementación de MapReduce nos permite conocer tres resultados:
- Top 10 posts más vistos
- Top 10 de palabras más mencionadas en los posts agrupadas por tipo de post
- Tiempo de respuesta promedio eligiendo los primeros 300 y 400 por score de ranking