mxabierto / scraper-sniim

Scraper de precios de productos básicos basado en la pagina del SNIIM.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Scraper Sistema Nacional de Información e Integración de Mercados

Scraper de precios de productos básicos basado en la pagina del SNIIM.

Requerimientos

Datos

Fuente: Sistema Nacional de Información e Integración de Mercados

Secciones:

  • Mercados Agricolas
    • Frutas y Hortalizas
    • Flores
    • Granos basicos
    • Azucar
    • Aceites comestibles
  • Mercados Pecuarios
    • Bovinos: Empacadoras y distribuidoras
    • Aves: Pollo por partes (Empacadoras y distribuidoras)

Esquema colecciones Mongo

Descripción de la estructura final de las colecciones para Mongo

Agricultura

  • Sección: Mercados Agricolas
  • Mongo collection: agricultura
  • Esquema:
{
    "fecha": "mm/dd/yyyy", # String
    "presentacion": "string",
    "origen": "string",
    "destino": "string",
    "precio_min": "float",
    "precio_max": "float",
    "precio_frec": "float",
    "obs": "string"
}

Ganado Aves: Pollo

  • Sección: Mercados Pecuarios
  • Mongo collection: aves_partes_empacadores
  • Esquema:
{
    "fecha": "mm/dd/yyyy", # String
    "pieza": "string",
    "precio_minimo_kg": "float",
    "precio_maximo_kg": "float",
    "frecuencia_kg": "float",
    "empacadora": "string"
}

Ganado Bovino

  • Mongo collection: bovino_cortes_empacadoras
  • Esquema:
{
    "fecha": "mm/dd/yyyy", # String
    "origen": "string",
    "corte": "string",
    "precio_minimo": "float",
    "precio_maximo": "float",
    "empacadora": "string"
}

USO

Instalación

Ejecutar este comando dentro de la carpeta principal para instalar correctamente el scraper.

python setup.py install

Ejecución Local

Para utilizar el scraper en modo de ejecución local se debe correr el siguiente comando.

sniim --no-historial/--historial

Se debera visualizar algo similar a la siguiente imagen:

sniim.png

Parametros

  • --historial: Corre el scraper desde el 2000 hasta la fecha.
  • --no-historial: Corre el scraper solo para el dia en que se ejecuta el comando.

Configuración

Para configurar la conectividad con el servidor Mongo se necesita configurar el scraper con las siguientes variables de entorno:

  • MONGO_HOST: DNS o IP del servidor mongo.
  • MONGO_PORT: Puerto de conexion del servidor mongo.
  • MONGO_USER: Usuario de conexion al servidor mongo.
  • MONGO_PASSWORD: Password para el usuario de conexion al servidor mongo.
  • MONGO_DATABASE: Nombre de la base de datos en el servidor mongo.

Ejecución Docker

Para ejecutar el scraper en una instancia Docker correr el siguiente comando:

docker run --name sniim -e HISTORIAL=true -e MONGO_HOST=172.17.0.2 -e MONGO_PORT=27017 -e MONGO_DATABASE=central -e MONGO_USER=central -e MONGO_PASSWORD=secret -d mxabierto/scrapper-sniim

Configuración

Para configurar la conectividad con el servidor Mongo y modo de ejecución se necesita configurar el scraper con las siguientes variables de entorno:

  • HISTORIAL: Bandera para ejecutar el scraper en modo historial o solo recopilación diaria. (true/false).
  • MONGO_HOST: DNS o IP del servidor mongo.
  • MONGO_PORT: Puerto de conexion del servidor mongo.
  • MONGO_USER: Usuario de conexion al servidor mongo.
  • MONGO_PASSWORD: Password para el usuario de conexion al servidor mongo.
  • MONGO_DATABASE: Nombre de la base de datos en el servidor mongo.

About

Scraper de precios de productos básicos basado en la pagina del SNIIM.


Languages

Language:Python 98.6%Language:Shell 0.7%Language:Dockerfile 0.6%