Dev: Ronny Jhancarlo Gago Pizarro
-
Descargar el dataset:
- Descargar el dataset dentro de la carpeta
src
en el siguiente link.
- Descargar el dataset dentro de la carpeta
-
Descomprimir el dataset:
unzip tweets.json.zip
-
Crear entorno de desarrollo:
python3.9 -m venv venv
-
Activar entorno de desarrollo:
source venv/scripts/activate
-
Instalar librerías y paquetes utilizados:
pip install -r requirements.txt
- Crear bucket en GCP:
PROJECT_ID=$(gcloud config get-value project) gsutil mb gs://$PROJECT_ID-challenge-latam
- Copiar dataset al bucket en GCP:
gsutil cp src/farmers-protest-tweets-2021-2-4.json gs://$PROJECT_ID-challenge-latam
- Desplegar cloud function:
gcloud functions deploy data-extract-test \ --allow-unauthenticated \ --region us-east1 \ --timeout 540 \ --runtime python39 \ --project $PROJECT_ID \ --trigger-http \ --entry-point main \ --memory=2048MB \ --source ./