frfdnpg / generacion_fake_news_gpt2

Generación de texto en formato noticias (titular + articulo) con gpt2 usando la libreria huggingface de python

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

generacion_fake_news_gpt2

Generación de texto en formato noticias (titular + articulo) con gpt2 usando la libreria huggingface de python

Como ejecutar los notebooks

Los notebooks están pensados para ejecutarlos en Google Colab. El entorno de ejecución debe configurarse con GPU.

Datos

Los datos se almacenan en Google Drive y se montan en la sección de Setup de los notebooks. Nosotros hemos trabajado con una carpeta en el inicio de nuestro Drive llamada spainai_webinar, de ahí esta celda en la que cambiamos el directorio de trabajo a esa carpeta os.chdir('/content/drive/MyDrive/spainai_webinar'). La estructura de carpetas debe ser:

 |-data  -> csv de entrada
 |-bows  -> txt con las bags of words de cada temática
 |-generated_headlines -> se escriben los txt con los headlines generados por el gpt-2 con pplm
 |-PPLM  -> carpeta que se crea al clonar al repo del PPLM (aquí se debe dejar el script run_pplm_mod.py

Datasets

About

Generación de texto en formato noticias (titular + articulo) con gpt2 usando la libreria huggingface de python


Languages

Language:Jupyter Notebook 94.0%Language:Python 6.0%