elvgarrui / Parlamento_PLN

Trabajo de PLN en el que se estudian los distintos fenómenos lingüisticos que se pueden detectar a través de las transcripciones del parlamento andaluz

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Parlamento_PLN

Participantes:

  • Elvira García
  • Alfonso Martínez
  • Andrés Vasco

Contenido:

Pleno parlamentario ==> Pleno en txt

  • document.pdf ==> text.txt

  • document1.pdf ==> text1.txt

  • document2.pdf ==> text2.txt

  • document3.pdf ==> text3.txt

  • sumtext.txt = text.txt+text1.txt+text2.txt+text3.txt

2 Notebooks: - análisis_parlamento.ipynb - clasificador_parlamento.ipynb

Sobre los Notebooks

La versión de Python utilizada es la 3.6 Todos los requisitos para ejecutar el cuaderno están en requirements.txt Para instalarlos, ejecutar el comando pip install -r requirements.txt Después ejecutar python -m spacy download es_core_news_md Y finalmente en la consola de python ejecutar import nltk nltk.download('stopwords') nltk.download('punkt')

Para ejecutar los cuadernos es necesaria la instalación previa de jupyter notebooks.

About

Trabajo de PLN en el que se estudian los distintos fenómenos lingüisticos que se pueden detectar a través de las transcripciones del parlamento andaluz


Languages

Language:Jupyter Notebook 68.9%Language:HTML 31.1%