manuelcastiblan / NLP_with_Python

En este proyecto de GitHhub podrás encontrar parte del material que utilizo para impartir las clases de Procesamiento de Lenguaje Natural con Python.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Procesamiento del Lenguaje Natural, con Python

  • Autor: Ricardo Moya García, PhD
  • Fecha última actualización: 24-11-2021

En este proyecto de GitHhub podrás encontrar parte del material que utilizo para impartir las clases de Procesamiento de Lenguaje Natural con Python.

El contenido compartido es el siguiente:

Tema 1: Introducción

Tema 2: NLP - Conceptos y Preprocesamiento de texto

  • Conceptos: Corpus, Bag of Words (BoW), Tokenización, N-Grammas, Stemming, Lematización, Stop-Words, Parts of Speech, Named Entity Recognition (NER)
  • Normalización de textos: Preprocesamiento

Tema 3: Analisis Automático de texto subjetivo (Clasificación de textos)

  • Introducción: Clasificación de textos con Naive Bayes
  • Clasificación de textos: Algoritmos de aprendizaje para la clasificación
  • Clasificación de textos: Redes Neuronales

Tema 4: Topic Modeling (Clustering)

  • LSI: Latent Semantic Index
  • LDA: Latent Dirichlet Allocation

Instalación del entorno

Para ejecutar los scripts y notebooks de este proyecto es necesario tener creado un entorno virtual con conda (también puede ser con un virtualenv), en el que a parte de tener instaladas las librerías que te instala anaconda por defecto al crear el entorno (numpy, scipy, pandas, matplotlib, scikit, etc) hay que instalar una serie de librerías específicas que se indican en el fichero requirements.txt.

A continuación se muestran los pasos a seguir para crear el entorno virtual con conda por medio de una consola:

Nota: estos mismos pasos pueden realizarse también por medio del Anaconda Navigator.


Instalación Entorno Virtual Conda - DeepLearning

  • Pasos para la creación de un Virtualenv con conda e instalación de las librerías necesarias

1.- Creación del entorno virtual "Python37_NLP" con un python 3.7

>> conda create -n Python37_NLP python=3.7 anaconda

2.- Activar el entorno virtual

>> conda activate Python37_NLP

3.- Instalar librerías especificadas en el fichero requirements.txt:

>> pip install -r requirements.txt
  • En caso de tener algún problema con la instalación de alguna de las librerías, proceder a instalar la librería manualmente de la siguiente manera:
>> pip install nombre_libreria==VERSION

Bonus Track Anaconda

A continuación se muestran algunas acciones extra:

1.- Desinstalar librerías con conda y pip respectivamente:

>> pip uninstall nombre_libreria

2.- Desactivar el entorno virtual (previamente tiene que estar activado)

>> conda deactivate

3.- Eliminar entorno virtual (llamado "Python37_NLP")

>> conda remove -n Python37_NLP -all

About

En este proyecto de GitHhub podrás encontrar parte del material que utilizo para impartir las clases de Procesamiento de Lenguaje Natural con Python.


Languages

Language:Jupyter Notebook 99.8%Language:PureBasic 0.2%