bernatsort / Structured_Perceptron_NLP

Part Of Speech usando un Perceptrón Estructurado

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Part Of Speech usando un Perceptrón Estructurado

Construir un perceptrón estructurado y entrenarlo para hacer una predicción de Part Of Speech usando el dataset CoNLL-2003. Es un dataset que contiene secuencias de frases en ingles extraídas de libros y la entidad de cada palabra (nombre, vervo, determinante, etc.) correspondiente al POS.

Objetivos:

1. Entrenar un perceptrón estructurado para predecir Part Of Speech usando el dataset ConLL.

Además, responder a las siguientes preguntas:

  • 1.1. ¿Cuántos features tiene el feature mapper? ¿Qué representan?
  • 1.2. En una secuencia de entrenamiento, ¿cuántos tipos de features encontramos en una secuencia? ¿Qué nos indican?
  • 1.3. Cuando construimos el SP, ¿cuántos estados posibles tiene y por qué?
  • 1.4. Cuando construimos el SP, ¿cuántos parámetros tiene y por qué?

2. Comparar los resultados con el HMM entrenado con el mismo dataset usado en la sesión 2 en clase.

3. Comprovar si el perceptrón estructurado clasifica correctamente una palabra que no ha visto en el entrenamiento.

About

Part Of Speech usando un Perceptrón Estructurado


Languages

Language:Jupyter Notebook 100.0%