dccuchile / beto

BETO - Spanish version of the BERT model

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Reproducir el test de POS

pboitier opened this issue · comments

Buenas! Estaba queriendo ejecutar el test de Part of Speech en mi máquina. Veo que utilizaron la biblioteca Transformers de Huggingface, pero no encuentro la manera de utilizarla para el problema de POS. ¿Podrían compartir el código conmigo?

También me gustaría utilizar el mismo dataset que ustedes. Ví que listaron el dataset de Español de Universal Dependencies, pero dado que hay tres datasets distintos, no estoy seguro de cual utilizaron.

Gracias!
Saludos, Pedro

Hola Pedro,

En cuanto al dataset, usamos AnCora.
Por otro lado, en cuanto al código, claro que sí. Por ahora el código está en Jupyter Notebooks, trataré de pasarlo a un script para que sea fácilmente reproducible y lo subiré apenas tenga tiempo.

Mientras tanto, cualquier duda de implementación que tengas puedes hacerla, te recomiendo basarte en el ejemplo de NER que tiene HuggingFace.

Saludos!