blanchefort / text_mining

Набор ноутбуков, в которых решаются различные задачи обработки естественного языка (NLP).

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Задачи обработки естественного языка (NLP)

License: MIT

Набор ноутбуков, в которых решаются различные задачи обработки естественного языка (NLP).

Задача бинарной классификации текста: разделение комментариев на токсичный / нетоксичный. Нейросеть реализована с помощью фреймворка Flair.

Бинарная классификация комментариев на: положительный / отрицательный. Преобразование текстов в векторное предствление осуществляется с помощью алгоритма BPE. Модель реализована на фреймворке Flair.

Обучение модели для частеречной разметки текста.

Мультиклассовая классификация товаров по их названиям с помощью модели RuBert, используя библиотеку Transformers от Huggingface.

Дообучение модели BERT Base для NER-задачи.

About

Набор ноутбуков, в которых решаются различные задачи обработки естественного языка (NLP).

License:MIT License


Languages

Language:Jupyter Notebook 100.0%