Gaussiandra / Retrieval-based-Neural-Speaker

Neural conversational model based on DSSM architecture and HNSW.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Диалоговая система, которая на введённое сообщение способна разумным образом подобрать ответ из заданного списка.

Пример работы алгоритма, обёрнутого в чат-бот в телеграме

Снимок

Описание

  • Модель основана на DSSM архитектуре, где каждый возможный ответ и введёный контекст задается своим вектором.
  • Подходящий ответ определяется благодаря косинусной близости и алгоритму HNSW.
  • Энкодеры имеют одинаковую архитектуру: FastText embedding -> LSTM -> mean-max-last pooling -> Linear.
  • Обучение производится на триплетном лоссе.
  • Был использован Hard Negatives Mining как техника для улучшения сходимости.
  • Данными для обучения стали телеграм беседы. Спасибо за парсинг Fulldis.

About

Neural conversational model based on DSSM architecture and HNSW.


Languages

Language:Jupyter Notebook 100.0%