lasveritas / coreference-resolution

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

coreference-resolution

Работа по кластеризации имён для новостных текстов на русском языке.

Скрипт "./do.sh" запускает по порядку две грамматики для извлечения имён и далее скрипт для кластеризации.

Директория tes содержит словари ключевых слов.

Директория learn содержит скрипты для обучения вектора весов.

Материалы соревнования factRuEval находятся по адресу https://github.com/dialogue-evaluation/factRuEval-2016. Код Томита-парсера и инструкции по установке доступны по адресу https://github.com/yandex/tomita-parser.

About


Languages

Language:Python 52.9%Language:C++ 40.6%Language:Protocol Buffer 5.5%Language:Shell 1.0%