coreference-resolution
Работа по кластеризации имён для новостных текстов на русском языке.
Скрипт "./do.sh" запускает по порядку две грамматики для извлечения имён и далее скрипт для кластеризации.
Директория tes содержит словари ключевых слов.
Директория learn содержит скрипты для обучения вектора весов.
Материалы соревнования factRuEval находятся по адресу https://github.com/dialogue-evaluation/factRuEval-2016. Код Томита-парсера и инструкции по установке доступны по адресу https://github.com/yandex/tomita-parser.