greenx / hunspell-ru-surnames

surnames dictionary for hunspell module in elasticsearch

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

hunspell-ru-surnames

Словарь склонения русских фамилий создан для использования с модулем hunspell в elasticsearch.

https://www.elastic.co/guide/en/elasticsearch/reference/master/analysis-hunspell-tokenfilter.html

Создавался, как временное решение при отказе от модуля русской морфологии.

https://github.com/imotov/elasticsearch-analysis-morphology

Базовый файл аффиксов Александра Клюквина https://code.google.com/archive/p/hunspell-ru/ (поэтому такая лицензия)

Правила склонения фамилий:

Из доступного мне набора в 2,6 млн фамилий получилось больше 160 тысяч уникальных фамилий. Были удалены фамилии встречающиеся только один раз (кроме тех что мне обязательно нужны :) ) и несклоняемые фамилии. Осталось около 100500 штук. Порядок оставил по частоте встречаемости.

About

surnames dictionary for hunspell module in elasticsearch

License:GNU Lesser General Public License v3.0