Этот образ включает в себя морфологический анализатор pymorphy2, собранный на базе python:3. Характерной особенностью образа является использование самых свежих доступных словарей
pymorphy2 написан на языке Python (работает под 2.7 и 3.3+). Он умеет:
- приводить слово к нормальной форме (например, “люди -> человек”, или “гулял -> гулять”).
- ставить слово в нужную форму. Например, ставить слово во множественное число, менять падеж слова и т.д.
- возвращать грамматическую информацию о слове (число, род, падеж, часть речи и т.д.)
При работе используется словарь OpenCorpora; для незнакомых слов строятся гипотезы. Библиотека достаточно быстрая: в настоящий момент скорость работы - от нескольких тыс слов/сек до > 100 тыс слов/сек (в зависимости от выполняемой операции, интерпретатора и установленных пакетов); потребление памяти - 10...20Мб; полностью поддерживается буква ё.
Образ является обновляемым, и пересобирается после каждого обновления словаря OpenCorpora в автоматическом режиме через несколько часов после выкладывания словаря на сайте http://opencorpora.org/
Вы можете использовать данный образ как базу для вашего python-приложения работающего с pymorphy2:
# Example
FROM yiivgeny/pymorphy2:0.8
COPY ./your-daemon-or-script.py
CMD [ "python", "./your-daemon-or-script.py" ]
Либо использовать контейнер для запуска желаемых скриптов напрямую:
docker run -it --rm -v "$PWD":/app -w /app yiivgeny/pymorphy2 python your-daemon-or-script.py
Теги соответствуют версиям pymorphy2. Доступные версии:
- latest - последняя стабильная версия
- 0.8