snakers4 / russian_stt_text_normalization

Russian text normalization pipeline for speech-to-text and other applications based on tagging s2s networks

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Пример из README выдает другой результат

Oktai15 opened this issue · comments

from normalizer import Normalizer

text = 'С 12.01.1943 г. площадь сельсовета — 1785,5 га.'

norm = Normalizer()
result = norm.norm_text(text)
print(result)

В README:

>>> С двенадцатого января тысяча девятьсот сорок третьего года площадь сельсовета
>>> — тысяча семьсот восемьдесят пять целых и пять десятых гектара

Но выдает:

С двенадцати.один.тысяча девятьсот сорок третий год. площадь сельсовета — тысяча семьсот восемьдесят пять целых и пять десятых гектара.

Спасибо за наводку!
Неудачный фикс функции для деления на предложения, сейчас откачу.