malakhovks / ken

KEn (Ukrainian, English) - is an NLP-powered network toolkit (Web service with API) for contextual and semantic analysis with document taxonomy building feature | KEn - Мережевий засіб виокремлення термінів з природномовних текстів (Українською та Англійською).

Home Page:https://ken.e-rehab.pp.ua

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Дублюючий символ крапка `.` при обробці тексту з `PDF` файлів

malakhovks opened this issue · comments

Дублюючий символ крапка . при обробці тексту з PDF файлів.

Додати в функцию def text_normalization_default(raw_text) можливість видалення дублюючого символ крапка .

Виправлено

В функцию def text_normalization_default(raw_text) додано можливість видалення дублюючого символу крапка . (а саме заміна на один символ крапка .) при нормалізації тексту.