freeExec / UIK_writer-calc

Парсер данных о избирательных участках представленные в виде документа ODT (LibreOffice)

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Парсер данных о избирательных участках представленные в виде документа ODT (LibreOffice) с таблицей. Или текст с зарание заданными заголовками.

Извлекает из данных номер избирательного участка, адрес, место и телефон проведение выборов, адрес, место и телефон избирательной комиссии.

Использовалось для проекта http://gis-lab.info/qa/uikgeo.html , тестировалось на Ульяновской области.

Для использования указываете количество колонок в нужной таблицы, чтобы найти в документе, сколько строк занимает заголовок таблицы, в каких колонках находятся номер участка, место избирательной комиссии, место выборов.

Рекомендации: * улица с номер дома через пробе не делиться если номер дома с буквой * разделитель элементов ',' или "Новая строка"

Известные ошибки в документах приводящие к краху: * несовпадение ширины колонок после строки с объединяющими колонками, в итоге количество колонок в докементе больше, чем видно - задать ширину колонок везде одинаковой * нумерация стоблцов на каждой странице - ручное удаление * разбиение данных на нестколько строк,данные одного УИКа на несколькоих строках - ручная склейка

Released under MIT licence.

About

Парсер данных о избирательных участках представленные в виде документа ODT (LibreOffice)


Languages

Language:C# 100.0%