Практическое задание по курсу "Основы обработки текстов"
Требуется реализовать алгоритм, принимающий на вход текстовый файл с НПА и возвращающий JSON объект, содержащий извлеченные метаданные.
Алгоритм должен поддерживать следующие типы метаданных:
- тип документа;
- номер документа;
- дата принятия;
- название документа;
- орган, принявший акт.
- train - тексты для обучения;
- Description.pdf - подробное описание задачи;
- eval_module.py - скрипт для оценки качества классификации;
- solution.py - мое решение задачи.