TotalChest / TPC

Practical assignment for the NLP course.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

TPC

Практическое задание по курсу "Основы обработки текстов"

Постановка задачи

Требуется реализовать алгоритм, принимающий на вход текстовый файл с НПА и возвращающий JSON объект, содержащий извлеченные метаданные.

Алгоритм должен поддерживать следующие типы метаданных:

  1. тип документа;
  2. номер документа;
  3. дата принятия;
  4. название документа;
  5. орган, принявший акт.

Структура репозитория

  • train - тексты для обучения;
  • Description.pdf - подробное описание задачи;
  • eval_module.py - скрипт для оценки качества классификации;
  • solution.py - мое решение задачи.

About

Practical assignment for the NLP course.


Languages

Language:Python 100.0%