Тема: big data, анализ изображений
Форма владения результатом: open source-продукт (LGPLv3)
Описание задачи: веб-сервисам КД приходится собирать согласия об обработке ПД у участников мероприятий и их родителей (в т.ч. на платформе «Талант»). Значительное число участников загружают вовсе не сканы/фотографии своих заполненных согласий (формы согласий 1 и 2 2020 года, форма 2019 года), а пустые согласия или даже прочие картинки/документы. Необходимо разработать библиотеку, которая позволит автоматически обнаруживать неверную загрузку для последующего встраивания в веб-сервисы КД.
Код хранится на github
Язык программирования Python
Допустим форк и использование существующих открытых библиотек (без лицензионных противоречий)
Работа с веб-бэкендами aio.http и Django
Локальный скрипт на Python, который принимает на вход файл в одном из форматов (jpg, png или pdf - на выбор) и возвращает статус документа - является он корректно заполненным согласием или нет.
Срок: 2 недели
Оплата: 50 тыс руб
После 1 этапа происходит выбор лучшего решения.
Локальный скрипт на Python, который производит пакетный анализ - принимает на вход набор файлов (в любом из трех форматов - jpg, png, pdf) и возвращает csv со статусом распознавания. Проверка производится на базе существующих согласий 2019 года, оценивается число ложных срабатываний и ложных отрицаний.
Срок: 2 недели
Оплата: 75 тыс руб
Веб-приложение (REST API), которое принимает на вход документ (URL) и возвращает статус распознавания. API документировано. Создана тестовая система для проверки работы API. Для бэкендов aio.http и Django разработаны примеры по интеграции API.
Срок: 2 недели
Оплата: 75 тыс руб
Состав команды (требуемые компетенции):
Аналитик данных/изображений
Бэкенд-разработчик для веб
Минимальное число участников: 2
Рекомендуемые достижения:
Финалисты призеры и победители по направлениям Олимпиады НТИ: БДиМО, ИИ, Финтех и близкие
Хакатоны и проектные школы Практики будущего
Мероприятия и достижения по теме ИИ
Другие конкурсы и достижения по теме