SunnyientDev / KD_helper

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Сервис автоматического распознавания согласий о персональных данных

Тема: big data, анализ изображений

Форма владения результатом: open source-продукт (LGPLv3)

Описание задачи: веб-сервисам КД приходится собирать согласия об обработке ПД у участников мероприятий и их родителей (в т.ч. на платформе «Талант»). Значительное число участников загружают вовсе не сканы/фотографии своих заполненных согласий (формы согласий 1 и 2 2020 года, форма 2019 года), а пустые согласия или даже прочие картинки/документы. Необходимо разработать библиотеку, которая позволит автоматически обнаруживать неверную загрузку для последующего встраивания в веб-сервисы КД.

Требования к технологиям/компетенциям:

Код хранится на github

Язык программирования Python

Допустим форк и использование существующих открытых библиотек (без лицензионных противоречий)

Работа с веб-бэкендами aio.http и Django

Этапы работ, результаты и оплата:

Этап 1: прототип

Локальный скрипт на Python, который принимает на вход файл в одном из форматов (jpg, png или pdf - на выбор) и возвращает статус документа - является он корректно заполненным согласием или нет.

Срок: 2 недели

Оплата: 50 тыс руб

После 1 этапа происходит выбор лучшего решения.

Этап 2: локальный чекер

Локальный скрипт на Python, который производит пакетный анализ - принимает на вход набор файлов (в любом из трех форматов - jpg, png, pdf) и возвращает csv со статусом распознавания. Проверка производится на базе существующих согласий 2019 года, оценивается число ложных срабатываний и ложных отрицаний.

Срок: 2 недели

Оплата: 75 тыс руб

Этап 3: веб-сервис

Веб-приложение (REST API), которое принимает на вход документ (URL) и возвращает статус распознавания. API документировано. Создана тестовая система для проверки работы API. Для бэкендов aio.http и Django разработаны примеры по интеграции API.

Срок: 2 недели

Оплата: 75 тыс руб

Состав команды (требуемые компетенции):

Аналитик данных/изображений

Бэкенд-разработчик для веб

Минимальное число участников: 2

Рекомендуемые достижения:

Финалисты призеры и победители по направлениям Олимпиады НТИ: БДиМО, ИИ, Финтех и близкие

Хакатоны и проектные школы Практики будущего

Мероприятия и достижения по теме ИИ

Другие конкурсы и достижения по теме

About

License:MIT License


Languages

Language:Python 100.0%