Articles - Статьи, на которых основана данная работа
Vectors - Постороенные векторы признаков лиц с помошью сверточной нейросети (500 классов, 150000+ векторов)
FaceToVector - Скрипты построения признаков лиц
EuclidSearch - Поиск людей по точному евклидову расстоянию
IndexSearc - Структура инвертированного индекса
HierarchicalIndexSearch - Иерархическая стрктура инвертированного индекса
MultiIndexSearch - Структура инвертированного мульти-индекса
Report - Текст работы и презентация
Одной из востребованных областей поиска с Интернете является поиск по изображениям. Современные методы индексации данных показывают отличный результат поиска в многомиллиардных коллекциях и повсеместно применяются для данной задачи. В этой работе предлагается изучить существующие подходы индексации большого количества изображений и посмотреть на поведение этих алгоритмов в задаче распознавания лиц. Будем считать, что современные нейросетевые алгоритмы достаточно хорошо выделяют признаки лица на изображении, и лишь немного затронем этот вопрос. Основной задачей ставим сравнение скорости поиска индексных методов на наборах данных лиц. Начнем рассмотрение с простейших алгоритмов поиска, таких как поиск по точному расстоянию и простая индексная структура. Затем на более продвинутых алгоритмах увеличим скорость поиска и исследуем ухудшение точности. Эксперименты показывают, что в больших коллекция изображений лиц можно добиться приемлемой скорости поиска с хороших показателем точности. Сильное же ускорение приводит к большим потерям.