TotalChest / MastersThesis

Master's thesis: Generation of handwritten text in Russian

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

MastersThesis

Master's thesis: Generation of handwritten text in Russian

Анотация

Распознавание рукописного текста – это классическая задача информатики, для решения которой в последнее время успешно применяются нейронные сети. Однако, чтобы достичь высокой точности работы, современной нейронной сети требуются не только большие вычислительные ресурсы, но и огромное количество данных для обучения. Один из самых известных способов увеличить объем данных для обучения – аугментация – это генерация дополнительных данных из имеющихся данных. Существуют разные способы аугментировать графические данные – от самых простых, таких, как сдвиг изображения, до самых сложных, в которых данные генерируются с помощью генеративно-состязательных и рекурентных нейронных сетей. В работе рассматриваются различные подходы для генерации примеров рукописного текста с целью улучшения качества его распознавания. Генерация почерка – достаточно сложная процедура, включающая этапы генерации символов, соединения их в слова и финальной обработки. Существует множество родственных работ, описывающих эти этапы для иностранных языков, но не для русского языка. Цель данной работы – обобщить современные подходы в области генерации почерка, разработать подход к аугментации рукописного текста на русском языке и доказать применимость предложенного подхода для повышения качества распознавания почерка. В данной работе рассматриваются как простые алгоритмы генерации, основанные на эвристических подходах, так и сложные нейросетевые алгоритмы генерации почерка.

About

Master's thesis: Generation of handwritten text in Russian