Регистрация / Вход
Прислать материал

Исследование методов сегментации изображения документа в видеопотоке, полученного с камеры мобильного телефона

ФИО: Савельев Б. И.

Направление: Информационные технологии

Научный руководитель: к.т.н., доц. Полевой Дмитрий Валерьевич

Институт: Институт информационных технологий и автоматизированных систем управления

Кафедра: Кафедра Инженерной кибернетики

Академическая группа: ММ-12-1

В настоящее время, большинство информации все еще записывается, хранится и распространяется в бумажном виде. Широкое использование компьютеров для редактирования документа, с внедрением ПК и текстовых редакторов в конце 1980-х годов, имело эффект увеличения, а не уменьшения объема информации на бумажных носителях. Однако, это не всегда удобно, работать с бумажным носителем, для решения этой проблемы существуют методы перевода бумажных документов в электронный вид. Благодаря быстро развивающимся технологиям, мобильные устройства стали мощными и легкодоступными, что позволяет использовать их в качестве устройства для получения изображения. Автоматический или автоматизированный перевод бумажных документов в электронный вид включает в себя процесс, состоящий из трех этапов:

• Получение изображения бумажных документов;

• Распознавания их содержимого с помощью специальных программ, называемых системами оптического распознавания символов (Optical Character Recognition, OCR)

• Размещение полученного содержимого на устройствах хранения.

Сегментация – важный этап обработки документа при распознавании. Его целью является разделение изображения на однородные зоны, например, содержащие только текст, таблицы, графику или разделители. Во многих случаях точность работы OCR-системы сильно зависит от точности работы применяемых алгоритмов сегментации. Для отсканированных документов задачу распознавания изображения можно считать решенной, однако для мобильных устройств существует своя специфика. Качество изображений, полученных с камер мобильных телефонов, ниже качества изображений, полученных путем сканирования документа. Для повышения точности распознавания может использоваться не один кадр, а видеопоток (последовательность нескольких кадров).Задача сегментации изображений все еще остается актуальной, так как универсальных методов обработки изображений еще не найдено, что требует проводить активную деятельность в этом направлении. В работе исследуются методы сегментации отсканированных документов, документов, полученных с фото- и видеокамеры, обнаружения текста на фотоснимке. Также рассматриваются решения проблем, связанных с искажением изображения.