Регистрация / Вход
Прислать материал

Разработка программного обеспечения для автоматического ввода информации с мобильного устройства

ФИО: Манжиков Т. В.

Направление: Информационные технологии

Научный руководитель: к.т.н., доц. Полевой Дмитрий Валерьевич

Институт: Институт информационных технологий и автоматизированных систем управления

Кафедра: Кафедра Инженерной кибернетики

Академическая группа: ММ-12-1

В настоящее время существует множество рутинных задач, которые можно значительно упростить с помощью систем оптического распознавания символов (Optical Character Recognition, OCR). Рассмотрим, например, процесс покупки в конкретном крупном мебельном гипермаркете. Покупателю предлагается:

1) Обойти залы гипермаркета с целью найти интересующие товары.

2) Для каждого интересующего товара записать несколько строк с цифрами: артикул, ряд и место на складе. Для этого предлагается использовать листок бумаги и карандаш.

3) Имея список желаемых товаров, собрать их на складе.

4) Пройти к кассе для оплаты.

Для покупателей второй пункт является очевидным минусом. Для решения этой проблемы подошла бы программа, автоматизирующая описанный процесс. Разумными требованиями к такой программе можно считать доступность для большинства покупателей и время работы на одной этикетке значительно меньшее, чем при ручном вводе. Все известные автору готовые решения обладают существенным недостатком – изображение отправляется на удаленный сервер, где проводятся вычисления, затем результат высылается обратно. Такой подход неудобен тем, что безлимитный мобильный интернет все еще доступен не каждому, поэтому было принято решение писать мобильное приложение, выполняющее все вычисления на устройстве.

Заранее известно, что этикетки достаточно контрастны, подчиняются определенным правилам заполнения, артикулы соответствуют строгим шаблонам. Задачу распознавания отсканированных изображений таких этикеток можно считать в общем случае решенной. Однако при работе с камерой мобильного устройства на изображении появляются геометрические и оптические искажения, цифровой шум и многие другие проблемы, затрудняющие распознавание.

В рамках данной работы разработана программная компонента, состоящая из следующих модулей:

• Модуль получения и первичной обработки изображения

• Модуль наведения и распознавания полей со строками

• Модуль распознавания текстовых строк

• Модуль интегрирования результатов

Программная компонента написана на языке C++, и легко встраивается в программы под мобильные операционные системы. Таким образом решается проблема доступности программы для широкого круга покупателей.