Регистрация / Вход
Прислать материал

Разработка программного обеспечения для автоматизации системы классификации офисных документов на основе их графического представления

ФИО
Овчинкин Антон Алексеевич
Электронная почта
c8779819ntgi@mail.ru
Номинация
Информационные технологии
Институт
Институт информационных технологий и автоматизированных систем управления (ИТАСУ)
Кафедра
Автоматизированных систем управления
ФИО научного руководителя
к.т.н. Мурадханов Сергей Эдуардович
Академическая группа
МА-12-1
Наименование тезиса
Разработка программного обеспечения для автоматизации системы классификации офисных документов на основе их графического представления
Тезис

Задача классификации документа это задача определения некоторого документа к одной из заранее известных категорий в зависимости от его структуры (паспорт, права, полис и т. д.). Классификация является важным этапом процесса распознавания: используя априорные знания о возможном множестве форм документа, возможно выполнить адаптацию и оптимизацию процесса распознавания. Также классификация документов полезна при разработке систем хранения форматных изображений. Существенным преимуществом использования алгоритмов классификации в индустрии является возможность автоматизации различных процессов.

Был проведен сравнительный анализ методов классификации документов по их изображениям и существующих на рынке решений. При этом было выяснено, что существующие решения нацелены, в основном, на крупные предприятия, в связи с чем экономически-невыгодны для среднего и малого бизнеса. Помимо этого, интеграция данных систем представляет чрезмерно высокую сложность, ввиду того, что такая возможность не предусмотрена интерфейсами программного продукта.

В результате поставлена задача разработки собственной системы классификации изображений с возможностью использования ее в качестве интегрируемого модуля с соответствующими индустрии параметрами точности работы и быстродействия.

В основу предложенного решения легло использование метрики схожести изображений SSIM в сочетании с методами предобработки. В работе были применены методы морфологической обработки – выделение границ документа на фотографии, исправление проективного искажения и последующая кадрирование снимка. В качестве фильтров в работе представлены средства понижения глубины цвета изображения, выравнивание яркости картинки и Гауссово размытие. Также была реализована адаптация положения шаблона класса документа относительно классифицируемого изображения. Такое решение ранее автором не встречалось, ввиду чего претендует на инженерную новизну.

Разработанная в соответствии с данными требованиями система обеспечивает точность порядка 90%. Проработана возможность интеграции данной системы в качестве модуля, а также независимого использования с помощью графического пользовательского интерфейса.

Выполнено под руководством к.т.н. Мурадханова С.Э.