Регистрация / Вход
Прислать материал

Адаптивная бинаризация с использованием кратномасштабной обработки изображений

Фамилия
Маталов
Имя
Даниил
Отчество
Павлович
Номинация
Информационные технологии
Институт
Институт информационных технологий и автоматизированных систем управления (ИТАСУ)
Кафедра
Инженерной кибернетики
Академическая группа
ММ-13-2
Научный руководитель
к. т. н., доц. Полевой Д.В.
Название тезиса
Адаптивная бинаризация с использованием кратномасштабной обработки изображений
Тезис

Проблема бинаризации изображений не смотря на свою обширную историю, все еще считается актуальной. Бинаризацей называется перевод серого изображения в изображение, которое содержит только два типа пикселей, как правило, белые и черные. Бинаризация широко применяется как этап предобработки входных данных задачи распознавания. Также, существуют специальные виды компрессии изображений, используемые только с бинарными изображениями, что позволяет решать задачу долговременного архивирования документов. Существующие классические методы имеют свои недостатки. В случае алгоритма глобальной бинаризации Отцу- неустойчивость к неравномерному освещению. В случае алгоритма локальной бинаризации Ниблэка- неустойчивость к отсутствию пикселей обоих классов в исследуемой окрестности.

Целью данной работы является создание алгоритма, который бы с одной стороны являлся более устойчивым к неравномерному освещению документа, а с другой стороны не был бы так зависим от параметров работы алгоритма.

Одновременно мощной и концептуально простой структурой для представления изображения в более чем одном масштабе является пирамида изображений, понятие которой было сформулировано в 1983 году. Пирамида изображений представляет собой набор изображений измененного масштаба, как правило, в два раза, разрешение которого меняется по продвижению на уровень выше. В основании пирамиды лежит исходное изображение. 

Исследуя пирамиду исходного изображения методом Ниблэка, не изменяя размер исследуемой окрестности, найдется хотя-бы один уровень, на котором каждая такая окрестность будет содержать и пиксели фона и пиксели объекта. В таком случае, метод Ниблэка хорошо классифицирует пиксель. С помощью метода Отцу можно сформировать "уверенные пороги", способные уверенно отнести пиксель к фону или объекта. На рисунке 1 представлен фрагмент блок-схемы алгоритма.

 

В данной работе был разработан алгоритм, нивелирующий недостатки алгоритмов Ниблэка и Отцу. В дальнейшем планируется исследовать функционал качества бинаризации с целью минимизации ошибки бинаризации.