Регистрация / Вход
Прислать материал

Интерпретация графической информации посредством применения искусственных нейронных сетей на примере задачи распознавания автомобильных номеров

ФИО
Звонецкая Евгения Владимировна
Электронная почта
e36443e100bf4eugenezvon@gmail.com
Номинация
Информационные технологии
Институт
Институт информационных технологий и автоматизированных систем управления (ИТАСУ)
Кафедра
Информационные системы
ФИО научного руководителя
к.т.н. Танцов Петр Николаевич
Академическая группа
ИС-13
Наименование тезиса
Интерпретация графической информации посредством применения искусственных нейронных сетей на примере задачи распознавания автомобильных номеров
Тезис

В наши дни широкое распространение получили нейронные сети – самообучающиеся системы, имитирующие деятельность человеческого мозга.

В данной работе представляется информационная система, основанная на нейросетевой технологии, анализирующая изображения. В качестве примера была выбрана актуальная задача распознавания автомобильных номеров в условиях шума.

Система обрабатывает фотографию автомобиля. Задача системы – определить наличие государственного регистрационного знака автомобиля и, в случае положительного ответа, распознать его. Сложность задачи состоит в том, что изображения могут иметь разное разрешение, а автомобиль снят в произвольном ракурсе. Для этого был разработан блок предварительной обработки изображения.

Самым распространённым способом фильтрации (в данном случае с целью удаления ненужной информации) является бинаризация изображения, на котором впоследствии специальный алгоритм пытается найти светлые прямоугольные области, для нахождения нужной, содержащей номер автомобиля (рис. 1).

Рисунок 1 - Бинаризированное изображение автомобиля

После определения множества областей, требующих анализа, начинается второй этап обработки изображения. Каждая выделенная область анализируется отдельно, разбивается на отдельные символы,при их наличии (рис. 2), и каждый символ распознаётся заранее обученной нейронной сетью. Пустые области пропускаются.

Рисунок 2 - Автомобильный номер, декомпозированный на отдельные символы

Изображение каждого символа раскладывается на сетку заданного размера (20х20). Цвет каждой ячейки сетки шифруется 0 или 1 (белый и чёрный соответственно), после чего записывается в массив (400 элементов). Полученный массив {x1,x2,...x400}, содержащий полную информацию о символе, подставляется на вход нейронной сети, выход которой указывает, какой символ находится на изображении.

В процессе разработки блока распознавания была определена оптимальная архитектура нейронной сети (многослойная нейронная сеть, имеющая два скрытых слоя) выбран метод обучения (метод сопряжённых градиентов). Проведено обучение и тестирование работы нейронной сети в условиях зашумления входных данных — фотографий с грязными номерами и нечёткими изображениями.

В результате, процент успешного распознавания автомобильных номеров на изображении, при их наличии, составил 90%.

Разработанная система в дальнейшем может применяться для анализа различного вида информации и решения задач управления устройствами и движущимися механизмами.

Научный руководитель - к.т.н., Танцов П.Н.