Регистрация / Вход
Прислать материал

Использование нейронных сетей в задачах распознавания дорожных сцен.

Фамилия
Лобанов
Имя
Михаил
Отчество
Генрихович
Номинация
Информационные технологии
Институт
Институт информационных технологий и автоматизированных систем управления (ИТАСУ)
Кафедра
Инженерной кибернетики
Академическая группа
ММ-14-1
Научный руководитель
к. т. н., доц. Полевой Д.В.
Название тезиса
Использование нейронных сетей в задачах распознавания дорожных сцен.
Тезис

Задачи распознавания дорожных сцен очень актуальны в последнее время, поскольку многие компании-производители транспорта вплотную занялись проблемой создания автопилота для автомобилей и других наземных средств передвижения, и поиск оптимального решения до сих пор ведется.

Нейронные сети – крайне популярный математический аппарат, начавший активно применяться для решения различных проблем распознавания образов с середины 2000-х годов. Популярность данных систем обоснована тем, что с появлением парадигмы глубинного обучения, автоматизирующей процесс выбора признаков изображения, и увеличением вычислительных мощностей компьютеров нейронные сети находят всё новые области применения и показывают прекрасные результаты.

В работе ставится цель распознавания таких объектов дорожных сцен как пешеход, автомобиль, мотоцикл, дорожный знак. Для этого используются свёрточные нейронные сети архитектуры LeNet, обучаемые с помощью сиамских сетей, представляющих из себя пару параллельных сетей одинаковой архитектуры, принимающих на вход изображение и возвращающих вектор значений признаков, выявленных сетью, и далее сравниваемых между собой. Таки образом входом сиамской сети является пара изображений, а выходом вектор «расстояний» между ними. Это позволяет найти среднее значение вектора признаков для классов обучающей выборки и в дальнейшем использовать его для сравнения с новыми входными данными и вывода результата.

В работе используется библиотека машинного обучения Caffe с открытым исходным кодом, созданная группой компьютерного зрения Калифорнийского университета в Беркли. Для разработки применяются языки программирования Python и C++.

Промежуточным результатом научной работы является проверка работоспособности архитектуры сети на наборе цветных изображений Cifar-10. В дальнейшем планируется формирование обучающей выборки для использования сети с реальными изображениями.