Регистрация / Вход
Прислать материал

Применение графических процессоров в решении задач компьютерного зрения

ФИО
Маталов Даниил Павлович
Электронная почта
0f0977mataloff@gmail.com
Номинация
Информационные технологии
Институт
Институт информационных технологий и автоматизированных систем управления (ИТАСУ)
Кафедра
Инженерной кибернетики
ФИО научного руководителя
доцент, к.т.н. Полевой Д.В.
Академическая группа
ММ-13-2
Наименование тезиса
Применение графических процессоров в решении задач компьютерного зрения
Тезис

Современные архитектуры графических процессоров имеют программируемые шейдеры, а производители видеокарт активно развивают интерфейсы их программирования. Таким образом, появляется возможность использовать параллельную архитектуру графического процессора для программирования алгоритмов, в которых происходят сложные вычисления на больших объемах данных. Большинство алгоритмов решения задач компьютерного зрения использует матрицу значений, представляющих из себя значение интенсивности в конкретном пикселе.

Проблемы использования алгоритмов компьютерного зрения проявляются в виде недостаточной скорости выполнения при большом количестве данных. Именно для решения этой проблемы может использоваться параллельная архитектура графического процессора.

Для решения некоторых задач распознавания образов активно применяются признаки Хаара. Признак Хаара состоит из смежных прямоугольных областей. Эти области позиционируются на изображении, суммируются интенсивности пикселей в выделенных областях, после чего вычисляется разность этих значений. Эта разность представляет из себя значения признака, конкретного размера и расположения прямоугольных областей. Для каждой задачи детектирования объектов на изображении используются свои признаки. Интегральное представление изображения позволяет вычислять признаки за постоянное время. Интегральным изображением в конкретной точке (x,y) называется сумма интенсивностей всех пикселей выше и левее данной точки:

\(ii(x,y)=\displaystyle\sum_{x'\leq x,y'\leq y} i(x',y')\)

где i(x,y) исходное изображение. Используя следующие отношения:

\(s(x,y)=s(x,y-1)+i(x,y)\)

\(ii(x,y)=ii(x-1,y)+s(x,y)\)

(где s(x,y) кумулятивная сумма по строке, s(x,-1)= 0 и ii(-1, y) = 0) интегральное изображение может быть вычислено за 1 проход по исходному изображению.  Построение интегрального изображения позволяет легко вычислить сумму интенсивностей в конкретной прямоугольной области.

Для каждого изображения его интегральное представление является уникальным, таким обзразом, его нахождение на большой базе данных изображений требует больших вычислительных мощностей. Алгоритм нахождения интегрального представления можно перенести на параллельную архитектуру графического профессора, что повлияет на время его нахождения. Для параллельной реализации планируется использовать программно-аппаратную архитектуру параллельных вычислений CUDA.

Работа выполняется под руководством доцента, к.т.н. Полевого Д.В.