Регистрация / Вход
Прислать материал

Модели и методы оценки качества работы алгоритмов поиска и отслеживания объектов в видеопотоке

Сведения об участнике
ФИО
Егоров Алексей Дмитриевич
Вуз
Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Национальный исследовательский ядерный университет "МИФИ"»
Тезисы (информация о проекте)
Область наук
Информационные технологии и вычислительные системы
Раздел области наук
Информационные технологии
Тема
Модели и методы оценки качества работы алгоритмов поиска и отслеживания объектов в видеопотоке
Резюме
В работе приводятся алгоритмы и критерии, которые позволяют определить оптимальные параметры для работы любого алгоритма поиска и отслеживания. В качестве объекта исследования рассматривается система подсчета количества посетителей и целевой демонстрации видео материалов, которая может быть расположена в любой внешней среде. В ядре системы лежат алгоритмы компьютерного зрения, параметры которых настраиваются под внешнюю среду автоматизировано. На модельных и общих примерах подбираются параметры и эффективные модификации для алгоритма Виолы-Джонса и отслеживания по шаблону. Результаты внедрены в коммерческом проекте MirrorBird.
Ключевые слова
распознавание образов, компьютерное зрение, Виола-Джонс, отслеживание по шаблону, качество работы
Цели и задачи
Цель проекта:
Оптимизация работы алгоритмов поиска и отслеживания объектов

Задачи проекта:
1) Анализ параметров существующих алгоритмов поиска и отслеживания объектов в видеопотоке
2) Создание критериев для оценки качества работы алгоритмов поиска и отслеживания объектов в видеопотоке
3) Создание инструмента для автоматизированного подбора параметров алгоритмов поиска и отслеживания
4) Создание подсистемы поиска и отслеживания объектов для АПК Mirror Bird
5) Оптимизация параметров АПК MirrorBird для различных условий внешний среды
Введение

В настоящее время задачи из области компьютерного зрения являются крайне актуальными. Например, автоматизированная система распознавания номеров автомобилей с помощью видеофиксации при движении потока, позволяет повысить безопасность движения. Существуют различные алгоритмы поиска (Виола-Джонс, Фепрари и т.д.), различные алгоритмы отслеживания (по шаблону, цвету и т.д.). У каждого алгоритма множество параметров, которые влияют на работы в различных условиях внешней среды. Кроме того, системы компьютерного зрения обычно располагаются в различных местах, что влияет на качество работы. На основании предложенного автором метода (автоматизированная система) в работе подбираются параметры для описанных выше алгоритмов.

Методы и материалы

В первую очередь рассмотрим алгоритм поиска объектов, как объект исследования. Результаты работы такого алгоритма следующие (в работе описана математическая модель):

1) объект найден успешно;

2) объект не найден;

3) объект найден ложно;

4) двойное срабатывание - один и тот же объект найден несколько раз. 

На основании указанных критериев создан алгоритма оценки точности работы любого алгоритма поиска. В работе введен критерий, который учитывает все указанные критерии, а также среднее время работы системы. 

Во вторую очередь рассмотрим как объект алгоритм отслеживания объектов в видеопотока. На основании исследования введено 12 показателей для оценки совокупной точности работы алгоритмов.  В рамках данной работы для анализа точности использованы только 5 из введенных показателей:

1) Среднее время пребывания объекта в кадре. 

2) Общая ошибка алгоритма отслеживания.

3) Двойные срабатывания.

4) Общая ошибка поиска.

5) Количество найденных объектов.

В работе введен критерий для оценки точности работы алгоритмов поиска и отслеживания на основании показателей. Сравнение проходит при наличие эталонного результата работы на выбранном видеофайле. Подбор оптимального параметра происходит различными методами (Фибонначи, простой перебор) в зависимости от того, какой получается целевая функция при визуальном анализе для выбранного видеофайла. 

Описание и обсуждение результатов

В рамках работы была разработана подсистема поиска и отслеживания лиц в видеопотоке для АПК показа целевого видео материала MirrorBird. АПК является зеркалом со встроеным экраном и веб-камерой, которая показывает видео материал только в присутствии человека. АПК является максимально дешевым в связи с чем, в его ядре используется малопроизводительный системный блок с процессором intel atom 1.5ГГЦ со встроенной видеокартой. 

Для подбора параметров алгоритмов данной системы был создан автоматизированный инструмент оценки качества алгоритмов поиска и отслеживания. 

Для тестирования инструмента было отснят тестовый видео-ролик, для которого создана эталонная разметка объектов в видеоролике. 

Для алгоритма поиска лиц было применено два критерий. На основании применения первого критерия получилось найти наиболее точный алгоритм. Второй критерий учитывал не только точность, но и время работы. В итоге при сокращении точности на 3,3% получается уменьшить время работы более чем в 10 раз, что критично на малопроизводительных системах. 

Для алгоритма отслеживания по шаблону, который является центральным объектом исследования в данной работе, было выбрано несколько параметров и модификаций, которые сравнивались между собой с помощью заранее определенного критерия. В результате удалось подобрать оптимальное значение параметра отсечения слаборкоррелированных объектов в алгоритме отслеживания по шаблону, а также подтвердить эффективность следующих модификаций: адаптации шаблону, цветовая проверка найденного объекта, обрезание по краям. Неэффективной признана модификация, которая удаляет объекты, проекции которых пересекаются на изображении. 

По итогам - получилось увеличить точность работы алгоритма отслеживания при подобранном оптимальном значении параметров в 4,3 раза при таком же времени работы, что позволяет говорить об эффективности выбранной методики работы с алгоритмами поиска и отслеживания и подбора параметров для таких алгоритмов под различные условия внешней среды. 

Аппаратно-программный комплекс MirrorBird размещен в различных заведениях города Москвы. (список представлен в полном тексте работы)

Используемые источники
1. Р. Гонсалес, Р. Вудс. Мир цифровой обработки изображений. М.:Техносфера, 2012, 1104 с.
2. Datta, Ritendra; Dhiraj Joshi, Jia Li, James Z. Wang . "Image Retrieval: Ideas, Influences, and Trends of the New Age". ACM Computing Surveys 40: pp 1-60, 2008.
3. Casas D. Real time face tracking methods: Master's Thesis. / UAdB, 2009. 90 p.
4. P. Viola and M.J. Jones, «Robust real-time face detection», IJCV, vol. 57, no. 2, 2004., pp.137–154
5. Whitehill, J., Omlin, C.W., “Haar features for FACS AU recognition”, AFGR, 2006. FGR 2006. pp. 101-106.
6. Lienhart, R. and Maydt, J., "An extended set of Haar-like features for rapid object detection", ICIP02, pp. I: 900–903, 2002
7. Jin H. [and others], Face detection using improved LBP under Bayesian framework. // ICIG, 2004. P. 306-309.
8. Brunelli R. Template Matching Techniques in Computer Vision: Theory and Practice. – Wiley, 2009. 348 p.

Information about the project
Surname Name
Egorov Alexey
Project title
Performance evaluation frameworks and methods objects search and tracking algorithms in video stream
Summary of the project
The work deals with algorithms and criteria allowing to define optimal parameters for any search and tracking algorithm work. An attendance calculation and target video playback system is an object of research. This system can be based in any kind of environment. The system core includes computer vision algorithms, their characteristics are adjusted to environment in a computer-managed way. Characteristics and effective modifications for Viola–Jones object detection and pattern tracking are selected on model and common examples. The results are implemented into the commercial project MirrorBird.
Keywords
Pattern recognition, template matching, computer vision, Viola-Jones, quality