Регистрация / Вход
Прислать материал

Анализ влияния искажений в сжатых изображениях на алгоритмы выделения и распознавания лиц

Сведения об участнике
ФИО
Стефаниди Антон Федорович
Вуз
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Ярославский государственный университет им. П.Г. Демидова»
Тезисы (информация о проекте)
Область наук
Информационные технологии и вычислительные системы
Раздел области наук
Информационные технологии
Тема
Анализ влияния искажений в сжатых изображениях на алгоритмы выделения и распознавания лиц
Резюме
В данной работе рассматриваются существующие виды цифровых и аналоговых искажений. Детально исследуются современные стандарты обработки и их влияние на качество изображений. Проводится обзор существующих алгоритмов детектирования и распознавания лиц. Программно реализуются и тестируются 3 алгоритма сжатия, 4 детектора и 5 алгоритмов распознавания лиц. Анализируется влияние искажений, возникающих в результате работы стандартов сжатия, на алгоритмы детектирования и распознавания. В конце работы формируются выводы и рекомендации, которые могут быть использованы в системах охранного телевидения, видео аналитики, обработки и передачи мультимедийной информации.
Ключевые слова
цифровая обработка сигналов, техническое зрение, алгоритмы сжатия цифровых изображений, детектирование и распознавание объектов, оценка качества видеоданных
Цели и задачи
Цель: исследование влияния искажений, вносимых современными алгоритмами сжатия изображений, на работу алгоритмов детектирования и распознавания лиц
Решаемые задачи:
1. Изучение базовых и современных стандартов сжатия группы JPEG;
2. Реализация алгоритмов обработки и сжатия с использованием системы компьютерного моделирования MATLAB;
3. Исследование методов детектирования и распознавания объектов;
4. Реализация алгоритмов выделения и распознавания объектов применением среды разработки Microsoft Visual Studio;
5. Проведение экспериментальных исследований над тестируемыми базами изображений по ряду объективных критериев оценки качества;
6. Исследование зависимости работы алгоритмов детектирования и распознавания от степени качества тестируемой базы;
7. Формулировка выводов и результатов
Введение

Одним из сопутствующих факторов компьютерной революции оказалось появление совершенно новых областей исследования. С каждым годом по мере увеличения быстродействия, уменьшения стоимости и размеров интегральных схем растут  возможности решения задач все возрастающей сложности. К ним относится техническое зрение, требующие значительных вычислительных ресурсов. Системы компьютерного зрения решают такие сложные задачи, как обнаружение людей, распознавание лиц и анализ эмоций.  Серьезной проблемой для таких систем является зависимость от такого важного фактора, как качество анализируемого изображения. Поэтому необходимо создать баланс между уровнем верного детектирования/распознавания и степенью сжатия обрабатываемой информации. 

Методы и материалы

Для решения поставленной цели был произведен анализ уже существующих методов выделения и определения объектов, теории цифровой обработки сигналов, новых подходов к решению задач обработки изображений и видео, а также инструментов компьютерного зрения и машинного обучения. В процессе исследования была создана собственная  тестовая база из 44 178 изображений. Для практической реализации алгоритмов применялись современные вычислительные методы и методы объектно-ориентированного программирования на языках C++ и Python. Анализ и тестирование алгоритмов проводилось с использованием среды разработки Microsoft Visual Studio и системы компьютерного моделирования MATLAB. Результат решения требует совместимости с существующими ПО. Выполнение проекта происходило на базе лаборатории компьютерного зрения в ЯрГУ, оснащенной необходимой вычислительной оргтехникой и элементами видео аналитики.

 

Описание и обсуждение результатов

                                                               Таблица 1. Используемые аббревиатуры

 Метрики оценки качества                           

  Алгоритмы сжатия                       

      Алгоритмы детектирования

                   Алгоритмы распознавания

ПОСШ – пиковое отношение сигнал шум

JPEG

Виолы-Джонса

ЛБШ – метод локально бинарных шаблонов

КСП – коэффициент структурного подобия

JPEG2000(JP2)

ЛБШ – метод локально бинарных шаблонов

ЛКШ -  метод локально квантованных шаблонов

-

JPEGXR(JXR)

АРД – детектор на основе ансамблей решающих деревьев

МГК – алгоритм на основе метода главных компонент

-

-

-

ЛДА – метод на основе линейного дискриминантного анализа

-

-

-

ЛКШ-Г – метод локально квантованных шаблонов с использованием фильтров Габора

 

Основные выводы:

  • Установлено, что стандарты сжатия JPEG2000 и JPEGXR способны сохранять отличное качество изображения как при малой, так и при сильной степени компрессии. 
  • Численная оценка показала, что стандарт JPEG проигрывает более гибким алгоритмам обработки по шкале оценок:ПОСШ —2-6 дБ, КСП —0,01-0,18;
  • При исследовании алгоритмов детектирования Виолы-Джонса, ЛБШ и АРД была доказана зависимость уровня верного детектирования лиц от качества обрабатываемых данных;
  • Используемая реализация алгоритма детектирования Виолы-Джонса, оказалась самой не эффективной, так как имеет огромное количество детектированных объектов,  из которых в среднем 40%  это  ложные срабатывания;
  • Наилучшие показатели по уровню детектирования лиц и робастности показала связка JPEG2000(JXR) – АРД, способная при сильной степени сжатия данных K = 50 работать без ухудшений, выдавая при этом уровень ложного обнаружения менее 1%.
  • Было доказано, что на работу алгоритмов МГК и ЛДА не влияет ухудшение качества обрабатываемых данных. Однако уровень верной идентификации, который показывает МГК в 80% и ЛДА в 70% не достаточен для решения современных задач в области распознавания лиц;
  • Во время исследования плохие результаты по распознаванию показал алгоритм ЛБШ. При степени сжатия K = 20 уровень верной идентификации составляет менее 50%. Поэтому для систем идентификации личности, где важными факторами является устойчивость алгоритма к искажениям, такой алгоритм не подходит;
  • Лучшие результаты, с точки зрения робастности и уровня верного распознавания, показали алгоритмы ЛКШ-Г и ЛКШ. Однако ЛКШ-Г оказался самым требовательным к вычислительным ресурсам. Алгоритм ЛКШ работает в 7 раз быстрее;
  • Для создания быстрой и не требовательной к вычислительной мощности системы распознавания лиц, способной работать в режиме realtime, лучше всего использовать связку JPEGXR – ЛКШ. Она способна устойчиво работать, сохраняя уровень верной идентификации не менее 85% при степени сжатия K = 30;
  • В ситуациях, когда необходимо как можно сильнее сжать данные, а скорость  обработки данных системой распознавания не имеет значения, лучше воспользоваться связкой JPEG2000 – ЛКШ-Г, так как она способна сохранять уровень верной идентификации более 85% при степени компрессии K = 65. 
Используемые источники
1. Стефаниди А.Ф., Хрящев В.В., Петров Г.Д. Анализ искажений, вызванных сжатием в задачах технического зрения // Радиоэлектронные устройства и системы для инфокоммуникационных технологий – РЭУС-2016: сб. докл. междунар. конф. - Москва, 2016. Т. 2. С. 502-506
2. Лебедев А.А, Стефаниди А.Ф., Ганин А.Н., Матвеев Д.В. Использование гистограмм направленных градиентов для детекции головы человека с купольных камер // Цифровая обработка сигналов и ее применение (DSPA-2016): докл. 18-й междунар. конф. – Москва, 2016. Т. 2. С. 724-729.
3. Стефаниди А.Ф., Хрящев В.В. Анализ влияния артефактов сжатия на алгоритмы распознавания лиц // 69 всероссийская научно-техническая конференция студентов, магистрантов и аспирантов высших учебных заведений с международным участием: Сборник материалов конф. [Электронный ресурс]. – Ярославль: Издат. дом ЯГТУ, 2016. С. 1622-1625.
Information about the project
Surname Name
Stefanidi Anton
Project title
Analysis of influence distortions in compressed images on the face detection and recognition algorithms
Summary of the project
The effect of compression artifacts on the performance face detection and recognition algorithms. Analyze the influence quality of the test image to the level correct identification object. The findings obtained in the course of the work performed, can be used in machine vision systems.
Keywords
digital signal processing, machine vision, digital image compression algorithms, detection and recognition objects, comparison quality of video data