Регистрация / Вход
Прислать материал

14.579.21.0070

Аннотация скачать
Постер скачать
Общие сведения
Номер
14.579.21.0070
Тематическое направление
Информационно-телекоммуникационные системы
Исполнитель проекта
Общество с ограниченной ответственностью "ПАВЛИН Технологии"
Название доклада
Разработка программных средств параллельной обработки и комплексирования двумерных и трехмерных данных для автоматического обнаружения и распознавания объектов
Докладчик
Балухто Алексей Николаевич
Тезисы доклада
Цели и задачи исследования
Цель реализуемого проекта:
Исследование и разработка научно-технических решений, направленных на создание промышленного, конкурентоспособного на мировом рынке программного обеспечения для решения прикладных задач обработки изображений и потоковых данных, включая данные сенсоров, работающих вне видимого диапазона, для задач автоматического формирования модельного описания новых объектов и распознавания образов.
Задача:
Расширение функционала и диапазона рабочих условий интеллектуальных систем безопасности и технического зрения за счет слияния двумерных и трехмерных потоковых данных.
Актуальность и новизна исследования
При создании алгоритмов обнаружения и классификации объектов на 2D- и 3D-изображениях возникают проблемы, свойственные каждая своему случаю размерности данных (двумерные или трехмерные). Проблемы при обработке 2D-изображений связанны с произвольной ориентацией объекта в пространстве и условиями съемки. При обработке 3D-изображений, построенных с помощью трехмерных сенсоров, проблемы связаны со сложностью сцены, ошибками и шумами, недостаточностью информации о границах объектов.
Указанные проблемы в настоящее время не решаются в комплексе. Отдельные работы посвящены различным аспектам данной проблемы, иногда их комбинациям. Это обусловлено тем, что совместное использование двумерных и трехмерных данных было затруднено по техническим причинам, связанным с тем, что трехмерные сенсоры не имели такого широкого распространения, как оптические сенсоры видимого диапазона, такие как фото- и видеокамеры. Более того, до недавнего времени не было устройств, в которых 2D- и 3D-съемка были бы синхронизированы по времени. Сейчас на рынке устройств появляется все больше как трехмерных сенсоров, так и устройств с возможностями синхронизированной 2D- и 3D-съемки. Так как слияние двумерных и трехмерных данных перспективно для задач обнаружения и классификации объектов, а номенклатура устройств с синхронизированной 2D и 3D-съемкой расширяется, то востребованным становится и ПО для автоматического обнаружения и распознавания объектов в 2D- и 3D данных. Принципиальным отличием проведенного исследования от аналогов является формирование алгоритмического базиса для параллельной совместной обработки 2D- и 3D-данных с целью автоматического обнаружения и распознавания объектов на основе слияния этих типов данных.
Описание исследования

Основой научных решений в данных ПНИ, лежит современная парадигма глубинного обучения (глубинные сверточные нейронные сети, глубинные автоэнкодеры). Получателем субсидии получено несколько решений, обладающих научной новизной. Во-первых, разработан новый метод регуляризации процесса обучения глубинных автоэнкодеров для решения задачи классификации образов. Точность классификации при использовании этого метода на общепризнанных тестах превышает мировой уровень на 1% при снижении числа обрабатывающих нейронов в пять раз. Во-вторых, разработан алгоритм детекции пешеходов в потоках двумерных и трехмерных данных с использованием глубинных нейронных сетей. Такой подход до этого не применялся в мировой практике, но показал свою эффективность в сравнении с мировыми аналогами – алгоритм показывает практически одинаковую точность с лучшим зарубежным алгоритмом, однако работает при гораздо более сильных искажениях объектов и не требует аппаратной поддержки для работы в реальном времени, в отличие от зарубежного аналога. В третьих, разработан метод регуляризации для обучения многоярусных разреженных шумоподавляющих автоэнкодеров с целью построения модельного описания объектов, которое используется для шумоподавления и дорисовки изображений. Предложенный метод регуляризации позволяет повысить обобщающую способность модельного описания, что приводит к большей устойчивости использующих его методов шумоподавления по отношению к изменению вида шума. Также, был разработан быстрый алгоритм слежения за целями в потоковых видеоданных, работающий в реальных условиях применения (произвольный ракурс, непостоянное освещение, большая глубина сцены, заслонения и прочее). Данный алгоритм обладает с точностью сопоставимой с современными аналогами, однако, работает в несколько раз быстрее и может быть портирован на IP-камеры. На основе методов глубинного обучения был разработан  детектор «головы-и-плеч» пешеходов, предназначенный для работы в условиях толпы, и который превосходит по точности современные аналоги. Все указанные выше решения опубликованы в научных журналах, индексируемых в базе данных Scopus.

Результаты исследования

Разработанные алгоритмы слияния двумерных и трехмерных данных, а также найденные новые научные решения в рамках парадигмы глубинного обучения позволили достичь высокой точности детекции, классификации и слежения за объектами в потоковых данных в гораздо более сложных условиях съемки и сцены, нежели те, которые рассматриваются в аналогичных работах,  определяющих мировой уровень. При этом, разработанное программное обеспечение, работает практически в реальном времени даже без использования аппаратного ускорения, к использованию которых прибегают в зарубежных работах. При использовании методов распараллеливания вычислений, также разработанных в ходе данной ПНИ, позволяет повысить число обрабатываемых кадров в секунду до уровня 15-20 FPS, что приемлемо для практического использования в системах видеонаблюдения реального времени.

Практическая значимость исследования
Результаты данной ПНИ в виде разработанных алгоритмов и программного обеспечения на их основе будут использованы при создании SDK (Software Development Kit) для интеллектуальной совместной обработки двумерных и трехмерных потоковых данных с целью обнаружения, классификации и слежения за объектами, а также построения статистики перемещений объектов и детекции событий во времени.
В настоящее время апробирование экспериментального образца программного комплекса обработки изображений и потоковых данных производится на потоковых данных, предоставленных Индустриальным партнером, полученных в реальных условиях применения.
Можно спрогнозировать, что результаты ПНИ, окажут влияние на современное научно-техническое состояние в данной области по двум главным направлением. Первое направление – теоретическое. Разработанные методы регуляризации процесса обучения глубинных моделей и их последующее развитие позволит существенно повысить информативность автоматически выделяемых признаков объектов. Второе направление – практическое. Разработанные алгоритмы детекции, классификации и слежения за объектами в комплексированных потоках двумерных и трехмерных данных, и программное обеспечение на их основе, позволит вывести современные системы видеонаблюдения на принципиально новый уровень – за счет относительно небольших затрат на модернизацию сенсоров, станет возможным не только существенное повышение точности в текущих рабочих условиях, но и значительное расширение диапазона рабочих условий таких систем.
Практическое внедрение результатов данной ПНИ, окажет существенное влияние на развитие информационной инфраструктуры городов и объектов общественного пользования за счет получения исчерпывающей статистики о местоположении и перемещении объектов (траектории перемещения, места остановки, длина очереди, контроль габаритов транспортных средств, и др.).
Постер

Poster_template_IT.ppt