Регистрация / Вход
Прислать материал

Автоматизированная кластеризация множества изображений

Фамилия
Герк
Имя
Евгений
Отчество
Алексеевич
Номинация
Информационные технологии
Институт
Институт информационных технологий и автоматизированных систем управления (ИТАСУ)
Кафедра
Инженерной кибернетики
Академическая группа
МПИ-16-2-2
Научный руководитель
к.т.н., с.н.с. Курочкин И.И.
Название тезиса
Автоматизированная кластеризация множества изображений
Тезис

Объектом исследования данной работы является задача автоматической кластеризации множества полутоновых изображений структуры криогеля, полученных методами микроскопии. Предполагается воспользоваться методами кластерного анализа k-means и k-medians для разбиения наблюдаемых данных на отдельные кластеры, отличающиеся характерными особенностями, при этом количество кластеров является неизвестным параметром.

Цель работы – нахождение оптимального разбиения исходного множества снимков на непересекающиеся кластеры.

Рисунок 1 – Пример исходных данных

Взглянув на структуру криогеля, можно заметить наличие как высокочастотных и низкочастотных колебаний относительно изображения, так и некоторого шума. На рисунке 1 приведен пример характерных особенностей для четырех изображений. Для выявления данного рода особенностей были выделены следующие характеристики на исходном множестве снимков:

  1. среднее значение – мера средней яркости той области, по которой оно вычисляется;
  2. дисперсия – отклонение от среднего уровня яркости;
  3. величина и направление градиента яркости изображения.

В качестве критериев оптимизации в контексте поставленной задачи выступают оценки качества кластеризации, а именно компактность, отделимость и концентрация полученной кластерной структуры. Для оценки качества кластеризации были использованы следующие относительные метрики:

  1. RS индекс – мера несхожести между кластерами;
  2. VNND индекс – мера однородности кластеров;
  3. индекс оценки силуэта – средняя мера несхожести отдельного элемента с элементами ближайшего кластера;
  4. CS индекс – отношение максимального расстояния между точками в одном кластере к минимальному межкластерному расстоянию.

Результатом данной работы является разработанное программное и алгоритмическое обеспечение, выполняющее:

  1. приведение изображений к одному виду (выравнивание фона, автоконтрастирование);
  2. выделение характеристик;
  3. нормализацию выделенных характеристик;
  4. автоматическую кластеризацию исходного множества;

Разработанный подход был протестирован на множестве из 30 снимков, которое было разбито на 7 кластеров методом k-means, при этом оптимальная кластерная структура определялась максимальными значениями выбранных оценок качества кластеризации.