Регистрация / Вход
Прислать материал

Анализ корпоративного сетевого трафика при помощи графовых баз данных

Сведения об участнике
ФИО
Никитин Алексей Васильевич
Вуз
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Ижевский государственный технический университет имени М.Т. Калашникова"
Тезисы (информация о проекте)
Область наук
Информационные технологии и вычислительные системы
Раздел области наук
Информационные технологии
Тема
Анализ корпоративного сетевого трафика при помощи графовых баз данных
Резюме
В работе рассматривается способ проведения анализа событий сетевого трафика корпоративных информационных систем при помощи графовых баз данных. Рассматривается секвенциальный анализ, ассоциативный анализ, построение портрета поведения системы/пользователя, выявление аномалий при помощи сравнения взвешенных графов.
Ключевые слова
Интеллектуальный анализ данных, Data Mining, ассоциативный анализ, секвенциальный анализ, сравнение графов, графовые базы данных, анализ трафика, сетевой корпоративный трафик.
Цели и задачи
Цель работы - исследование возможности использования графовых баз данных для анализа сетевого трафика.
Задачи:
• Разработка программы для представление первоначальных данных в виде графа
• Разработка графовых алгоритмов поиска секвенций и ассоциативных правил
• Разработка графовых алгоритмов формирования взвешенных графов
• Исследование методов сравнения взвешенных графов
Введение

Любая корпоративная сеть состоит из огромного количества событий и сообщений. Так же в последнее время никого не удивляет наличие в корпоративной сети таких устройств, как смартфоны, планшеты и многие другие. С ростом устройств, растёт вероятность взлома, несанкционированного доступа к информации. Появляется необходимость в более производительных решениях для поиска и предотвращения аномального или запрещённого поведения в сети. 

Так как любая сеть легко представляется в виде графа, было сделано предположение, что использование графовых баз данных повысит эффективность и скорость обнаружения сетевых аномалий. Графовое представление делает трафик наглядным и понятным для человека и открывает возможность для применения методов Data Mining.

Методы и материалы

Объектом исследования являются журналы сетевых событий корпоративного интернет-трафика и отправления электронной почты.

Предметом исследования являются алгоритмы секвенциального и ассоциативного анализа, реализация алгоритмов анализа на графах, методы сравнения взвешенных графов.

Методы исследования. В работе были использованы теоретические и экспериментальные методы исследования.

Теоретические методы основаны на теории графов, секвенциальном и ассоциативном анализах, составлении портретов поведения сети.

В экспериментальных исследованиях использовались разработанные методы сравнения графов. 

Описание и обсуждение результатов

Научная новизна полученных результатов определяется впервые проведенными исследованиями, направленными на использование графовых баз данных для реализации секвенциального и ассоциативного анализа сетевого трафика, а также алгоритмом выявления аномалий с использованием сравнения взвешенных графов.

В результат работы были разработаны:

  1. Графовая реализация секвенциального анализа, превосходящая по скорости анализа и объёму хранилища реляционные реализации.
  2. Графовая реализация ассоциативного анализа, превосходящая по скорости анализа и объёму хранилища реляционные реализации.
  3. Методы сравнения взвешенных графов
    1. На основе характеристик графов
    2. На основе характеристик гистрограммы, построенной по весам рёбер графа.

Полученне результаты ползволили до 10 раз увеличить скорость работы севенциального и ассоциативного анализа. А разработанные методы сравнения взешенных графов позволяют с высокой точностью определить принадлежность графа к определённому кластеру (например граф с отклонениями или без).

Результаты данной работы были представленны на XXI Республиканской выставке-сессии студенческих инновационных проектов в г.Ижевск. По результатам выстовки работа получила диплом первой степени и была опубликована в сборнике статей.

 

Используемые источники
Коробейников А.В., Конин А.В., Менлитдинов А.С., Стохастический подход к секвенциальному анализу событий корпоративного сетевого трафика системы CISCO MARS. [Электронный ресурс], URL: http://files.izhtelemed.ru/articles/2013_article_1_blogs_izhtelemed_ru_kav.pdf

И.А. Чубукова, Data Mining: учебное пособие – 2-е изд., БИНОМ. Лаборатория знаний.

Барсегян, А. А., Анализ данных и процессов: учеб. Пособие – СПб.: БХВ-Петербург.

Барсегян А. А., Куприянов М. С., Методы и модели анализа данных: OLAP и Data Mining. — СПб.: БХВ-Петербург.

Robinson, I. and Webber, J. and Eifrem, E. Graph Databases. — O'Reilly Media, Incorporated.

Neo4J Graph Database. [Электронный ресурс] URL: http://www.neo4j.org

Дистель Р. Теория графов — Новосибирск: Издательство института математики, 2002

Гихман И. И., Скороход А. В. Введение в теорию случайных процессов. — М.: Наука.
Information about the project
Surname Name
Nikitin Aleksey
Project title
Analysis of the corporate network traffic using GraphDB
Summary of the project
This paper discusses the method of analyzing network traffic of corporate information systems using graph databases. Discusses sequential analysis, associative analysis, the construction of the portrait of the system behavior, anomaly detection by comparing weighted graphs.
Keywords
GraphDB, analyzing network traffic, sequential analysis, associative analysis, comparing weighted graphs.