Регистрация / Вход
Прислать материал

14.578.21.0218

Аннотация скачать
Постер скачать
Общие сведения
Номер
14.578.21.0218
Тематическое направление
Информационно-телекоммуникационные системы
Исполнитель проекта
федеральное государственное автономное образовательное учреждение высшего образования "Московский физико-технический институт (государственный университет)"
Название доклада
Исследование и разработка системы оперативного анализа рисков и оценки состояний участников финансовых процессов на основе алгоритмов анализа неструктурированных данных, машинного обучения и выявления аномалий
Докладчик
Добротворский Алексей
Тезисы доклада
Цели и задачи исследования
Вывод на рынок нового поколения специализированных программных комплексов класса AML (Anti-Money Laundering), обеспечивающих выявление подозрительных финансовых операций и процессов, а также оценки состояний их участников на основе новых высокоэффективных и нетребовательных к ресурсам алгоритмов анализа неструктурированных данных, машинного обучения и выявления аномалий.
Актуальность и новизна исследования
Требования по обязательному внедрению процедур противодействия легализации (отмывания) доходов, полученных преступным путем, и финансирования терроризма (ПОД/ФТ) закреплены на уровне федерального законодательства и нормативных документов регулятора: федеральный закон N 115-ФЗ, Уголовный кодекс РФ, нормативные акты Центрального банка РФ. Борьба с отмыванием преступных доходов и финансированием терроризма имеет глобальные масштабы.
Нарушение требований ПОД/ФТ является основным фактором наложения штрафных санкций, чувствительных репутационных потерь и в конечном счете прекращения деятельности финансовых организаций.
Представленные на рынке AML-системы работают по заданным статичным правилам, учитывая, как правило, лишь количественные показатели: сумма транзакций, период, количество. Как следствие, в подобных системах часто возникают ложные срабатывания и ошибки. Более детальный анализ требует использования широкого набора различных программных средств, ручного сбора данных из различных источников.
Предлагаемые к разработке в рамках ПНИЭР решения позволят перейти от анализа по набору правил, к мониторингу на основе принципов и отслеживанию нестандартного поведения клиентов. Данный подход позволит реализовать методы прогнозной аналитики, поиск нестандартных связей, возможность подстраиваться и решать задачи для каждого учреждения, учитывая все уникальные особенности.
Описание исследования

В рамках реализации ПНИЭР будут решены следующие задачи:
1) Разработка алгоритма классификации транзакций на основе машинного обучения (алгоритм КТМО);
2) Разработка алгоритма выявления аномалий при анализе транзакций (алгоритм ВААТ);
3) Разработка метода оценки подозрительных транзакций на основе данных алгоритмов КТМО и ВААТ (метод ОПТ).

Для решения сформулированных задач будут использованы подходы на основе машинного обучения (machine learning) и data mining, в частности выявление аномалий.
Классификация транзакций на основе машинного обучения (алгоритм КТМО) является задачей обучения по прецедентам (указание, какие транзакции являются незаконными, какие нет),
подкласс – задача классификации, в которой после обучения требуется выставить признак, является ли данная транзакция подозрительной или нет (метрические и линейные методы классификации, svm – support vector machine) либо оценить вероятностью того, что она – подозрительная (так называемые, байесовские методы классификации). Для повышения эффективности анализа исходные данные планируется представлять в виде графов, в которых множество вершин – это множество различных физических и юридических лиц со своими атрибутами, множество ребер – взаимосвязи различного вида. К построенному графу применяются различные алгоритмы обработки графов, чтобы для каждого объекта получит набор признаков, которые затем будут использоваться в механизмах машинного обучения.

Для поиска и выявления новых форм незаконных операций будет реализован алгоритм ВААТ. Как и для машинного обучения, для алгоритмов выявления аномалий необходимо выделить признаки, по которым будут выявляться аномалии. В данном случае целесообразно использовать те же признаки, что и в алгоритме КТМО. Вектор признаков (чисел) представляется как точка в n-мерном пространстве (где n – кол-во признаков). Соответственно, большинство точек будет находится близко друг к другу, задача алгоритма – найти необычные точки (выбросы). Выбросы планируется искать при помощи алгоритма k ближайших соседей (K-nearest neighbors algorithm).
Планируется оценить эффективность наиболее передовых методов и алгоритмов выявления аномалий для реализации алгорима ВААТ, в том числе: clustering techniques, unsupervised neural network, fuzzy C-means. Также возможно использование методов статистики для выявления аномалий. Для этого будут построены функции распределения признака как случайной величины, а затем подобраны параметры, по которым можно отсекать выбросы.

Чтобы сделать вывод о том, является исследуемая транзакция подозрительной или нет, результаты работы алгоритмов КТМО и ВААТ требуют интерпретации. Это в первую очередь методическая задача, так как критерии подозрительности для каждой финансовой организации могут варьироваться. Для ее решения будет разработан метод ОПТ, который обеспечит возможность гибкой настройки системы в части классов выявляемых подозрительных транзакций, их признаков на уровне характеристик графов и порогов срабатывания под потребности пользователя.

Предлагаемый подход к решению задач выявления подозрительных транзакций и операций, запрещенных ПОД/ФТ законодательством, в частности использование методов машинного обучения и выявления аномалий является новым. Ожидаемые к получению результаты ПНИЭР способны к правовой охране. Планируется регистрация программной реализации всех созданных алгоримов, а также анализ патентоспособности результатов как изобретения. Описанные подходы к решению задач проекта позволят получить планируемые результаты ПНИЭР, а именно новые методы и алгоритмы выявления подозрительных транзакций, обладающие с одной стороны достаточной ресурсной эффективностью для работы на аппаратных ресурсах средней мощности, которыми располагают финансовые организации, а с другой превосходными показателями по быстродействию и качеству принимаемых решений.

Результаты исследования

В рамках ПНИЭР будут получены следующие научно-технические результаты:
1) результаты анализа современной научно-технической литературы, нормативной, методической литературы, затрагивающей научно-техническую проблему, исследуемую в рамках ПНИЭР;
2) результаты патентных исследований в соответствии с ГОСТ Р 15.011-96;
3) алгоритм классификации транзакций на основе машинного обучения (алгоритм КТМО), обеспечивающий поиск подозрительных транзакций на основе прецедентов из обучающей выборки, собственного опыта или верифицированных результатов алгоритма ВААТ;
4) алгоритм выявления аномалий при анализе транзакций (алгоритм ВААТ), обеспечивающий выявление новых финансовых схем, не имеющих прецедентов, на основе анализа выбросов характеристик исследуемой транзакции в совокупности аналогичных транзакций;
5) метод оценки подозрительных транзакций (метод ОПТ), обеспечивающий интерпретацию результатов анализа транзакций с помощью алгоритмов КТМО и ВААТ и гибкую настройку критериев классификации транзакций как незаконных и подозрительных;
6) программная реализация созданного алгоритмического и методического аппарата в виде экспериментального образца программного комплекса (системы) оперативного анализа рисков и оценки состояний участников финансовых процессов на основе алгоритмов анализа
неструктурированных данных, машинного обучения и выявления аномалий (ЭО ПК АРиОСУФ);
7) техническая (программная) документация на ЭО ПК АРиОСУФ;
8) проект технического задания на ОКР по теме "Разработка системы оперативного анализа рисков и оценки состояний участников финансовых процессов на основе алгоритмов анализа неструктурированных данных, машинного обучения и выявления аномалий";
9) технические предложения по разработке, производству и эксплуатации продукции с учетом технологических возможностей и особенностей индустриального партнера.

Практическая значимость исследования
Разрабатываемые в рамках ПНИЭР алгоритмы и метод планируется использовать в качестве основного математического аппарата для широкого спектра систем:
1. Системы проверки на аффилированность между участниками договорных отношений:
повышение эффективности поиска связей между субъектами договоров, увеличение глубины анализа и оценки вероятности аффилированности;
2.Системы автоматизированной оценки финансовой устойчивости, кредитного риска, вероятности банкротства: ускорение процесса оценки, а также повышения ее качества благодаря использованию в работе дополнительных данных и перекрестных проверок;
3. Системы предварительной оценки будущего поведения клиентов финансовых учреждений: более детальное распределение клиентов по группам поведения в ответ на новые условия сотрудничества, а также повышение точности вероятности событий;
4. Фрод-мониторинг и системы противодействия мошенничеству совершаемых с помощью электронных банковских систем: уменьшение ложных срабатываний на «стандартные» операции пользователей благодаря возможности использовать новых данных позволяющих более точно выявить манипуляции совершаемых злоумышленниками;
5. Решения по обнаружению мошенничества и признаков вовлечения в финансовые/экономические преступления: повышение эффективности поиска сомнительных операции благодаря возможность подключения к оценке «нормальной» деятельности множества косвенных и не связанных параметров, более быстрая настройка процедур за счет адаптации и обучение системы оценки транзакции под новые исследуемые параметры;
6. Системы биржевого технического анализа, биржевого надзора и формирования инвестиционного портфеля: повышение качества прогноза за счет использования дополнительных данных для оценки компаний, применение оценки влияния косвенных показателей на
деятельность и стоимость компаний и др.
Создаваемые алгоритмы реализуют новый подход к оперативному анализу рисков и оценке состояний участников финансовых процессов и являются патентоспособными. В рамках ПНИЭР запланированы мероприятия по охране планируемых научно-технических результатов с целью их дальнейшей коммерциализации.