Регистрация / Вход
Прислать материал

Разработка ПО по определению личностных предпочтений пользователей на основе их активности в социальных сетях

Фамилия
Шигабеев
Имя
Илья
Отчество
Маратович
Номинация
Информационные технологии
Институт
Институт информационных технологий и автоматизированных систем управления (ИТАСУ)
Кафедра
Автоматизированных систем управления
Академическая группа
МИТ-13-2
Научный руководитель
д.т.н., проф. Косарев В.А.
Название тезиса
Разработка ПО по определению личностных предпочтений пользователей на основе их активности в социальных сетях
Тезис

Интернет-маркетинг неразрывно связан с анализом социальных сетей, ведь они содержат разнообразные сведения о пользователях и делают эту информацию общедоступной. Использование этих сведений позволяет определить предпочтения пользователей и применить их в сферах предоставления услуг или товаров.

Но, несмотря на общедоступность, информация в социальных сетях неструктурированная, и проанализировать её без использования средств компьютерной обработки естественного языка (NLP) и машинного обучения не представляется возможным.

Цель работы — разработать алгоритмическое и программное обеспечение для определения предпочтений пользователя, на основе публикаций в социальной сети.

В сети содержатся решения задач с использованием NLP, в большинстве своём, они полагаются либо на нейронные сети и глубинное обучение, либо предоставляют только бинарную классификацию.

Методика, которая представлена в работе, предполагает мультиномиальную классификацию входных данных и при этом не использует тяжеловесных алгоритмов, что увеличивает скорость работы и позволяет работать с большими выборками. Основой алгоритма стал Байесовский классификатор, который считается мировым стандартом в фильтрации спама.

Программа уже на собранном обучающем массиве продемонстрировала хорошие результаты классификации: от 60 до 98% правильных определений класса в зависимости от числа классов.

Программа работает напрямую с API twitter, а значит получает информацию без задержек и ошибок. Управляя обучающей выборкой, исследователь получает сведения о настроении, поле, возрасте.

С помощью разработанного ПО, ведётся подсчёт количества публикаций по выбранным тематикам; анализ предпочтений пользователя можно использовать для таргетирования рекламных объявлений и продвижения продуктов в социальных сетях.