Регистрация / Вход
Прислать материал

Разработка математической модели и программного продукта для контекстных рекомендаций в сети Интернет

ФИО: Белов А. С.

Направление: Информационные технологии

Научный руководитель: доц. Кожаринов Александр Сергеевич

Институт: Институт информационных технологий и автоматизированных систем управления

Кафедра: Кафедра Инженерной кибернетики

Академическая группа: ММ-12-2

С экспоненциальным ростом цифровой среды все чаще появляется необходимость в рекомендательных системах, которые бы помогали человеку на основании его интересов, предпочтений и вкусов выбрать наиболее близкие ему объекты. Данное направление затрагивает область машинного обучения.

В работе будут использованы алгоритмы коллаборативной фильтрации для построения экспериментальной системы в области музыки. Данные методы дают автоматические прогнозы относительно интересов пользователя по собранной информации о вкусах множества пользователей. Существуют два вида фильтрации: по пользователям и по предметам.

Фильтрация по пользователям (User-based): в этом случае неизвестный рейтинг композиции выставляется на основании рейтингов, которые были проставлены той же композиции пользователями, похожими на данного. Этот подход реализуется в два шага:

• Найти пользователей, которые прослушали такие же песни, как и данный пользователь.

• Предложить песни с максимальным рейтингом среди всех песен, выбираемых похожими пользователями.

Фильтрация по предмету (Item-based): идея метода item-based аналогична идее метода user-based, однако сходство уже ищется по предметам.

В данной работе даны пользователи 1…N и объекты 1…M. Необходимо построить частично определенную разреженную матрицу рейтингов (1), где (2) – оценка пользователем i объекта a. Соответственно, для каждого пользователя существует вектор предпочтений (строки матрицы R) и вектор оценок пользователей для каждого объекта (столбцы матрицы R). Необходимо определить, насколько похожи два вектора вещественных чисел. Предлагается использовать корреляцию Пирсона (3) для двух векторов предпочтений пользователей i и j для определения меры сходства s между ними, где (4) – средний рейтинг, выставленный пользователем i.

Цель работы заключается в прогнозировании оценок (2), зная некоторые уже расставленные оценки (5).

В продолжение работы планируется оптимизировать методы нахождения сходства и улучшить рекомендательный алгоритм, учитывая ряд известных проблем и решений в существующих популярных рекомендательных системах.