Регистрация / Вход
Прислать материал

Алгоритмическое обеспечение машинного обучения для анализа данных по продажам розничной сети

ФИО
Шашин Даниил Александрович
Электронная почта
9f09dd64bdanilsh@mail.ru
Номинация
Информационные технологии
Институт
Институт информационных бизнес систем (ИИБС)
Кафедра
Базовая кафедра "Информационные бизнес системы" (ИБС)
ФИО научного руководителя
доц. Слышкин Василий Витальевич, Хмельков Игорь Александрович
Академическая группа
МИС-14-1
Наименование тезиса
Алгоритмическое обеспечение машинного обучения для анализа данных по продажам розничной сети
Тезис

Информационные технологии, в особенности технологии больших данных, предоставляют новые возможности для создания конкурентного преимущества в ритейле. Объем накапливаемых данных (история покупок, информация с чеков, RFID, iBeacon и т.д.) постоянно растет. Изучение покупательского поведения представляет интерес для ритейла, так как позволяет составить релевантный портрет клиента и делать ему персонализированные предложения.

Ритейл довольно критично относится к аналитическому инструментарию, в частности, потребности в возможностях прогнозирования и выявления скрытых закономерностей в данных. Для анализа больших объемов данных необходимо мощное, точное и гибкое ПО. Несмотря на то, что многие вендоры предоставляют отличное ПО, как правило, эти продукты дороги, требуют высокой квалификации пользователя, и поэтому применяются в основном в головном офисе компании.

Однако, существуют инструменты, которые можно использовать как на уровне головного офиса, так и на уровне торговой точки. Как правило, это инструменты с открытым исходным кодом, например, KNIME, RapidMiner, Python, R. Также есть и общие аналитические сервисы, используемые в основном для интернет-магазинов.

Цель работы состояла в оценке возможности использования инструмента с открытым исходным кодом для анализа данных по продажам розничного ритейла. В работе рассматривается анализ потребительской корзины, используя алгоритмы «мешок слов» (Bag of Words) и «ассоциативные правила» (ARULES). В качестве инструмента анализа использовалась свободная программная среда вычислений «R» с открытым исходным кодом. Объектом анализа служил массив транзакционных данных в текстовой выгрузке с количеством строк порядка 4,4 млн.

По результатам анализа сформированы ТОП100 частых товарных позиций, построены графики зависимости продаж от времени суток, сформированы ассоциативные правила товарных позиций с диапазоном корреляции 0,4 – 0,75. Анализ выполнялся на стандартном офисном ноутбуке.

Результатом работы являются методические рекомендации, которые позволят менеджменту уровня торговой точки использовать технологии машинного обучения для оптимизации размещения товаров в торговом зале.

Научный руководитель - доц. Слышкин Василий Витальевич, Хмельков Игорь Александрович