Регистрация / Вход
Прислать материал

Производительность кода против качества анализа

ФИО: Шелюхина Е. Г.

Направление: Информационные технологии

Научный руководитель: доц., к.т.н. Круглов Михаил Геннадьевич

Институт: Институт информационных бизнес систем

Кафедра: Кафедра Системной и программной инженерии

Академическая группа: МИС-13-1

Данное исследование было направлено на поиск ответа на следующий вопрос: что важнее при написании программы – сделать результат анализа наиболее объективным или ускорить время работы кода.

Исследование оценивает экономическую эффективность на примере работы SQL-запроса, обрабатывающего таблицу из 500 000 строк, а на выходе выдающего обработанный список из 100 строк. Запрос составлен в двух вариантах – один из них работает очень быстро (0,675 сек), выполняя простую операцию, которая занимает мало времени, но попадает в точный результат с вероятностью 95,2%. Второй вариант запроса занимает 40,25 сек, но результат является точным на 98,9%.

Цель данного запроса – построение аналитики для будущего использования внутри компании N. В среднем работник компании N обращается к данному запросу 159 раз в каждый рабочий день. При использовании первого варианта запроса аналитик тратит 107,325 секунды на выполнение запроса, а при использовании второго варианта – 1 час 47 минут, т.е. ~1,78 часа. Учитывая, что компания N тратит на аналитика 1 026 рублей в час и при условии, что последовательность работ аналитика линейна (никакая работа не может быть начата, пока не закончена предыдущая), при первом варианте запроса компания тратит 30 рублей 58 копеек в день на ожидание выполнения запроса, и 1 826 рублей 28 копеек в день при втором варианте запроса. В год стоимость составляет 7 553 рублей 26 копеек и 451 091 рублей 16 копеек соответственно.

Оценив затраты на использование кода необходимо оценить экономическую выгоду от каждого варианта запроса.

Смысл данного запроса заключается в определении самых активных посетителей на сайте, разделенных по определенным категориям продаваемой продукции. По результатам запроса определяется целевая аудитория маркетинговых мероприятий и акций, которые в последующем приносят дополнительные продажи, которые, при 100% правильности выявления целевой аудитории составляют 1,8% от общего дохода компании каждая. Оборот компании за год равен 82 млн рублей, количество маркетинговых мероприятий – 5 в год. При использовании первого варианта запроса, целевая аудитория выявлена неправильно на 4,8%, что сокращает выручку на 354 240 рублей, а при использовании второго варианта – на 81 180 рублей.

Итого, стоимость затрат на выполнение запросов отличается на 443 537 рублей 90 копеек в пользу первого варианта, как более экономичного, а разница экономических выгод составляет 273 060 рублей в пользу второго, как запроса с наименьшими потерями. Таким образом, используя первый вариант, компания экономит 170 477 рублей 90 копеек, что является экономически более эффективно.

По результатам исследования были сделаны выводы, что улучшение качества анализа данных в данной компании N экономически нецелесообразно.