Регистрация / Вход
Прислать материал

Исследование и разработка математических методов и алгоритмов для интеллектуальной системы анализа данных (подсистемы прогнозирования объемов спроса на грузовые железнодорожные перевозки).

Докладчик: Рудаков Константин Владимирович

Должность: Заведующий Отделом интеллектуальных систем ВЦ РАН, чл.-корр. РАН, д.ф.-м.н.

Цель проекта:
Основная задача проекта – формирование базового алгоритма прогнозирования объемов грузовых железнодорожных перевозок с учетом экзогенных факторов. Алгоритм будет включать данные, влияющие на историческое временные ряды объемов грузоперевозок, в частности исторические биржевые цены на перевозимые грузы, а также используемые в настоящее время сезонности в широком смысле этого термина. Предлагается разработать методологию прогнозирования объемов перевозок товаров на основании исторических знаний о прибывавших на станцию и уходивших со станции вагонах с учетом влияния внешних факторов на динамику перевозок. При этом в качестве единицы учета рассматривается блок вагонов, неделимый на всем протяжении маршрута.

Основные планируемые результаты проекта:
Основные планируемые результаты проекта:
1. Отчет по результатам исследований математических методов и алгоритмов прогнозирования железнодорожных грузоперевозок.
2. Результаты патентных исследований. Свидетельства государственной регистрации ключевых алгоритмов и структур баз данных.
3. Рекомендации по реализации системы прогнозирования объемов спроса на грузовые железнодорожные перевозки.
4. Прототип системы прогнозирования объемов спроса на грузовые железнодорожные перевозки.

Система прогнозирования, разрабатываемая при выполнении проекта, будет удовлетворять следующим требованиям, связанным с детализацией получаемого прогноза:
1. Формировать прогноз отправления (погрузки) грузов в заданном периоде:
- на месяц посуточно и подекадно,
- на квартал помесячно,
- на период от года помесячно и поквартально.
2. Формировать прогноз отправления (погрузки) грузов с разложением:
- по группам грузов: каждой группе поставлен в соответствии определённый идентификатор;
- по родам подвижного состава: полувагоны, крытые вагоны, цистерны, платформы, прочие;
- по комбинированному разложению, учитывающему перечисленные факторы.
Прогнозы выполняются на основании исторических данных об объемах грузоперевозок с учетом информации о влиянии внешних факторов на динамику грузоперевозок.

Решение поставленной задачи базируется на результатах работ научного коллектива, посвященных порождению и выбору прогностических моделей, выполненных при поддержке РФФИ. В частности будут использованы результаты проектов РФФИ, «Разработка макета системы прогноза грузоперевозок на основе интеграции опыта специалистов ВЦ РАН и ПГК» 11-07-13154-офи-м-2011-РЖД, «Методы анализа взаимного влияния пассажирского и грузового трафиков РЖД» 13-07-13139-офи-м-РЖД, «Развитие теории поиска регрессионных моделей в неявно заданном множестве» 07-07-00181-а, «Развитие теории индуктивного порождения и выбора моделей» 10-07-00422-а, «Методы оценивания и отбора значений признаков в задачах распознавания и классификации» 11-07-00448-а.
Методы, предлагаемые авторами для решения поставленных в проекте задач, получены как результат работ по развитию известных подходов теоретический информатики. Эти методы активно совершенствуются и обсуждаются в научных публикациях последних лет.
Результаты научных исследований будут представлены на отечественных и зарубежных конференциях, а также будут опубликованы в рецензируемых журналах из списка ВАК.

План выполнения работ включает следующие этапы.
1. Изучение ведущего мирового и отечественного опыта в области прогнозирования и оптимизации железнодорожных грузоперевозок. Выявление ключевых методов, оценка сферы применения и эффективности.
2. Исследование источников и возможности получения исходных данных для решения задач прогнозирования.
3. Проведение экспертного анализа значимости и характера влияния экзогенных факторов на объемы спроса на грузовые железнодорожные перевозки.
4. Разработка и адаптация математических методов и алгоритмов прогнозирования с учетом специфики задач, решаемых в интересах ОАО "РЖД".
5. Разработка генератора реалистичных модельных данных и проведение вычислительных экспериментов для подтверждения адекватности результатов прогноза.
6. Сбор и подготовка реальных данных, проведение тестовых расчетов на реальных данных, подтверждение эффективности примененных решений.
7. Разработка прототипа системы прогнозирования.
8. Организация правовой охраны полученных результатов ПНИ.

Назначение и область применения, эффекты от внедрения результатов проекта:
В рамках данного проекта для решения поставленных прикладных задач будут разработаны новые методы прогноза, нацеленные на повышение точности прогнозирования с учетом условий выполнения железнодорожных перевозок. Прогнозирование потребностей в вагонах у заказчиков РЖД в узлах погрузки/разгрузки с учетом временных интервалов доставки является проблемой, которую необходимо решить для повышения эффективности транспортировки грузов.
Предполагается доведение базового алгоритма до уровня, обеспечивающего проведение реальных расчетов и сравнение эффективности (точности прогнозов и логистических рекомендаций) с используемой в настоящее время в ПГК системой, что является обоснованием возможности получения результатов, способных к правовой охране.
Создаваемая методика, с одной стороны, основана на современных математических достижениях в области распознавания и прогнозирования и, с другой стороны, строго ориентирована на предметную область. Это должно обеспечить как высокую эффективность и точность решения основных задач, так и удобство использования для специалистов РЖД и аффилированных грузовых транспортных компаний.

Текущие результаты проекта:
1. Предложен, разработан и протестирован алгоритм непараметрического прогнозирования загруженности железнодорожных узлов РЖД. Алгоритм выполняет прогноз, превосходящий по точности широко распространенные алгоритмы (ARMA, ARIMA).

2. Разработан алгоритм, строящий гистограмму распределения его значений и вычисляющий свертки гистограммы с экспертно заданной функцией потерь для каждого возможного прогнозируемого значения. Оптимальным прогнозом является то значение центра сегмента гистограммы, которое доставляет минимальное значение свертке. Разработан алгоритм выбора оптимальных параметров модели, включающий оптимизацию длины предыстории и горизонта прогнозирования.

3. При построении оптимального прогноза предлагается использовать такую функцию потерь, которая бы минимизировала убыток от перегруженности/недогруженности железнодорожного узла и удовлетворяла бы дополнительным ограничениям. При построении модельных прогнозов использовались различные функции потерь.

4. Рассмотрена проблема обнаружения причинно-следственных связей в разнородных временных рядах. Предложена прогностическая модель, использующая выявленные связи. Модель предназначена для прогнозирования загруженности железнодорожного узла. Модель использует как исторические данные о загруженности, так и внешние данные: биржевые цены на основные инструменты и нормативные документы. При построении модели использовались экспертные высказывания относительно вида связей.