Регистрация / Вход
Прислать материал

Распределенные самоконфигурируемые многоагентные технологии проектирования и управления интеллектуальными информационными сетями

Докладчик: Стюгин Михаил Андреевич

Должность: докторант кафедры Системного анализа и исследования операций Сибирского государственного аэрокосмического университета им. ак. Решетнева М.Ф., кандидат технических наук

Цель проекта:
Одна из существенных проблем современного интернет связна с тем, что представленная в www информация не поддается прямой автоматизированной компьютерной обработке (по оценкам специалистов порядка 50-60% всех информационных ресурсов). Как следствие, задачи, решаемые в web, решаются не эффективно. В частности, существует проблема эффективного информационного поиска. Несмотря на мощные алгоритмы оценки релевантности ответов на запросы пользователя, эффективность поисковых машин остается невысокой. Во-первых, это связано с недостаточной гибкостью самих поисковых машин. Во-вторых, эффективность поисковых машин снижается с развитием SEO-технологий. Сегодня порядка 90% всех информационных ресурсов в www содержат SEO-контент, написанный специально для поисковых машин, но не для конечных пользователей. С помощью SEO можно манипулировать результатами поиска за счет использования «бесполезного». Поисковые машины не имеют достаточных интеллектуальных способностей для оценки релевантности контента потребностям пользователя, а потому поисковые результаты могут быть сколь угодно не эффективными. В свою очередь, пользователь, перемещаясь по не релевантным ресурсам, формирует свой информационный профиль, который будет не адекватным, т.е. не отражающим его реальные потребности, тематические интересы, компетенции. Неадекватный профиль приводит к еще более искаженному поиску и т.д. Одно из наиболее перспективных направлений решения проблемы – реализация концепции семантического вэба и интеллектуализация поисковых машин, что обеспечит структурирование семантики контента в удобном для машинной обработки представлении. Современные web технологии позволяют осуществлять сбор определенных данных о пользователе, его активности в сети и составлять его информационный портрет (социально-демографические характеристики, интересы, профиль, круг общения). В частности, своими действиями в сети пользователь генерирует и обратную связь для анализа контента (например, релевантности) – время, проведенное на ресурсе (части ресурса), переходы и возвраты на ресурсы, создание и изменение связей в социальных сетях и прочее. Подобная информация является служебной, хранится в логах серверов. Эта информация содержит неявные сведения не только о пользователе, но и о ресурсах, поскольку релевантные профилю пользователя ресурсы, вероятнее всего, используются чаще и дольше, с ними совершаются определённые действия. Анализ этой информации позволит более адекватно оценивать релевантность в поисковых машинах, формировать тематические кластеры (семантические структуры), формировать профили и компетенции пользователей и т.д. Целью данного проекта является исследование и разработка комплекса научно-технических решений, направленных на создание распределенной самоконфигурируемой многоагентной технологии проектирования и управления интеллектуальными информационными сетями для повышения эффективности и обоснованности решения задач обеспечения информационных потребностей пользователей глобальной сети Интернет.

Основные планируемые результаты проекта:
Для достижения обозначенной цели проекта необходимо решить следующие задачи:
1) Формирование концепции проектирования интеллектуальных информационных сетей, обеспечивающих анализ и решение задач обеспечения информационных потребностей пользователей глобальной сети путем сопоставления имеющихся семантических web-структур (онтология информационного ресурса, информационный профиль пользователя) и реальных потребностей пользователя, проявляющихся в его активности.
2) Формализация и решение проблемы неконтентной оценки и анализа релевантности результатов поиска в web с применением технологии web usage mining (интеллектуальный анализ использования web-ресурсов). Традиционный подход использует данные логов web-серверов для формирования предпочтений пользователя путем анализа маршрутов его движения по информационным ресурсам. В данной работе будет использован более глубокий анализ доступной информации о переходах, возвратах, видах и протяженности активности на информационных ресурсах для оценки релевантности поисковых запросов пользователя и соответствия его информационному профилю (например, если пользователь более активен на данном ресурсе, то вероятно тема интересна пользователю, хотя и не соответствует его текущему профилю, а результат поиска соответствует запросу).
3) Создание алгоритмического обеспечения автоматизированного проектирования и управления интеллектуальными информационными сетями на базе распределенных самоконфигурируемых многоагентных технологий Концепция интеллектуальных информационных сетей ориентирована на повышение эффективности работы с плохоформализуемыми задачами и адаптацию к информационным потребностям пользователя. Для этого используемые модели и методы решения конкретных задач должны формироваться в процессе постановки и решения задачи, а не указываться априори в структуре сервера. Более того, специфика www подразумевает физическую и логическую распределенность работы с информацией, что в итоге приводит к проблеме слияния существенно гетерогенных данных (data fusion). Использование самоконфигурируемых многоагентных интеллектуальных технологий позволит формировать решения «на лету» под конкретные информационные запросы пользователя, а использование многоагентного подхода обеспечит сбор и анализ необходимых данных на месте их появления с последующим слиянием в общую модель.
4) Создание алгоритмического обеспечения для автоматизированной генерации моделей и алгоритмов решения задач различных классов в зависимости от конкретных информационных потребностей пользователей.
Информационные потребности пользователя зачастую являются уникальными и могут приводить к различным формальным постановкам задач, которые могут решаться в различной информационной среде, использовать различные данные (форматы, размерность) и т.д. Следовательно, требуется проектирование эффективных интеллектуальных информационных технологий анализа данных «под задачу». Спроектированная технология, в свою очередь, должна иметь возможность самонастраиваться в процессе решения задачи.
В данной работе задачи проектирования и настройки интеллектуальных информационных технологий рассматриваются как оптимизационные, а для решения будут применяться самоконфигурируемые бионические алгоритмы. Для повышения логической надежности решения задачи будут использоваться коллективы моделей и алгоритмов. В свою очередь, алгоритм согласования индивидуальных решений в коллективе будет также проектировать каждый раз «под задачу», поскольку традиционные алгоритмы голосования и усреднения малоэффективны в условиях анализа плохоструктурированной, гетерогенной информации.


Назначение и область применения, эффекты от внедрения результатов проекта:
Области применения, способы использования результатов:
• Проектирование и организация крупных информационных ресурсов.
• Разработка программного обеспечения, ориентированного на работу с информаций и пользователями интернет.
• Информационная безопасность.
• Разработка поисковых машин.
• Оптимизация и продвижение web-ресурсов.
• Социальные сети, в которых осуществляется поиск пользователей с целевым профилем (при отсутствии явной информации о пользователе).
• Маркетинг.
Возможные потребители ожидаемых результатов:
• Организации, осуществляющие проектирование и организацию крупных информационных ресурсов.
• Разработчики программного обеспечения, ориентированного на работу с информаций и пользователями интернет.
• Специалисты в области информационной безопасности, которым необходим глубокий анализ
• тематической активности в интернет.
• Разработчики поисковых машин.
• Разработчики и владельцы социальных сетей, в которых осуществляется поиск пользователей с целевым профилем (при отсутствии явной информации о пользователе).
• Организации, занимающиеся оптимизацией и продвижением web-ресурсов.
• CR-менеджеры, маркетологи - специалисты, занимающиеся формированием целевых групп клиентов, выявлением их потребностей.
В ходе реализации проекта запланировано несколько международных научных мероприятий, иностранные партнеры выражают крайнюю заинтересованность проводимыми работами. Планируется реализация совместных проектов с использованием результатов проекта.

Текущие результаты проекта:
На первом этапе проекта получены следующие результаты: проведен аналитический обзор современной научно-технической, нормативной, методической литературы, а также патентные исследования. Данные исследования показали, с одной стороны, высокую заинтересованность научного сообщества в данной проблеме, а с другой стороны, отсутствие комплексного решения по данному вопросу.
Было проведено исследование современного состояния способов и подходов к проектированию интеллектуальных информационных сетей. Дана оценка слабых и сильных сторон отдельных подходов.
Проведено исследование предпочтений пользователя на основе оценки неконтентной информации, извлекаемой из данных об активности пользователя. Проведен анализ подходов по построению моделей пользователей.
Была сформулирована концепция проектирования интеллектуальных информационных сетей. В данном проекте проектирование интеллектуальных информационных сетей будет осуществляться распределенными самоконфигурируемыми многоагентными технологиями, способными строить модели данных об активности пользователя и системы управления интеллектуальными сетями в автоматизированном режиме под конкретные данные и задачу.
Разработан бизнес-план, включающий сквозной сетевой график выполнения проекта в целом и план мероприятий по обеспечению качества выполнения ПНИ.
Проведен маркетинговый анализ рынка, обзор конкурентных решений, сбор функциональных и других требований к разрабатываемой технологии.
Проведена международная конференция, на которой обсуждались текущие результаты проекта.