Регистрация / Вход
Прислать материал

Разработка методики и прикладного программного обеспечения для обработки массивов больших данных с целью предоставления актуальной и релевантной информации для поддержки управленческих решений в высокотехнологичных отраслях экономики за счет использования инструментов обработки естественного языка и машинного обучения

Номер контракта: 14.579.21.0091

Руководитель: Шашев Сергей Александрович

Должность: Руководитель проектов

Аннотация скачать
Постер скачать
Ключевые слова:
экспертные системы, системы принятия решений, машинное обучение, извлечение фактов, кластеризация, визуализация, автоматическая обработка естественного языка

Цель проекта:
Проект направлен на поддержку принятия управленческих решений на основании анализа массивов неструктурированных данных, которые необходимы для принятия объективных решений. Целью проекта является повышение качества принимаемых управленческих решений, достигаемое за счет принятия решений на основании результатов анализа данных и фактов, а не рекомендаций сотрудников и анализа неполной информации. Задачи проекта: разработка ПО для анализа больших данных, интеграция с различными источниками данных, интеграция в информационные системы и продукты индустриального партнера. Как итог – повышение эффективности бизнес-процессов организаций за счет более взвешенного принятия управленческий решений. Научная новизна проекта заключается в полномасштабном использовании корпоративных неструктурированных данных для систем поддержки принятия решений.

Основные планируемые результаты проекта:
1) Модель автоматической оценки компетенций персонала на основании анализа неструктурированной информации.
2) Прикладное программное обеспечение для работы с большими неструктурированными массивами данных (документы, созданные сотрудниками предприятия), обрабатывать их и предоставлять результаты обработки в виде элементов BI, отчетов и поиска с динамическим классификатором.


Краткая характеристика создаваемой/созданной научной (научно-технической, инновационной) продукции:
1. Конечный продукт, разрабатываемый в рамках ПНИЭР, будет интегрироваться с информационными системами и решать задачу анализа больших неструктурированных массивов данных, обрабатывать их и предоставлять результаты обработки в виде элементов BI, отчетов и поиска с динамическим классификатором.

2.
2.1. Созданная принципиальная модель оценки компетенций может значительно улучшить качество оценки компетенций сотрудников по сравнению с традиционными, более субъективными моделями оценок. Данная модель может обеспечить автоматическую оценку квалификации, компетенций и профессиональных интересов сотрудника на основании анализа неструктурированной информации.
2.2. В процессе разработки применялись наиболее современные инструменты языкового моделирования (например, word2vec, doc2vec), которые были применены впервые в данных целях (работы с корпоративными неструктурированными данными) для русского языка.


3. Было проведено сравнение с такими системами как:
3.1. Система управления талантами SAP SuccessFactors TM от фирмы SAP, которая является общепризнанным мировым лидером по производству систем управления талантами (talent management).
3.2. Система оценки компетенций Tools4JOBs от немецкой группы компаний ATG-CNT Consult, которая занимает заметную долю на российском рынке анализа компетенций.
3.3. Система электронного обучения elearning-3000 от российского системного интегратора DE-group. Данная система является одной из основных систем электронного обучения на российском рынке.
По основным параметрам разрабатываемая нами система в своей базовой версии превосходит российские системы оценки компетенций и приближается к международным системам управления талантами, занимая промежуточное положение между данными видами систем.

4. Для достижения результатов проекта необходимо предпринять:
4.1. Доработать и апробировать модель автоматической оценки компетенций персонала на основании анализа неструктурированной информации на реальных данных, а также протестировать ее в процессе разработки экспериментального образца программного обеспечения для работы с большими неструктурированными массивами данных.
4.2. Ведется работа над экспериментальным образцом программного комплекса автоматического определения квалификаций и профессиональных интересов сотрудника для повышения качества принятия решений на предприятии.
Одним из выявленных ограничений является то, что модель автоматической оценки компетенций персонала на основании анализа неструктурированной информации наиболее успешно применяется только для оценки хорошо квантифицируемых компетенций.

Назначение и область применения, эффекты от внедрения результатов проекта:
Перспективы использования результатов
1) Конкурентный анализ
2) Оценка перспективности проектов
3) Поиск экспертов
4) Оценка персонала, подразделений, организаций
5) Информирование о новой релевантной информации (локально и глобально)

Области применения полученных результатов:
1) Венчурные фонды
2) Федеральные органы исполнительной власти
3) Вузы
4) Крупные корпорации с большим документооборотом
5) Стартапы

Эффекты от внедрения результатов проекта
1) Повышение качества работы научных организаций
2) Повышение эффективности финансирования проектов в высокотехнологических областях экономики
3) Повышение качества управленческих решений в области кадров

Полученные теоретические результаты закладывают архитектуру для разработки технических решений, которые окажут высокое влияние на развитие научно-технических и технологических направлений благодаря поддержке принятия решений при выборе направлений и повышению информированности научно-технических кадров о работе коллег.

Текущие результаты проекта:
1 Выявлены ключевые методы оценки компетенций, применяемые в ПО для западных рынков

2 Исследованы наиболее перспективные направления для применения методов интеллектуального анализа данных:
поддержка принятия решений (Decision Support)
управление талантами (Talent Management)
управление компетенциями (Competency Management)
управление знаниями (Knowledge Management)

3 Исследованы алгоритмы формализации и извлечения знаний из слабоструктурированной информации на стенде, разработанным индустриальным партнером

4 Проведены полевые маркетинговые исследования, сформулированы требования потребителей результатов ПНИЭР. Была проведена работа в следующих организациях:
Naumen (Service Desk и NauPhone)
МИСИС
МФТИ
УрФУ
B2B Center

5 Разработан прототип СППР по патентному анализу

6 Разработан прототип системы автоматического анализа компетенций на основании документов, созданных сотрудником организации