Регистрация / Вход
Прислать материал

Разработка алгоритма и программы выделения и исследования характеристик источников на примере публикаций по пропускам в таблицах данных

ФИО
Кызыласов Николай Евгеньевич
Электронная почта
4e2715a580fc4bni.kyzylasov@yandex.ru
Номинация
Информационные технологии
Институт
Институт информационных технологий и автоматизированных систем управления (ИТАСУ)
Кафедра
Инженерной кибернетики
ФИО научного руководителя
Широков Андрей Игореивч, доцент
Академическая группа
ММ-12-1
Наименование тезиса
Разработка алгоритма и программы выделения и исследования характеристик источников на примере публикаций по пропускам в таблицах данных
Тезис

Проблема обработки характеристик источников по определённой тематике довольно актуальна в области информационных технологий. Пусть имеются источники (в виде файлов данных) по определённой научной тематике. На первом этапе из таких файлов выделяются их характеристики. Примерами последних служат такие: год издания, название, ключевые слова, фамилия авторов, их статус, тип публикаций, количество страниц, рассматриваемые постановки задач и методы их решения и так далее. Это характеристики, которые не привязаны к тематике, по которой выбраны источники для анализа. Но среди характеристик могут быть и специфичные для выбранной области исследования. В представленной работе анализируются публикации по проблеме восстановления пропусков в таблицах данных. Специфичными характеристиками здесь могут быть типы информации, например, действительные числа характеризующих тот или иной физический процесс, результаты анкетирования или результаты медицинских анализов.

В результате работы будет разработан программно-алгоритмический комплекс, выявляющий связи между различными источниками. Например, какие  методы применяются для восстановления тех или иных данных, как изменяется в динамике эта картина.

К настоящему времени разработано программное средство, позволяющее формировать удобных образом множество характеристик источников для разных типов файлов: формат документов pdf, формат документов Microsoft Word, html-страницы. Сформированный таким образом файл может быть передан на дальнейшую обработку.

Для анализа подготовленных данных будут использованы методы методы наукометрии и библиометрии, кластеризации и теории графов. В настоящее время ведется работа по завершению программно-алгоритмического комплекса.

Работа выполняется под руководством доцента Широкова А.И.