Регистрация / Вход
Прислать материал

Семантическая кластеризация данных.

Сведения об участнике
ФИО
Гладилин Андрей Владимирович
Вуз
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Пензенский государственныйтехнологический университет»
Тезисы (информация о проекте)
Область наук
Информационные технологии и вычислительные системы
Раздел области наук
Информационные технологии
Тема
Семантическая кластеризация данных.
Резюме
Проект направление на решение проблемы улучшения качества кластеризации с помощью совместного использования выбранной пользователем семантики, алгоритма кластеризации и созданного с его помощью базы знаний.
Ключевые слова
кластеризация, кластерный анализ, семантика, база знаний
Цели и задачи
Цель проекта - совершенствование и адаптация выбранного алгоритма кластеризации для повышения качества результатов кластеризации.
Задачи:
1) выбор наиболее подходящего для взаимодействия с семантикой алгоритма кластеризации;
2) усовершенствование и адаптация алгоритма;
3) разработка семантики для задач, решаемых в сфере информационных технологий;
4) разработка структуры базы знаний, в которую конвертируются результаты кластеризации;
5) тестирование созданной системы и исправление ошибок.
Введение

Рассматриваемая концепция направлена на решение проблемы улучшения информационных коммуникаций в синтезированной базе знаний в виде специализированной информационной системы. Из этого следует, что синтез системы знаний на основе их кластеризации неразрывно связаны своей логикой.

Основную роль при этом играет алгоритм кластеризации, а база знаний в значительной степени - следствие кластеризации. Поэтому основное внимание будет направлено именно на вопросы кластерного анализа.

Научная новизна исследования – совместное использование алгоритма кластеризации и информационной системы в виде базы знаний для улучшения результатов кластеризации.

Методы и материалы

-

Описание и обсуждение результатов

-

Используемые источники
1. Обзор алгоритмов кластеризации числовых пространств данных [Электронный ресурс] // Хабрахабр: [сайт]. [2016]. URL: https://habrahabr.ru/post/164417/ (дата обращения: 03.05.2016).
2. Кластеризация: алгоритмы k-means и c-means [Электронный ресурс] // Хабрахабр: [сайт]. [2016]. URL: https://habrahabr.ru/post/67078/ (дата обращения: 03.05.2016).
3. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика: учеб. пособие / Большакова Е.И., Клышинский Э.С., Ландэ Д.В., Носков А.А., Пескова О.В., Ягунова Е.В. — М.: МИЭМ, 2011. — 272 с.
4. Fisher, D.H. Knowledge acquisition via incremental conceptual clustering / D.H. Fisher // Machine Learning 2, 1987. -С.139-172.
Information about the project
Surname Name
Gladilin Andrew
Project title
Semantic clustering
Summary of the project
The project is aimed at solving the problem of improving the quality of the clustering using a user-selected semantics, a clustering algorithm and a knowledge base created with it.
Keywords
semantics, clustering, cluster analysis, knowledge base