Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
 
+7 (4912) 72-03-73
 
Интернет-портал РГРТУ: https://rsreu.ru

УДК 004.8

РЕИНЖИНИРИНГ РЕЛЯЦИОННЫХ БАЗ ДАННЫХ НА ОСНОВЕ КЛАСТЕРИЗАЦИИ АТРИБУТОВ И ТЕХНОЛОГИЙ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ

А. И. Баранчиков, д.т.н., профессор кафедры ЭВМ РГРТУ, Рязань, Россия;
orcid.org/0000-0003-4133-7489, e-mail: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
Е. Б. Федосова, аспирант РГРТУ, Рязань, Россия;
orcid.org/0009-0006-1413-9910, e-mail: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.

Рассматривается одна из задач реинжиниринга реляционных баз данных, в частности объединение специализированных атрибутов в смысловые группы - кластеры. Для решения этой задачи предлагается применить методы интеллектуального анализа данных (Data Mining). Целью работы является разработка алгоритма кластеризации атрибутов реляционных баз данных. Разработанный и представленный в статье алгоритм Cluster_Define позволяет разделять имеющиеся атрибуты на кластеры, содержащие в себе сходные по структуре и семантике атрибуты. При разработке алгоритма использовались элементы кластерного анализа, алгоритма k-means. Для выбора оптимального количества кластеров предлагается использовать метод силуэтов (Silhouette Method). В качестве простейшей метрики в теле алгоритма кластеризации k-means используется Евклидово расстояние.

Ключевые слова: интеллектуальный анализ данных, Data Mining, реляционные базы данных, кластеризация, атрибут, k-means, кластер, реинжиниринг, кластерный анализ.

 Скачать статью