УДК 004. 652.5
ИСПОЛЬЗОВАНИЕ МЕТОДОВ ОЧИСТКИ ДАННЫХ ПРИ РЕИНЖИНИРИНГЕ БАЗ ДАННЫХ
А. И. Баранчиков, д.т.н., доцент, профессор кафедры ЭВМ РГРТУ, Рязань, Россия;
orcid.org/0000-0003-4133-7489, e-mail: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
И. И. Яковлев, аспирант РГРТУ, Рязань, Россия;
orcid.org/0000-0002-3813-0455, e-mail: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
И. А. Клюева, программист РГРТУ, Рязань, Россия;
orcid.org/ 0000-0002-0392-3228, e-mail: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
Целью работы является применение алгоритмов очистки данных, ориентированных на сбор данных для хранилищ данных, к решению задачи реинжиниринга баз данных. Основными задачами являются выбор метода очистки, его модификация для новых целей и применение при реинжиниринге. Актуальность исследования заключается в применении известных методов работы с данными к решению новых задач. Приводится классификация проблем реинжиниринга в зависимости от количества баз данных, анализируются различные уровни работы алгоритма, и даётся описание основных его этапов. Производятся выбор и модификация алгоритма очистки для реинжиниринга баз данных, оценка перспектив его использования. Приводится пример работы алгоритма. Результатом работы является алгоритм, позволяющий применить методы очистки данных, использующиеся при организации и работе хранилищ данных, к задачам реинжиниринга баз данных.
Ключевые слова: данные, база данных, структура данных, очистка данных, реинжиниринг, предметная область, атрибут, профайлинг, data mining.