Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
 
+7 (4912) 72-03-73
 
Интернет-портал РГРТУ: http://rsreu.ru

УДК 004.855.5

АЛГОРИТМ ПОДБОРА ЗНАЧЕНИЙ ПАРАМЕТРОВ BSMOTE-АЛГОРИТМА В ЗАДАЧЕ SVM-КЛАССИФИКАЦИИ НА ОСНОВЕ НЕСБАЛАНСИРОВАННЫХ НАБОРОВ ДАННЫХ

Л. А. Демидова, д.т.н., профессор кафедры ВПМ РГРТУ; Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
И. А. Клюева, аспирант РГРТУ; Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.

Рассматривается задача SVM-классификации (Support Vector Machine, SVM) на основе несбалансированных наборов данных, используемых для формирования обучающих выборок, с применением алгоритма синтетического сэмплинга – bSMOTE-алгоритма (borderline Synthetic Minority Oversampling Technique algorithm). Целью работы является разработка алгоритма подбора значений параметров bSMOTE-алгоритма в задаче SVM-классификации несбалансированных наборов данных, обеспечивающего сокращение временных затрат на разработку SVM-классификатора, характеризующегося высоким качеством классификации данных. Поиск значений параметров SVM-классификатора реализован с применением PSO-алгоритма (Particle Swarm Optimization algorithm). Приведены результаты экспериментальных исследований, подтверждающие целесообразность применения алгоритма подбора значений параметров bSMOTE-алгоритма в задаче SVM-классификации несбалансированных наборов данных.

Ключевые слова: несбалансированность данных, сэмплинг, bSMOTE-алгоритм, классификация, SVM-классификатор, радиальная базисная функция ядра, PSO-алгоритм.

 Скачать статью