УДК 004.855.5
АЛГОРИТМ ПОДБОРА ЗНАЧЕНИЙ ПАРАМЕТРОВ BSMOTE-АЛГОРИТМА В ЗАДАЧЕ SVM-КЛАССИФИКАЦИИ НА ОСНОВЕ НЕСБАЛАНСИРОВАННЫХ НАБОРОВ ДАННЫХ
Л. А. Демидова, д.т.н., профессор кафедры ВПМ РГРТУ; Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
И. А. Клюева, аспирант РГРТУ; Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
Рассматривается задача SVM-классификации (Support Vector Machine, SVM) на основе несбалансированных наборов данных, используемых для формирования обучающих выборок, с применением алгоритма синтетического сэмплинга – bSMOTE-алгоритма (borderline Synthetic Minority Oversampling Technique algorithm). Целью работы является разработка алгоритма подбора значений параметров bSMOTE-алгоритма в задаче SVM-классификации несбалансированных наборов данных, обеспечивающего сокращение временных затрат на разработку SVM-классификатора, характеризующегося высоким качеством классификации данных. Поиск значений параметров SVM-классификатора реализован с применением PSO-алгоритма (Particle Swarm Optimization algorithm). Приведены результаты экспериментальных исследований, подтверждающие целесообразность применения алгоритма подбора значений параметров bSMOTE-алгоритма в задаче SVM-классификации несбалансированных наборов данных.
Ключевые слова: несбалансированность данных, сэмплинг, bSMOTE-алгоритм, классификация, SVM-классификатор, радиальная базисная функция ядра, PSO-алгоритм.