УДК 004.855.5
КЛАССИФИКАЦИЯ ДАННЫХ НА ОСНОВЕ SVM-АЛГОРИТМА И АЛГОРИТМА k-БЛИЖАЙШИХ СОСЕДЕЙ
Л. А. Демидова, д.т.н., профессор кафедры ВПМ РГРТУ; Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
Ю. С. Соколова, старший преподаватель кафедры ВПМ РГРТУ; Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
Рассматривается задача классификации сложноорганизованных многомерных данных, характерная для различных социально-экономических, технических и других систем. Целью работы является повышение точности классификации сложноорганизованных многомерных данных посредством разработки двухэтапного метода их классификации, основанного на совместном применении SVM- и kNN-классификаторов. На первом этапе метода классификации на основе исходного учебного набора данных U разрабатывается SVM-классификатор и определяется ширина Ω-области, содержащей все ошибочно классифицированные SVM-классификатором объекты, формирующие вместе с правильно классифицированными объектами, попавшими в Ω-область и соответствующими метками классов объектов из Ω-области, новый набор данных G. На втором этапе метода классификации ко всем объектам набора данных G из Ω-области применяется kNNклассификатор, разработанный на основе информации об объектах набора U\G. В случае улучшения качества классификации объектов, принадлежащих Ω-области, предлагаемый двухэтапный метод может быть рекомендован для классификации новых объектов. Значения параметров kNNклассификатора определяются экспериментально таким образом, чтобы обеспечить максимально возможную точность классификации объектов. Поскольку в формируемую вышеуказанным образом Ω-область могут попасть и верно классифицируемые объекты, то условием применимости предлагаемого метода является общее повышение качества классификации. Приведенные результаты экспериментальных исследований подтверждают эффективность применения предлагаемого метода в задаче классификации сложноорганизованных многомерных данных.
Ключевые слова: SVM-классификатор, опорные векторы, тип функции ядра, параметры функции ядра, параметр регуляризации, kNN-классификатор, метод классификации.