УДК 004.93'12
КОМБИНИРОВАННЫЙ МЕТОД ЗАПОЛНЕНИЯ ОТСУТСТВУЮЩИХ ЗНАЧЕНИЙ ПРИЗНАКОВ ДЛЯ РЕШЕНИЯ ЗАДАЧ КЛАССИФИКАЦИИ
П. А. Гаврилов, аспирант МГТУ им. Н.Э. Баумана; Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
К. А. Майков, д.т.н., профессор МГТУ им. Н.Э. Баумана; Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
Предложен комбинированный метод заполнения пропусков значений признаков. Целью работы является исследование функциональных возможностей и ограничений данного метода применительно к задаче классификации в условиях неполноты исходных данных. Представлены результаты сравнительного анализа качества решений, полученные с помощью ряда известных и разработанного методов заполнения с использованием алгоритма k-ближайших соседей на этапе классификации. Качество классификаторов оценивается с помощью процедуры 10-кратного скользящего контроля со стратификацией классов. Результаты проведённых численных экспериментов показали целесообразность использования разработанного метода для заполнения пропусков исходных данных при решении ряда практически значимых задач.
Ключевые слова: машинное обучение, классификация, отсутствующие данные, предобработка данных.