Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
 
+7 (4912) 72-03-73
 
Интернет-портал РГРТУ: http://rsreu.ru

УДК 004.855.5

ПОДХОД К ОПРЕДЕЛЕНИЮ ДИАПАЗОНОВ ПОИСКА ОПТИМАЛЬНЫХ ЗНАЧЕНИЙ ПАРАМЕТРОВ КЛАССИФИКАТОРА НА ОСНОВЕ ЛЕСА РЕШАЮЩИХ ДЕРЕВЬЕВ

Л. А. Демидова, д.т.н., профессор кафедры ВПМ РГРТУ, Рязань, Россия;
orcid.org/0000-0003-4516-3746, e-mail: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
М. С. Ивкина, магистрант РГРТУ, Рязань, Россия;
orcid.org/0000-0003-3677-1598, e-mail: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.

Рассматривается задача определения диапазонов поиска оптимальных значений параметров классификатора на основе леса решающих деревьев (RF-классификатора, Random Forest classifier) с целью снижения временных затрат на его разработку. Целью работы является выработка рекомендаций по определению диапазонов поиска значений для таких параметров RF-классификатора, как число деревьев, число признаков, по которым ищется лучшее разбиение в узле дерева, глубина деревьев и минимальное число объектов, при достижении которого узел дерева объявляется листом. Формирование рекомендаций осуществляется на основе результатов экспериментальных исследований по разработке моделей RF-классификатора на основе различных наборов данных из репозиториев данных машинного обучения. Приведены результаты экспериментальных исследований по разработке моделей RF-классификатора c использованием обучающей и тестовой выборок, сформированных на основе анализируемых наборов данных, получены в общем виде графические зависимости по оценке качества классификации на тестовой выборке и времени разработки RF-классификатора на обучающей выборке и сформулированы рекомендации по определению диапазонов поиска оптимальных значений параметров RF-классификатора.

Ключевые слова: классификация, RF-классификатор, решающее дерево, случайный лес, оптимальное значение параметра, диапазон поиска, показатель качества классификации.

 Скачать статью