УДК 004.891
АВТОМАТИЗИРОВАННЫЙ АНАЛИЗ ТЕКСТОВ ПРОГРАММ ПРИ ПОМОЩИ ПРЕДСТАВЛЕНИЙ НА ОСНОВЕ ЦЕПЕЙ МАРКОВА И МАШИН ЭКСТРЕМАЛЬНОГО ОБУЧЕНИЯ
А. В. Горчаков, аспирант кафедры корпоративных информационных систем Института информационных технологий МИРЭА – Российского технологического университета, Москва, Россия;
orcid.org/0000-0003-1977-8165, e-mail: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
Л. А. Демидова, д.т.н., профессор кафедры корпоративных информационных систем Института информационных технологий МИРЭА – Российского технологического университета, Москва, Россия;
orcid.org/0000-0003-4516-3746, e-mail: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
П. Н. Советов, к.т.н., доцент кафедры корпоративных информационных систем Института информационных технологий МИРЭА – Российского технологического университета, Москва, Россия;
orcid.org/0000-0002-1039-2429, e-mail: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
Цифровизация экономики приводит к росту спроса на разработчиков программного обеспечения и, как следствие, к массовому характеру курсов по программированию. Целью данного исследования является разработка модуля для анализа решений автоматически сгенерированных уникальных задач по программированию в системе «Цифровой ассистент преподавателя» (ЦАП), автоматизирующей массовый курс по программированию на языке Python в РТУ МИРЭА. Для векторизации текста программы предлагается выполнить построение дерева абстрактного синтаксиса, а затем преобразовать полученное дерево в цепь Маркова. Для классификации векторных представлений текстов программ предлагается применить машину экстремального обучения – вычислительно эффективную архитектуру искусственной нейронной сети. Разметка набора данных осуществляется алгоритмом иерархической кластеризации. Применение разработанного модуля позволяет автоматически определять способ решения сгенерированных с помощью ЦАП задач. Полученные сведения о способах решения могут использоваться преподавателями в течение семестра для выявления пробелов в знаниях и навыках учащихся. Статистика, полученная от классификаторов векторных представлений текстов программ, сообщается учащимся через веб-интерфейс системы ЦАП.
Ключевые слова: классификация текстов программ, анализ программного кода, алгоритм классификации, искусственная нейронная сеть, машина экстремального обучения, деревья абстрактного синтаксиса.