УДК 004.622
РАЗРАБОТКА ГИБРИДНОГО МЕТОДА ФАКТОРНОГО АНАЛИЗА ДЛЯ НЕПОЛНОГО НАБОРА МЕДИЦИНСКИХ ДАННЫХ
О. А. Попова, преподаватель кафедры ТГМУ, Тюмень, Россия;
orcid.org/ 0009-0006-3530-5703, e-mail: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
В работе представлен сравнительный анализ эффективности работы известных методов факторного анализа: PLS, FastICA, BFA и MLFA, а также вновь разработанных гибридных методов PLS-NN и PLS-RF. Основной задачей исследования было выявление методов, обеспечивающих наилучшую точность объяснения дисперсии в целевой переменной и наилучшее соответствие модели данным. Результаты показали, что метод PLS объясняет значительную долю дисперсии в целевой переменной, демонстрируя хорошие показатели подгонки модели, однако наблюдались признаки избыточной сложности модели. Метод FastICA продемонстрировал высокую объясняющую способность, но выявлены потенциальные проблемы переобучения. Методы BFA и MLFA показали неудовлетворительные результаты, характеризующиеся отрицательной прогностической производительностью и неудовлетворительными значениями показателей подгонки модели. По результатам исследования был выбран метод PLS для дальнейшего усовершенствования и подгонки. С целью повышения его эффективности была применена гибридизация, что позволило значительно улучшить качество модели и ее соответствие данным. Анализ результатов работы гибридных методов факторного анализа (PLS-NN и PLS-RF) показал, что оба метода обладают высокой способностью объяснять вариацию в исходных данных. Однако метод PLS-NN превзошел метод PLS-RF по ряду показателей, таких как коэффициент детерминации, информационные критерии AIC и BIC, а также показатели RMSEA и SRMR, что свидетельствует о лучшей подгонке модели к данным и меньшем уровне ошибки аппроксимации. Таким образом, исследование подтверждает, что метод PLS-NN является предпочтительным для использования в условиях рассматриваемого набора данных благодаря своей точности, объясняющей способности и качеству подгонки модели.
Ключевые слова: медицинские данные, методы факторного анализа, PLS, FastICA, BFA, MLFA, гибридные методы факторного анализа, Random Forest, Neural Networks, коэффициент детерминации, информационные критерии, предобработка входных данных.