УДК 621.395
ОПТИМИЗАЦИЯ ЭНЕРГЕТИЧЕСКИХ ПОРОГОВ ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЯ ДЛЯ СЖАТИЯ РЕЧЕВЫХ СИГНАЛОВ НА ОСНОВЕ АЛГОРИТМА РОЯ ЧАСТИЦ
В. Т. Дмитриев, д.т.н., доцент, заведующий кафедрой РУС РГРТУ, Рязань, Россия;
orcid.org/0000-0001-5521-6886, e-mail: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
Ву Хоанг Шон, аспирант кафедры РУС РГРТУ, Рязань, Россия;
orcid.org/0009-0004-7428-5296, e-mail: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
Предложен и исследован метод адаптивной оптимизации энергетических порогов дискретного вейвлет преобразования на основе алгоритма роя частиц (PSO) для сжатия речевых сигналов. Данный метод обеспечивает автоматический выбор оптимальных долей сохраняемой энергии на каждом уровне вейвлет-разложения. Оптимизация производится с целью максимизации степени сжатия при одновременном соблюдении заранее заданных требований к качеству восстановленной речи на приеме. Качество восстановленной речи на выходе системы оценивается с использованием двух объективных метрик: сегментного отношения сигнал-шум SegSNR и перцептивной метрики качества восстанов-ленной речи ViSQOL. Экспериментальные исследования, проведённые на базе стандартных речевых сигналов записанных согласно ГОСТ Р 50840-95, показали, что предложенный метод позволяет достичь степени сжатия на уровне 87 % при сохранении высокого качества восстановленной речи SegSNR = 9,5 дБ, ViSQOL = 3,9 балла. По интегральному критерию эффективности предложенный подход превосходит классические методы на 7...14 %.
Ключевые слова: дискретное вейвлет-преобразование, алгоритм роя частиц, энергетическое пороговое сжатие, оптимизация параметров, SegSNR, ViSQOL, речевые сигналы.
