Сжатие аудио сигналов.
Схема анализа и синтеза с обратной связью.
ЛЕКЦИЯ №2
Анализ речевых сигналов во временной области
Одним из главных параметров речевых сигналов есть энергия.
Для повышения натуральности воспроизводимой речи используется схема анализа и синтеза с обратной связью. В этой схеме формируется возбуждающая последовательность путем минимизации ошибки восстановления речевого сигнала.
^S[n] S[n]
Ф1 Ф2
Восстановление речевого сигнала формируется с помощью фильтров Ф1 и Ф2.
Ф1- функционирует с учетом квазипериода вокализованных участков речи.
Ф2- моделирует форматную структуру речи.
ФВ- генератор функции возбуждения.
W(z)- фильтр с периодической функцией позволяющий учесть особенности слухового восприятия.
Принцип работы схемы заключается в выборе функции возбуждения. ФВ минимизирует квадрат ошибки (МКО) восстановления звукового сигнала.
В сравнении с речевыми сигналами аудио сигналы более широкий частотный диапазон от 10 -22 Гц.
Внутреннее ухо человека выполняет кратковременный спектральный анализ, который можно представить в виде механизма критических частотных полос. Если в критической частотной полосе несколько спектральных составляющих, то при этом наблюдается явление частотного маскирования.Его суть заключается в том, что спектральная составляющая с низким уровнем может не прослушиваться, если в этой же критической полосе имеется спектральная составляющая звука с более высоким уровнем, который повышает порог слышимости, и маскирует присутствие составляющих с низким уровнем.
Повышенный порог слышимости называется порогом маскирования. Все спектры составляющих сигналов, уровень которых ниже порога маскирования не прослушиваются. Зависимость порога маскирования от частоты определенных уровнем и частотой маскировочной составляющей, а также уровнем и частотами маскируемых спектральных составляющих.
Порог маскирования имеет максимальное значение на частоте маскирующей спектральной составляющей и снижает с преувеличений или уменьшений частоты.