Сжатие аудио сигналов.

Схема анализа и синтеза с обратной связью.

ЛЕКЦИЯ №2

Анализ речевых сигналов во временной области

Одним из главных параметров речевых сигналов есть энергия.

 

Для повышения натуральности воспроизводимой речи используется схема анализа и синтеза с обратной связью. В этой схеме формируется возбуждающая последовательность путем минимизации ошибки восстановления речевого сигнала.

^S[n] S[n]

 

 

Ф1 Ф2

 

Восстановление речевого сигнала формируется с помощью фильтров Ф1 и Ф2.

Ф1- функционирует с учетом квазипериода вокализованных участков речи.

Ф2- моделирует форматную структуру речи.

ФВ- генератор функции возбуждения.

W(z)- фильтр с периодической функцией позволяющий учесть особенности слухового восприятия.

Принцип работы схемы заключается в выборе функции возбуждения. ФВ минимизирует квадрат ошибки (МКО) восстановления звукового сигнала.

 

В сравнении с речевыми сигналами аудио сигналы более широкий частотный диапазон от 10 -22 Гц.

Внутреннее ухо человека выполняет кратковременный спектральный анализ, который можно представить в виде механизма критических частотных полос. Если в критической частотной полосе несколько спектральных составляющих, то при этом наблюдается явление частотного маскирования.Его суть заключается в том, что спектральная составляющая с низким уровнем может не прослушиваться, если в этой же критической полосе имеется спектральная составляющая звука с более высоким уровнем, который повышает порог слышимости, и маскирует присутствие составляющих с низким уровнем.

Повышенный порог слышимости называется порогом маскирования. Все спектры составляющих сигналов, уровень которых ниже порога маскирования не прослушиваются. Зависимость порога маскирования от частоты определенных уровнем и частотой маскировочной составляющей, а также уровнем и частотами маскируемых спектральных составляющих.

Порог маскирования имеет максимальное значение на частоте маскирующей спектральной составляющей и снижает с преувеличений или уменьшений частоты.