Кодирование звуковой информации

Приемы и методы работы со звуковой информацией пришли в вычислительную технику наиболее поздно. К тому же, в отличие от числовых, текстовых и графических данных, у звукозаписей не было столь же длительной и проверенной истории кодирования. В итоге методы кодирования звуковой информации двоичным кодом далеки от стандартизации. Множество отдельных компаний разработали свои корпоративные стандарты, но если говорить обобщенно, то можно выделить два основных направления.

Звук - это упругая продольная волна в воздушной среде. Чтобы ее представить в виде, читаемом компьютером, необходимо выполнить определенные преобразования (рисунок 1.2). Прежде всего, звуковой сигнал преобразовывается в электрический аналог звука с помощью микрофона. Электрический аналог получается в непрерывной форме и не пригоден для обработки на цифровом компьютере. Чтобы перевести сигнал в цифровой код, надо пропустить его через аналого-цифровой преобразователь (АЦП). При воспроизведении происходит обратное преобразование - цифро-аналоговое (через ЦАП). Конструктивно АЦП и ЦАП находятся в звуковой карте компьютера.

Рисунок 1.2. Схема обработки звукового сигнала

Во время оцифровки сигнал дискретизируется по времени и по уровню (рисунок 1.3). Дискретизация по времени выполняется следующим образом: весь период времени Т разбивается на малые интервалы времени Dt точками t₁, t₂,...,t_n. Предполагается, что в течение интервала Dt уровень сигнала изменяется незначительно и может с некоторым допущением считаться постоянным. Величина F=1/Dt называется частотой дискретизации. Она измеряется в герцах (Гц) - количество измерений в течение секунды.

Рисунок 1.3. Схема дискретизации звукового сигнала

Дискретизация по уровню называется квантованием. Область изменения сигнала от самого малого значения Xmin до самого большого значения Хmax разбивается на N равных промежутков (квантов) величиной

DХ = (Хmax - Xmin)/N.

Каждый квант связывается с его порядковым номером, т.е. целым числом, которое легко может быть представлено в двоичной системе счисления.

При кодировании звука возникают две задачи: как часто по времени надо измерять сигнал и с какой точностью надо измерять сигнал, чтобы получить при воспроизведении звук удовлетворительного качества.

Высокое качество воспроизведения получается в формате лазерного аудиодиска при следующих параметрах оцифровки: частота дискретизации - 44,1 кГц, квантование - 16 бит. Таким образом, 1 секунда стереозвука займет 2 байта. Качество звука при этом получается очень высоким.

Для телефонных переговоров удовлетворительное качество получается при частоте дискретизации 8 кГц и частоте квантования 256 уровней, т.е. 1 байт, при этом 1 секунда звуковой записи займет на диске 8000 байт.

5rik.ru

Материалы для учебы и работы

Кодирование звуковой информации