Кодирование звуковой информации

Приемы и методы работы со звуковой информацией пришли в вычислительную технику наиболее поздно. К тому же, в отличие от числовых, текстовых и графических данных, у звукозаписей не было столь же длительной и проверенной истории кодирования. В итоге методы кодирования звуковой информации двоичным кодом далеки от стандартизации. Множество отдельных компаний разработали свои корпоративные стандарты, но если говорить обобщенно, то можно выделить два основных направления.

Звук - это упругая продольная волна в воздушной среде. Чтобы ее представить в виде, читаемом компьютером, необходимо выпол­нить определенные преобразования (рисунок 1.2). Прежде всего, звуковой сигнал преоб­разовывается в электрический аналог звука с помощью микрофона. Элек­трический аналог получается в непрерывной форме и не пригоден для обработки на цифровом компьютере. Чтобы перевести сигнал в цифровой код, надо пропустить его через аналого-цифровой преобразо­ватель (АЦП). При воспроизведении происходит обратное преобра­зование - цифро-аналоговое (через ЦАП). Конструктивно АЦП и ЦАП находятся в звуковой карте компьютера.

 

Рисунок 1.2. Схема обработки звукового сигнала

 

Во время оцифровки сигнал дискретизируется по времени и по уровню (рисунок 1.3). Дискретизация по времени выполняется следую­щим образом: весь период времени Т разбивается на малые интервалы времени Dt точками t1, t2,...,tn. Предполагается, что в течение интервала Dt уровень сигнала изменяется незначительно и может с некоторым допущением считаться постоянным. Величина F=1/Dt называется частотой дискретизации. Она измеряется в гер­цах (Гц) - количество измерений в течение секунды.

 

 

Рисунок 1.3. Схема дискретизации звукового сигнала

 

Дискретизация по уровню называется квантованием. Область изменения сигнала от самого малого значения Xmin до самого большого значения Хmax разбивается на N равных промежутков (квантов) величиной

DХ = (Хmax - Xmin)/N.

Каждый квант связывается с его порядковым номером, т.е. це­лым числом, которое легко может быть представлено в двоичной системе счисления.

При кодировании звука возникают две задачи: как часто по времени надо измерять сигнал и с какой точностью надо измерять сигнал, чтобы полу­чить при воспроизведении звук удовлетворительного качества.

Высокое качество воспроизведения получается в формате лазер­ного аудиодиска при следующих параметрах оцифровки: частота дис­кретизации - 44,1 кГц, квантование - 16 бит. Таким образом, 1 секунда стереозвука займет 2 байта. Качество звука при этом получается очень высоким.

Для телефонных переговоров удовлетворительное качество полу­чается при частоте дискретизации 8 кГц и частоте квантования 256 уровней, т.е. 1 байт, при этом 1 секунда звуковой записи займет на диске 8000 байт.