Принцип формирования информационного пакета
Стандарт MPEG 2 предоставляет возможность формирования трех видов цифровых потоков:
· элементарного пакетированного потока,
· программного пакетированного информационного потока и
· транспортного пакетированного потока.
Определение «элементарный» означает, что цифровой поток состоит из одного вида информации: звукоданных, видеоданных или данных пользователя. Программный пакетированный информационный поток формируется внутренним мультиплексором, объединяющим в определенной последовательности элементарные пакетированные потоки сжатых видеоданных и элементарные пакетированные потоки сжатых звукоданных. На входы этого же мультиплексора подаются без сжатия служебные данные и синхрослова (см. рисунок 9).
Рисунок 9 - Принцип формирования информационного пакета
Внутренний мультиплексор из элементарных потоков формирует информационную часть — блок цифрового пакета фиксированной длины в 187 байтов и синхрослово в 1 байт.
Информационная часть затем дополняется головной частью и байтами кода Рида-Соломона, обеспечивающими защиту от ошибок блока информационных байтов (см. рисунок 10).
Рисунок 10 - Структура пакета транспортного потока информационных данных с защитой от ошибок кодом Рида-Соломона
Головная часть (до 200 байтов) содержит управляющие коды и включает в себя:
- один байт стартового кода, подготавливающий приемное устройство к началу приема данных;
- коды коррекции ошибочных битов (сверточные и т.п.); биты данных пользователя;
- биты идентификации, предназначенные для распознавания видео- и аудиоинформации в пакете;
- биты флага данных, несущие информацию о скремблировании (закрытости) канала, его приоритете;
- данные, указывающие на длину заголовка пакета, содержащего до 200 байтов. Они отмечают число байтов, которые могут присутствовать до начала передачи информационной части пакета.
Кодированные данные изображения и звука, а также различная дополнительная информация объединяются в мультиплексоре в единый поток данных: это по сути программный мультиплексор.
Эта часть аппаратуры цифрового ТВ составляет подсистему кодирования источника информации и мультиплексирования. Ее функция — максимально сжать информационный поток источника.
Объединение нескольких ТВ программ (1, 2, 3) в транспортный поток осуществляется в транспортном мультиплексоре (рис. 11).
Рисунок 11 – Формирование транспортного потока
Стандарт кодирования видео- и звуковой информации MPEG-4
До недавнего времени в вещании преобладала концепция «телевидения» программа готовилась в студии и передавалась как периодическая последовательность строк изображения и сопутствующих звуков. Все усовершенствования, включая появление цифрового вещания и стандарта MPEG-2, не изменили эту концепцию в корне, хотя добавили к ней некоторые новые аспекты — многопрограммность, подписку, дополнительные услуги, зачатки интерактивности.
В последние годы мультимедийные и графические средства все чаще вторгаются в область классического ТВ вещания, которое, в свою очередь, проникает в сферу мультимедиа (значительная часть ТВ и звуковых программ транслируется в Интернете, иногда в специальных Интернет-версиях). Аудиовизуальное содержание все чаще используется в интерактивных приложениях, таких, например, как игры или дистанционное обучение. Заметно размывается граница между компьютерными изображениями, виртуальной реальностью и телевидением. Все чаще возникает необходимость перемещать один и тот же контент из одной сети в другую, из одной сферы в другую, и требуются унифицированные форматы представления и передачи информации.
Все эти факторы сформировали потребность в едином стандарте, который бы определял формат представления аудиовизуальной информации, совместимый с любой средой распространения, и механизмы интерактивного взаимодействия с мультимедийным контентом. В стандарте должны быть предусмотрены возможности передачи различных видов видео- и аудиоданных — текста, графики, двумерных (2D) и трехмерных (3D) изображений, натурального и синтезированного видео и аудио, в потоковой форме или в виде загружаемых файлов. Именно эти задачи решает стандарт MPEG-4 «Информационные технологии — Обобщенное кодирование аудиовизуальных объектов»
MPEG-4 является стандартом ISO/IEC, разработанным комитетом MPEG (Moving Picture Experts Group.
Стандарт MPEG-4 охватывает следующие области:
· цифровое телевидение и видеосвязь;
· интерактивную графику, синтез изображений;
· интерактивные мультимедийные приложения, в том числе передаваемые через Интернет.
Тенденция последних лет сближение, слияние этих источников аудиовизуальной информации, появление новых источников как натурального, так и синтезированного контента (содержания).
Стандарт MPEG-4 позволяет передавать и записывать в различные ЗУ видео- и звуковую информацию с очень большими коэффициентами сжатия. Первоначально он создавался для передачи движущихся изображений и звука по узкополосным каналам связи, что необходимо как в системах видеосвязи при использовании обычных телефонных сетей и относительно низкоскоростных цифровых каналов (64 кбит/с), так и для передачи через Интернет. В настоящее время MPEG-4 получил широкое распространение как средство записи кинофильмов и видеопрограмм на лазерные диски. Кроме того, новый стандарт обеспечивает интерактивность, т.е. возможность для пользователя управлять процессом передачи ему информации путем запросов, выбора вариантов и других действий.
Объекты и сцены
Важнейшей особенностью MPEG-4 является объектно-ориентированныйподход, сущность которого заключается в том, что передаваемое изображение со звуковым сопровождением представляется как совокупность видео- и/или аудио- объектов (медиа-объектов).
Видеообъектами (VO - visual object) могут быть изображения людей и предметов, перемещающихся перед неподвижным фоном, и сам неподвижный фон. Обычное телевизионное изображение может быть единым видеообъектом.
Аудиообъектами (АО - audio object) могут быть голоса людей, музыка, другие звуки.
Связанные видео- и аудиообъекты, например, изображение человека и его голос, образуют аудио-визуальный объект (AVOs - audio-visual object).
Любая сцена разделяется на объекты, которые соотносятся в пространстве и времени и описываются отдельными элементарными потоками (ЭП). Объекты могут быть натуральными – записанными с видеокамеры или микрофона, и синтетическими – синтезированными в компьютере.