Видеоконференция в Internet
Аннотация.
В дипломном проекте было разработано абонентское устройство для проведения
видеоконференций в сетях INTERNET со следующими входными параметрами:
стандартный цифровой компонентный цифровой сигнал формата ITU-R 601/25 и
выходными – стандартный компонентный цифровой сигнал формата ITU-R 601/25. Для
устройства кодирования – декодирования выбрали : цифровую камеру PANASONIC
GN213, микросхемы американской фирмы GET PLESSEY, компьютер INTEL Pentium,
видеомонитор VIEW SONIC 17 GS с разрешением 0,26 дюйм.
Введение:
Данный дипломный проект посвящен разработке абонентского устройства для
проведения видеоконференций в Internet. Эта проблема становится все более
актуальна в последнее время. Среди наиболее перспективных сфер применения
видеоконференций можно выделить следующие: совместная работа над документами,
приложениями в рабочей группе; корпоративная сеть, в том числе с использованием
надомного офиса. Данный способ групповой работы находит все большее применение
благодаря увеличению числа компаний, рабочие места сотрудников которых
располагаются по месту жительства, что способствует повышению эффективности их
работы и существенной экономии средств. В частности, исключается аренда
помещений, оплата счетов на электроэнергию, рабочее время.
Получившая в последнее время развитие практика постепенного внедрения средств
видеоконференций в сферу обучения позволит не просто прослушать и увидеть лекцию
известного преподавателя, находящегося в другом полушарии, но осуществлять
интерактивное общение с помощью видеоконференций.
В дипломном проекте рассмотрен стандарт Н.323 для проведения видеоконференций в
сетях с интегрированными услугами. Разработана структурная схема абонентского
устройства со следующими параметрами: входные параметры устройства кодирования -
Стандартный цифровой компонентный телевизионный сигнал ITU-R 601/25, выходные
параметры декодирования: стандартный цифровой компонентный сигнал формата ITU-R
601/25
Экономический расчет показывает, что внедрение именно этого устройства является
актуальным.
Глава 1. Обзор систем видеоконференций
п. 1.1. Назначение систем видеоконференций.
В связи с бурным развитием сетевых и коммуникационных технологий, возросшей
производительностью компьютеров, и, соответственно, с необходимостью
обрабатывать все возрастающее количество информации (как локальной, находящейся
на одном компьютере, так и сетевой и межсетевой) возросла роль оборудования и
программного обеспечения, что можно обозначить одним общим названием "person to
person". Виртуальные средства обучения, удаленный доступ, дистанционное обучение
и управление, а также средства проведения видеоконференций переживают период
бурного расцвета и предназначены для облегчения и увеличения эффективности
взаимодействия как человека с компьютером и данными, так и групп людей с
компьютерами, объединенными в сеть. Несмотря на то, что экологическая ниша
видеоконференций разработана не на все сто процентов, уже сейчас в мире имеется
более 200 компаний, которые предлагают различное оборудование и программное
обеспечение для их организации и проведения.
Благодаря тому, что видеоконференции, предоставляют возможность общения в
реальном режиме, а также использования разделяемых приложений, интерактивного
обмена информацией, их начинают рассматривать не только как нечто
экспериментальное, но и как частичное решение проблемы автоматизации
деятельности и предприятия, и человека, дающее существенное преимущество по
сравнению с традиционными решениями.
Средства проведения видеоконференций, бывшие диковинкой два года назад, уже
сейчас находят широчайшее применение в большинстве корпоративных,
государственных и частных учреждений. Уже к началу 1995 года во всем мире
имелось свыше 100 тысяч настольных систем видеоконференций. Причем увеличение
установленных систем осуществляется экспоненциально. В начале 1996 года число
установленных во всем мире систем превышало 350 тысяч, из которых более двух
третей - в США. В США же никого не удивляет тот факт, что в визитных карточках,
наряду с телефоном, факсом, адресом электронной почты и адресом в Internet,
указываются телефон и адрес, по которым можно осуществить видеоконференцсвязь с
хозяином визитной карточки. В связи с бурным развитием глобальных сетей и
максимальным использованием средств видео и аудио для достижения существенного
роста эффективности выполняемых действий большинство компаний, входящих в список
Fortune 500 и государственных учреждений, США к концу 1998 года планируют
оснастить средствами проведения видеоконференций более 90 процентов рабочих
мест.
Удаленная диагностика человека, оборудования, удаленное обучение - еще одно
интересное направление применения средств видеоконференций. Даже находясь в
сотнях километров от пациента, врач может правильно продиагностировать больного,
прибегая к "виртуальной" консультации высококлассных специалистов, присутствие
которых в данном месте не представляется возможным. Аналогично группа экспертов
может провести диагностирование оборудования, находясь в офисе и не тратя время
на бесконечные перелеты.
Получившая в последнее время развитие практика постепенного внедрения средств
видеоконференций в сферу обучения позволит не просто прослушать и увидеть лекцию
известного преподавателя, находящегося в другом полушарии, но осуществлять
интерактивное общение с помощью видеоконференций.
Однако вплоть до недавнего времени настольная видеоконференцсвязь являлась
недостаточно качественной и технически полноценной (при исключительно высокой
цене - до 20 тысяч долларов в расчете на рабочее место) для того, чтобы ее
воспринимать серьезно. Сейчас ситуация изменилась в лучшую сторону, причем
стоимость даже наиболее сложных изделий не превышает 6-7 тысяч долларов, а
большинство систем настольных видеоконференций не дороже 2000 долларов.
Традиционно видеоконференции характеризовались как комбинация
специализированного звука и видео, а также технологии работы с сетями связи для
взаимодействия в реальном масштабе времени и часто использовались рабочими
группами, которые собирались в специализированном месте (обычно это был зал
заседаний, оснащенный специализированным оборудованием), чтобы связаться с
другими группами людей. Стоимость средств видеоконференций, используемых для
этого, была велика из-за необходимости использования специализированного
высококачественного оборудования и дорогих арендованных каналов связи.
История настольной видеоконференцсвязи - это отнюдь не идеальная история долгого
использования видеоизображений размером с почтовую марку и чрезвычайно низкого
качества. Всегда существовали проблемы с передачей информации и ее искажением,
тем более что имевшиеся тогда технические и программные средства, увы, не
способствовали популярности и, соответственно, распространению
видеоконференцсвязи. [6]
Можно предположить, что средства проведения видеоконференций начали интенсивно
развиваться и что технология, используемая при этом, предлагает серьезный
вариант обмена информацией и связи между людьми, являясь достойной альтернативой
другим формам связи и совместной работы.
Исторически сложилось так, что средства проведения видеоконференций можно
разделить не только по техническим характеристикам и принципам соответствия
различным стандартам, но и на настольные (индивидуальные), групповые и
студийные. Каждый из этих вариантов видеоконференций четко ориентирован на
решение своих задач. Наиболее распространены благодаря относительно невысокой
стоимости и быстроте окупаемости затрат сегодня настольные средства проведения
видеоконференций.
Настольные видеоконференции (НВ)
рис. 1
Доступная аудитория и вариант общения: обычно диалог двух лиц. Качественная
характеристика связи: нет необходимости в большой производительности (ширине
полосы связи). Стиль общения: неформальный, спонтанный. Необходимые затраты:
только программное и аппаратное обеспечение, используемое на рабочем месте.
Необходимое оборудование: компьютер с установленной поддержкой аудио и видео,
микрофон, динамики или наушники, видеокамера, LAN, ISDN соединение.
Оптимально для совместного интерактивного обмена информацией, использование
разделяемых приложений, пересылка файлов с низкими временными и финансовыми
затратами.
Настольная видеоконференция объединяет аудио- и видеосредства, технологии связи
для обеспечения взаимодействия в реальном масштабе времени путем использования
обычного персонального компьютера. При этом все участники находятся на своих
рабочих местах, а подключение к сеансу видеоконференций производится с
персонального компьютера способом, очень похожим на обычный телефонный звонок.
[6]
Настольная видеоконференция позволяет пользователям эффектно заполнять
промежутки времени между согласованием совместных действий и выполнением
согласованных действий, что дает несравненно больший эффект, чем просто общение
по телефону.
Для НВ требуются персональный компьютер, сконфигурированный для использования в
сети, со звуковыми и видеовозможностями, кодер-декодер (для сжатия/декомпрессии
звуковых и видеосигналов), видеокамера, микрофон, быстродействующий модем,
сетевое соединение или ISDN линия.
Способность совместно использовать приложения - неотъемлемая часть современных
настольных систем видеоконференций. При совместном использовании идей или данных
уже недостаточно видеть и слышать другого человека. Значительно больший эффект
дает совместное общение при помощи аудио- и видеоинформации вместе с
возможностью одновременно видеть и использовать различные документы и
приложения.
В настоящее время большинство наиболее популярных НВ систем использует
"whiteboard", или доску объявлений. С ее помощью отдельная экранная область
зарезервирована для просмотра и совместного использования документов в
дополнение к окну конференцсвязи, на котором отображаются участники НВ.
Доска объявлений
Обычно под доской объявлений нужно понимать программное обеспечение, дающее
возможность совместного создания и редактирования документа всеми участниками
конференции. Причем сам документ может не только состоять из текстовой
информации, но и иметь возможность отображать и графику и различные элементы
оформления, такие, как выделение участков текста маркером, например.
Преимуществом доски объявлений над другими средствами групповой обработки
информации, имеющимися в НВ, является относительно высокое быстродействие ее по
сравнению с разделяемыми приложениями.
Доступная аудитория и вариант общения: группа с группой. Качественная
характеристика связи: необходима большая производительности (ширине полосы
связи). Стиль общения: практически формальный, ориентирующийся на регламент.
Необходимые затраты: программное и аппаратное обеспечение, а также затраты на
специализированные средства и помещения.
Необходимое оборудование: обязательны дисплей (по диагонали 29 или 37 дюймов) с
возможностью масштабирования изображения, switched 56, ISDN соединение,
специализированное оборудование.
Оптимально для совместной интерактивной выработки решений, организации
группового взаимодействия между удаленными группами. Характерные представители:
PictureTel (Concorde 4500).
Как видно из вышеперечисленных характеристик, ГВ подходят для организации
эффективного взаимодействия больших и средних групп пользователей. Причем
благодаря значительно более высокому качеству видеоизображения сегодня возможны
обмен и просмотр документов, демонстрация которых в НВ исключается. Кроме того,
ГВ идеально подходят для проведения дискуссий и выступлений там, где личное
присутствие невозможно.
Число устанавливаемых систем ГВ сопоставимо с числом НВ, но возрастать оно будет
не столь быстро, как НВ, из-за необходимости использования в ГВ, как минимум,
ISDN линии.
Студийные видеоконференции (СВ)
Доступная аудитория и вариант общения: обычно один говорящий с аудиторией.
Качественная характеристика связи: необходима максимальная производительность
(ширина полосы связи). Стиль общения: формальный, жестко регламентированный,
устанавливаемый ведущим. Необходимые затраты: на оборудование студии, на
специализированное оборудование.
Необходимое оборудование: студийная камера(ы), соответствующее звуковое
оборудование, контрольное оборудование и мониторы, доступ к спутниковой связи
или оптоволоконной линии связи. Оптимально для решения задач, где требуется
максимальное качество и максимум возможностей для организации обработки
информации большим числом людей. Характерные представители: специализированное
телеоборудование.
Настольные видеоконференции - относительно новая технология, появившаяся из
нескольких других существующих технологий. В прошлом настольные видеоконференции
были невозможны. Однако интенсивное развитие компьютерных технологий, особенно
технологий связи, мультимедиа и персональных компьютеров, дало им жизнь. Сегодня
большинство компаний ищут способы использования этой новой технологии, чтобы
сохранить конкурентоспособность на своем сегменте рынка.
Первыми появились студийные видеоконференции, использующие специализированное
телевизионное оборудование, которое стоило многие десятки, если не сотни тысяч
долларов и которые напоминали собой телевизионную студию со специализированным
осветительным и звуковым оборудованием, с десятком камер. Кроме того, либо
приходилось арендовать специализированную линию, либо использовать спутниковую
связь. Студийные видеоконференции - это своего рода "hi-end" системы. Их
используют только большие корпорации, имеющие возможность вкладывать многие
сотни тысяч долларов в создание, развитие и поддержание в рабочем состоянии
оборудования. Однако, несмотря на чрезвычайно высокую стоимость, в мире имеется
более 5000 систем (по оценкам западных экспертов - Binder, John.
"Videoconferencing: Yesterday`s Science Fiction, Today`s Telephone." Aerospace
America, February, 1995), которые в данный момент эксплуатируются. Столь
огромное количество этих систем объясняется достаточно большим временным
интервалом, в течение которого осуществлялось их внедрение.
Групповые системы видеоконференции представляют собой нечто более близкое к
настольным, чем студийным. Поэтому большинство фирм, выпускающих настольные
средства видеоконференций, имеют в своем каталоге один-два варианта групповых.
Самая недорогая и распространенная система видеоконференций базируется на
персональном компьютере. Большинство настольных видеоконференций состоит из
набора программ и аппаратуры, интегрированных в компьютер. Цена такого комплекта
может колебаться от 1500 до 7000 долларов. Типичный набор состоит из одной-двух
периферийных плат, видеокамеры, микрофона, колонок или наушников и программного
обеспечения. Для связи используется либо локальная сеть, либо ISDN, либо
аналоговые телефонные линии.
Поскольку у них различные методы передачи и несмотря на имеющиеся стандарты,
пока существуют проблемы в соединении и совместном использовании изделий
различных производителей. Еще одной проблемой является низкое быстродействие при
передаче по аналоговым линиям. Скорость самого быстродействующего модема (по
крайней мере, из используемых) составляет 28.8 Кбит/с. Это фактически приводит к
тому, что передача данных получает больший приоритет и становится более важной,
чем аудио и видео. Поэтому настольные видеоконференции с использованием модемной
связи обеспечивают передачу от 4 до 10 видеокадров в секунду, что вряд ли
приемлемо. В лучшем случае результатом будет окошко с видеоизображением размером
в 176х144 элемента. (Salamone, Salvatore. " Videoconferencing`s Achilles Heels."
Byte, August 1995).
Если же использовать ISDN, где доступна связь на скоростях 128 Кбит/сек, то
возможна передача видео от 10 до 30 кадров в секунду с вдвое большим окном, чем
при модемной связи. По оценкам аналитиков, доля использования ISDN возрастет от
50 до 80 процентов от общего числа систем видеоконференций. К сожалению, и ISDN
присущи определенные недостатки, среди которых надо выделить высокую стоимость.
Наиболее оптимальный уровень быстродействия - это использование локальной
вычислительной сети в качестве конвейера передачи. При этом на основе протокола
CSMA-CD (Carrier-Sense Multiple Access/Collision Detection, или множественный
доступ с контролем носителя и обнаружением конфликтов, - стандартный метод и
протокол асинхронного доступа к сети с широкой топологией) теоретическое
быстродействие передачи составляет 10 Mbps (или даже 100 Mbps с более новыми
системами). Данный вариант имеет преимущество в быстродействии, однако чтобы
получить подобный высокий уровень производительности, сеть должна быть
специально выделена для проведения видеоконференций (несколько неблагоразумно
предполагать, что вся система локальной сети на основе протокола CSMA-CD будет
создана для единственной цели - для видеоконференции). Действительно, если бы
видеоконференция использовала существующую систему, то в итоге быстродействие
было бы меньше оптимального из-за необходимости совмещать стандартные функции
локальной сети с проведением видеоконференций. Большинство локальных
вычислительных сетей использует посылку пакетов данных, в то время как системе
видеоконференций требуется пересылка непрерывных потоков данных.
Нужно помнить, что нет стандартов для межсоединения сетей видеоконференций (H.
320 относится только к ISDN), следовательно, существуют проблемы корректного
связывания разнородных сетей видеоконференций. Кроме того, стандарт Н.320,
признанный сейчас базовым, на основе которого разрабатываются остальные
стандарты видеоконференций, в свое время встретил противодействие Intel. Она в
противовес ITU сформировала свой собственный комитет PCWG, который занимался
продвижением стандарта Indeo фирмы Intel. Недовольство фирмы Intel было вызвано
ограничениями, накладываемыми стандартом Н.320 (вернее, ее подразделом G.261).
Ситуация со стандартами для видео (противостояния VHS и Video-8) не повторилась.
Intel обеспечила совместимость с Н.320 (только QCIF, но не CIF, как PictureTel,
например).
Идеи по развитию видеоконференцсвязи упираются в такие достаточно серьезные
проблемы, как полное соответствие систем прежде всего принятым промышленным
стандартам, таким, как H.320, который определяет, каким образом, в каком объеме
и с каким качеством будут передаваться аудио- и видеоданные по линиям ISDN.
Несмотря на не стихающие споры, большинством ведущих поставщиков стандарт H.320
оценен как самый жизнеспособный, наиболее удачно сочетающий скорость передачи и
качество передаваемой информации по узкополосным линиям, подобно тому как V.32
является общепринятым стандартом для определения рабочих характеристик модемной
связи.
Стремление привести все средства к единому стандарту весьма важно. Это дает
возможность многим потенциальным поставщикам ввести в рынок различные решения,
ориентированные как на разнообразные сферы применения, так и на различные
ценовые группы и гарантирующие конечному пользователю возможность сделать выбор,
не опасаясь несовместимости между декларированными системами. Это также
означает, что настольная видеоконференцсвязь используется на предприятии,
которое приобрело достаточное число однотипных комплектов. А это в свою очередь
при соответствии всех систем стандартам видеоконференцсвязи позволит приобретать
наборы, которые по своим характеристикам наиболее полно соответствуют
требованиям специфических приложений пользователя без ограничения на
использование других комплектов как программного, так и коммуникационного и
аппаратного обеспечения.
Основная проблема с качеством видео состоит в том, что имеющиеся технологии
позволяют осуществлять относительно низкую скорость передачи кадра (фрейма).
Однако эта проблема может быть решена, если система будет использовать хорошую
видеофиксацию и эффективную реализацию сжатия изображения без существенной
потери качества.
Значительно проще решение проблем с качеством аудио. Несмотря на то, что среднее
человеческое ухо в состоянии воспринимать колебания от 20 Герц до 20 кГерц,
колебания, вызываемые человеческим голосом, лежат в значительно более узкой
полосе. Это позволяет существенно уменьшить расходы сетевого трафика на передачу
аудиоинформации. Вот почему многие поставщики систем настольных видеоконференций
предпочитают класть в основу своих продуктов хорошее качество аудио и развитые
средства групповой обработки информации.
Качество и объем данных
Чем выше передаваемый объем данных, тем более качественным получается
видеоизображение. При скорости T1 (1536 Кб/с) качество видео наиболее
оптимально. Однако большинство пользователей не могут использовать данную
скорость из-зи большой стоимости . Именно поэтому для пользователей, которым
требуется оптимальное сочетание качества видео и стоимости, особенно популярно
использование 768 Кб/с. Большинство организаций использует 384 Кб/с. Наконец,
128 Кб/с доступно большинству частных пользователей ISDN.
Кроме того, существует целый ряд стандартов, прямо и косвенно базирующихся на
Н.320: Н.310 (для АТМ и широкополосной ISDN), Н.322 (isoEthernet), Н.323
(Ethernet) и, Н.324 (для аналоговых линий). В стандарте Н.321 добавлен стандарт
MPEG-2, позволяющий получить полноэкранное видеоизображение телевизионного
качества. [7]
Если поддержка стандартов ряда Н.320, Н.323, Р.324 декларирована огромным
количеством поставщиков, то наибольшее число проблем связано со стандартом
Т.120). Т.120 регламентирует разделение документов, приложений, использование
доски объявлений и пересылку файлов. Менее 10 процентов изделий ведущих
поставщиков оборудования для настольных видеоконференций поддерживает указанный
стандарт (из более чем 60 основных наименований - всего 6).
Видеоконференции - оптимальный выбор
Как сделать правильный выбор, необходимо ли вложить максимум средств, купить
десяток дорогостоящих систем или ограничиться более простыми и приобрести вдвое
больше?
Неправильное вложение средств может привести к не использованию передовыми
технологиями. Именно поэтому при решении вопроса использования средств
видеоконференций необходимо исходить из ряда факторов, где цена и обилие
возможностей стоят, отнюдь, не на первом месте. В первую очередь нужно знать
несколько ключевых моментов, на основе которых и следует оценивать средства
видеоконференций.
В основе любой современной системы проведения видеоконференций лежит устройство,
называемое кодер-декодером (кодеком). Кодек ответствен за кодирование,
декодирование, сжатие и декомпрессию звуковых и видеосигналов. При всех прочих
равных условиях (например, при одинаковом качестве камер) чем лучше реализован
кодек, тем лучше звуковой и видеосигнал. Функции кодек могут быть выполнены
программным обеспечением либо аппаратным путем с помощью DSP или некоторой
комбинации из программного и аппаратного обеспечения. Главный фактор, влияющий
на цену системы, - цена и возможности кодека. Реализованные программно кодеки
иногда в несколько раз дешевле аппаратных. Однако для успешного использования их
необходима значительно более высокая производительность компьютера, а также
нужно больше места на жестком диске и больше оперативной памяти. Иногда
групповые и настольные системы так близки по возможностям и ценам между собой,
что бывает трудно корректно позиционировать их, тем более что большинство
поставщиков имеют в своем арсенале и те и другие.
Персональные системы обычно выполняются как приложения для Windows, с
видеоизображением в маленьком окне на рабочем столе. Они также используют
одиночную ISDN линию (один или два 64-Kбит/с b-канала). Кроме традиционной
двухсторонней звуковой и видеосвязи, эти системы, как правило, предоставляют
возможности, которые облегчают совместное использование данных, разделяемых
приложений, что позволяет обеим сторонам редактировать документ или электронную
таблицу. Термин "говорящие головы" иногда характеризует звуковое и видеокачество
этих систем. Быстрые движения приводят к значительному искажению изображений,
именуемому обычно эффектом тени. Такое качество - результат ограничений ширины
полосы частот, компромиссов в реализации кодека, дешевой камеры и звуковых
компонентов. Поэтому в данных системах, хотя и декларируется совместимость со
стандартами Н.320 и G.261, в большинстве случаев частота кадров не превышает 10,
а разрешение CIF вообще недоступно.
Системы групповых конференций, с другой стороны, иногда предлагают видео в
полный экран, 30 кадров в секунду, а также высочайшее качество аудио.
Достигается это путем использования сложных кодеков, высококачественных аудио- и
видеокомпонент и значительной полосы пропускания, лежащей вне пределов
одноканальной ISDN. Поэтому неудивительно, что стоимость таких систем может в
несколько раз превышать вроде бы близкую по характеристикам настольную систему.
Так что если есть потребность в использовании групповых средств
видеоконференций, то необходимо применение Т1 (как дробного, так и выделенного)
или PRI соединения ISDN. Следовательно, минимум для них - 384 Кбит/с.
Еще одна серьезная проблема - проведение конференций с числом участников более
20 и совместное использование не совсем совместимых систем. Для решения этих
проблем используются специализированные устройства MCU (Multipoint Control
Unit), которые исторически являются своеобразными бриджами для соединения Н.320
совместимых устройств. В число основных функций MCU входит кодирование,
декодирование, микширование аудио- и видеосигнала, а также управление, контроль
за проведением видеоконференции. Однако сейчас название MCU ошибочно дается тем
бриджам, которые поддерживают многосторонние конференции с использованием только
данных или данных и аудио и несовместимы с Н.320. На самом деле эти устройства
называются MCS (Multimedia Conferencing Server).
Характерным примером средств настольных видеоконференций со всеми присущими им
достоинствами и недостатками можно считать Intel ProShare Personal Video
Conferencing System 200, которая, не будучи самой распространенной системой, тем
не менее является одной из наиболее функционально богатых, аппаратно-совместимых
и не очень дорогих решений для видеоконференций на базе Windows-совместимых
компьютеров.
Видеоконференции в настоящее время -относительно новая технология, которая
появилась путем использования лучших свойств других технологий, в том числе и
столь популярной сегодня мультимедиа. Два-три года назад трудно было
предугадать, что видеоконференции из забав для профессионалов превратятся в
серьезные инструменты для решения проблем, которые постоянно возникают в нашем
стремительно меняющемся мире. Сегодня большинство компаний ищут способы
использовать эту новую технологию, чтобы остаться конкурентоспособными на своем
сегменте рынка.
П. 1.2. Передача мультимединых данных в INTERNET в реальном масштабе времени
Системы видеконференций базируются на достижениях технологий средств
телекоммуникаций и мультимедиа. Изображение и звук с помощью компьютера
передаются по каналам связи локальных и глобальных вычислительных сетей.
Ограничивающими факторами для таких систем будет пропускная способность канала
связи и алгоритмы компрессии/декомпрессии цифрового изображения и звука.
Предположим, мы имеем неподвижную картинку (кадр) на экране компьютера размером
300х200 пикселов с глубиной цвета всего 1 бит/пиксел. На запись такого
изображения потребуется 60 Kбайт. Скорость смены кадров в телевизоре составляет
25 кадров/с, в профессиональном кинопроекторе 24 кадра/с. Нам бы хотелось
получить такую же частоту смены кадров размером 60 Kбайт каждый при сеансе связи
в системе видеоконференции. Для этого наш канал связи должен обеспечить
пропускную способность 1,5 Mбайт/с. Ни один современный канал связи такой
пропускной способности за разумную цену не обеспечивает, поэтому возникает
проблема сжатия видеосигнала. На сегодня известны два основныхтипа алгоритмов
сжатия видеоизображения : алгоритмы сжатия без потерь и алгоритмы сжатия с
потерями. Алгоритмы сжатия с потерями позволяют добиться очень высокой степени
сжатия изображения, такой, что даже по низкоскоростным каналам связи можно
передавать изображения с незначительной потерей качества, практически незаметной
для человеческого глаза. Выполнение таких алгоритмов требует достаточно больших
вычислительных мощностей. Для достижения приемлемых частот смены кадров на
экране монитора требуется дорогостоящее аппаратное обеспечение, называемое общим
словом CODEC (compression/decompression). Концепция настольных видеоконференций
предполагает возможность доступа к телеконференциям с любого, даже домашнего,
компьютера. Использование дорогостоящего оборудования CODEC идет вразрез с этой
концепцией, что заставляет создателей аппаратуры систем видеоконференций
прибегать к разумным компромиссам. Декомпрессия изображения требует меньшей
вычислительной мощности, чем компрессия, поэтому некоторые производители
используют аппаратные средства для компресcии данных, а декомпрессия
осуществляется программно. [11]
Стандарт JPEG и его производные
Стандарт JPEG (Joint Photographic Experts Group, группа экспертов по
фотографическим изображениям) является стандартом ISO (International Standards
Organization, Международная организация по стандартизации). Этот стандарт
поддерживает компрессию как с потерями, так и без потерь. Однако если термин
"формат стандарта JPEG" употребляется без каких-либо оговорок, то обычно это
означает, что подразумевается компрессия с потерями. Сжатие изображения по
методу JPEG предполагает преобразование блоков изображения в реальном цвете
размером 8х8 пикселов в набор уровней яркости и цветности. К каждому блоку
применяется двумерное дискретное преобразование Фурье, в результате чего
получается набор из 64 коэффициентов, представляющих данный блок. Затем
коэффициенты квантуются с помощью таблиц компонентов яркости и цветности, после
чего информация о блоке упаковывается в коэффициенты, соответствующие меньшим
частотам. В результате получается представление коэффициентов в двоичном виде.
Этот метод обеспечивает сжатие изображения в пределах от 10:1 до 20:1 при
приемлемом качестве. Основное назначение формата JPEG с потерями -- получение
фотографических изображений высокой степени сжатия при незначительных видимых
потерях качества. Формат MJPEG, или Motion JPEG (JPEG для подвижных изображений)
стандартом ISO не является. Тем не менее, так принято называть цифровой
видеосигнал, представляющий собой последовательность изображений, сжатых с
потерями в стандарте JPEG.
Стандарт Н.261 разработан организацией по стандартам телекоммуникаций ITU
(Международный союз телефонной связи), которая раньше называлась CCITT
(Международный консультативный комитет по телеграфии и телефонии). На практике,
первый кадр в стандарте H.261 всегда представляет собой изображение стандарта
JPEG, компрессированное с потерями и с высокой степенью сжатия. Последующие
кадры строятся из фрагментов изображения (блоков), либо JPEG-подобных, либо
фиксирующих отличия от фрагментов предыдущего кадра. Последовательные кадры
видеоряда, как правило, очень похожи друг на друга. Поэтому стандарт Н.261 чаще
всего используют в телеконференциях. Код, задающий перемещение части
изображения, короче кода аналогичного фрагмента в стандарте MJPEG, то есть
требует передачи меньшего количества данных. Поэтому при определенном значении
пропускной способности линии связи изображение в формате H.261 зрительно
воспринимается более качественным, чем изображение в формате MJPEG. Различия
кадров всегда кодируются исходя из предыдущего кадра. Поэтому данная методика
получила название "дифференциация вперед" (forward differencing). Итак,
изображение в формате H.261 передается меньшим количеством данных, и, кроме
того, для декодирования такого изображения требуется меньше вычислительной
мощности, чем для декодирования видеопотока в формате MJPEG при аналогичном
качестве.
Спецификация MPEG (Motion Picture Experts Group, Группа экспертов по подвижным
изображениям) предлагает еще более изощренную, чем стандарт H.261, методику
повышения качества изображения при меньшем объеме передаваемых данных,
реализованную в стандартах MPEG-1 и MPEG-2. Помимо дифференциации вперед,
стандарт MPEG-1 обеспечивает дифференциацию назад (backward differencing) и
усреднение (averaging) фрагментов изображения. Даже на CD-ROM c одинарной
скоростью передачи данных (1,2 Мбит/с) MPEG-1 позволяет добиться качества,
сравнимого с качеством кассеты VHS, записанной на профессиональной аппаратуре.
Кроме того, MPEG-1 нормирует кодирование аудиосигнала, синхронизированного с
видеосигналом. 2.2.4.1.[10]
ВИДЕО MPEG
Цветное цифровое изображение из сжимаемой последовательности переводится в
цветовое пространство YUV (YCbCr). Компонента Y представляет собой
интенсивность, а U и V - цветность. Так как человеческий глаз менее восприимчив
к цветности, чем к интенсивности, то разрешений цветовых компонент может быть
уменьшено в 2 раза по вертикали, или и по вертикали и по горизонтали. К анимации
и высококачественному студийному видео уменьшение разрешения не применяется для
сохранения качества, а для бытового применения, где потоки более низкие, а
аппаратура более дешевая, такое действие не приводит к заметным потерям в
визуальном восприятии, сохраняя в то же время драгоценные биты данных.
Основная идея всей схемы - это предсказывать движение от кадра к кадру, а затем
применить дискретное косинусное преобразование (ДКП), чтобы перераспределить
избыточность в пространстве. ДКП выполняется на блоках 8х8 точек, предсказание
движения выполняется на канале интенсивности (Y) на блоках 16х16 точек, или, в
зависимости от характеристик исходной последовательности изображении
(чересстрочная развертка, содержимое), на блоках 16х8 точек. Другими словами,
данный блок 16х16 точек в текущем кадре ищется в соответствующей области
большего размера в предыдущих или последующих кадрах. Коэффициенты ДКП (исходных
данных или разности этого блока и ему соответствующего) квантуются, то есть
делятся на некоторое число, чтобы отбросить несущественные биты. Многие
коэффициенты после такой операции оказываются нулями. Коэффициент квантизации
может изменяться для каждого "макроблока" (макроблок - блок 16х16 точек из
Y-компонент и соответствующие блоки 8х8 в случае отношения YUV 4:2:0, 16х8 в
случае 4:2:2 и 16х16 в случае 4:4:4. Коэффициенты ДКП, параметры квантизации,
векторы движения и пр. кодируется по Хаффману с использованием фиксированных
таблиц, определенных стандартом. Закодированные данные складываются в пакеты,
которые формируют поток согласно синтаксису MPEG.
Соотношение кадров друг с другом
Существует три типа закодированных кадров. I-фремы - это кадры, закодированные
как неподвижные изображения - без ссылок на последующие или предыдущие. Они
используются как стартовые. P- фреймы - это кадры, предсказанные из предыдущих
I- или P-кадров. Каждый макроблок в P- фрейме может идти с вектором и разностью
коэффициентов ДКП от соответствующего блока последнего раскодированного I или P,
или может быть закодирован как в I, если не соответствующего блока не нашлось.
И, наконец, существуют B- фреймы, которые предсказаны из двух ближайших I или
P-фреймов , одного предыдущего и другого - последующего. Соответствующие блоки
ищутся в этих кадрах и из них выбирается лучший. Ищется прямой вектор, затем
обратный и вычисляется среднее между соответствующими макроблоками в прошлом и
будущем. Если это не работает, то блок может быть закодирован как в I- фрейме.
Последовательность раскодированных кадров обычно выглядит как
I B B P B B P B B P B B I B B P B B P B ...
Здесь 12 кадров от I до I фрейма. Это основано на требовании произвольного
доступа, согласно которому начальная точка должна повторяться каждые 0.4
секунды. Соотношение P и B основано на опыте.
Чтобы декодер мог работать, необходимо, чтобы первый P- фрейм в потоке
встретился до первого B, поэтому сжатый поток выгдядит так:
0 x x 3 1 2 6 4 5 ...
где числа - это номера кадров. xx может не быть ничем, если это начало
последовательности, или B- фреймы -2 и -1, если это фрагмент из середины потока.
Сначала необходимо раскодировать I- фрейм , затем P, затем, имея их оба в
памяти, раскодировать B. Во время декодирования P показывается I- фрейм , B
показываются сразу, а раскодированный P показывается во время декодирования
следующего. [11]
Сжатие аудио
При сжатии аудио используются хорошо разработанные психоакустические модели,
полученные из экспериментов с самыми взыскательными слушателями, чтобы выбросить
звуки, которые не слышны человеческому уху. Это то, что называется
"маскированием", например, большая составляющая в некоторой частоте не позволяет
услышать компоненты с более низким коэфициентом в близлежащих частотах, где
соотношение между энергиями частот, которые маскируются, описывается некоторой
эмпирической кривой. Существуют похожие временные эффекты маскирования, а также
более сложные взаимодействия, когда временной эффект может выделить частоту или
наоборот.
Звук разбивается на спектральные блоки с помощью гибридной схемы, которая
объединяет синусные и полосные преобразования, и психоакустической модели,
описанной на языке этих блоков. Все, что может быть убрано или сокращено,
убирается и сокращается, а остаток посылается в выходной поток. В
действительности, все выглядит несколько сложнее, поскольку биты должны
распределяться между полосами. И, конечно же, все, что посылается, кодируется с
сокращением избыточности.
MPEG ( коэффициент сжатия).
Коэффициент сжатия свыше 100:1.
Считают, что MPEG достигает необычайно высокого качества видео при степени
сжатия свыше 100:1. Эти заявления обычно не включают понижение цветового
разрешения исходного цифрового изображения. На практике, поток кодируемого
изображения редко превышает величину потока, закодированного в MPEG, более чем в
30 раз. Предварительное сжатие за счет уменьшения цветового разрешения играет
основную роль в формировании коэффициентов сжатия с 3 нулями во всех методах
кодирования видео, включая отличные от MPEG.
Как MPEG-1, так и MPEG-2, могут быть применены к широкому классу потоков, частот
и размеров кадров. MPEG-1, знакомый большинству людей, позволяет передавать 25
кадров/с с разрешением 352x288 в PAL или 30 кадр/с с разрешением 352x240 в NTSC
при величине потока менее 1.86 Мбит/с - комбинация, известная как "Constrained
Parameters Bitstreams". Это цифры введены спецификацией White Book для видео на
CD (VideoCD).
Фактически, синтаксис позволяет кодировать изображения с разрешением до
4095х4095 с потоком до 100 Мбит/с. Эти числа могли бы быть и бесконечными, если
бы не ограничение на количество бит в заголовках.
С появлением спецификации MPEG-2, самые популярные комбинации были объединены в
уровни и профили. Самые общие из них:
•Source Input Format (SIF), 352 точки x 240 линий x 30 кадр/с, известный также
как Low Level (LL) - нижний уровень, и •"CCIR 601" (например 720 точек/линию x
480 линий x 30 кадр/с), илиMain Level - основной уровень.
Компенсация движения заменяет макроблоки макроблоками из предыдущих картинок
Предсказания макроблоков формируются из соответствующих 16х16 блоков точек (16х8
в MPEG-2) из предыдущих восстановленных кадров. Никаких ограничений на положение
макроблока в предыдущей картинке, кроме ее границ, не существует.
Исходные кадры - reference - (из которых формируются предсказания) показаны
безотносительно своей закодированной формы. Как только кадр раскодирован, он
становится не набором блоков, а обычным плоским цифровым изображением из точек.
В MPEG размеры отображаемой картинки и частота кадров может отличаться от
закодированного в потоке. Например, перед кодированием некоторое подмножество
кадров в исходной последовательности может быть опущено, а затем каждый кадр
фильтруется и обрабатывается. При восстановлении интерполированы для
восстановления исходного размера и частоты кадров.
Фактически, три фундаментальных фазы (исходная частота, кодированная и
показываемая) могут отличаться в параметрах. Синтаксис MPEG описывает
кодированную и показываемую частоту через заголовки, а исходная частота кадров и
размер известен только кодеру. Именно поэтому в заголовки MPEG-2 введены
элементы, описывающие размер экрана для показа видеоряда.
В I, P и B-фреймах все макроблоки одного типа.
В I- фрейме макроблоки должны быть закодированы как внутренние - без ссылок на
предыдущие или последующие, если не используются масштабируемые режимы. Однако,
макроблоки в P- ">фрейме могут быть как внутренними, так и ссылаться на
предыдущие кадры. Макроблоки в B- фрейме могут быть как внутренними, так и
ссылаться на предыдущий кадр, последующий или оба. В заголовке каждого
макроблока есть элемент, определяющий его тип.
Без компенсации движения:
С компенсацией движения:
Пропущенные макроблоки в P- фреймах
Пропущенные макроблоки в B- фреймах
Структура последовательности строго фиксирована шаблоном I,P,B.
Последовательность кадров может иметь любую структуру размещения I, P и B
фреймов. В промышленной практике принято иметь фиксированную последовательность
(вроде IBBPBBPBBPBBPBB), однако, более мощные кодеры могут оптимизировать выбор
типа кадра в зависимости от контекста и глобальных характеристик видеоряда.
Каждый тип кадра имеет свои преимущества в зависимости от особенностей
изображения (активность движения, временные эффекты маскирования,...). Например,
если последовательность изображений мало меняется от кадра к кадру, есть смысл
кодировать больше B- фреймов , чем P. Поскольку B- фреймы не используются в
дальнейшем процессе декодирования, они могут быть сжаты сильнее, без влияния на
качество видеоряда в целом.
Требования конкретного приложения также влияют на выбор типа кадров: ключевые
кадры, переключение каналов, индексирование программ, восстановление от ошибок и
т.д.
Коэффициенты сжатия.
Коэффициент сжатия MPEG видео часто заявляется как 100:1, тогда как в
действительности он находится в районе от 8:1 до 30:1.
Можно получить "более 100:1" для видео на компакт-диске (White Book) с потоком
1.15 Мбит/с.
1. Высокое разрешение исходного видео.
Большинство источников видеосигнала для кодирования имеют большее разрешение,
чем то, которое актуально оказывается в закодированном потоке. Самый популярный
студийный сигнал, известный как цифровое видео "D-1" или "CCIR 601", кодируется
на 270 Мбит/с.
Цифра 270 Мбит/с получается из следующих вычислений:
Интенсивность (Y):858 точек/линию x 525 линий/кадр x 30 кадр/с x 10 бит/точку ~=
135 Мбит/сR-Y (Cb):429 точек/линию x 525 линий/кадр x 30 кадр/с x 10 бит/точку
~= 68 Мбит/сB-Y (Cb):429 точек/линию x 525 линий/кадр x 30 кадр/с x 10 бит/точку
~= 68 Мбит/сИтого:27 млн. точек/с x 10 бит/точку = 270 Мбит/с
2. Следует выбросить гасящие интервалы.
Из 858 точек яркости на линию под информацию изображения задействованы только
720. В действительности, количество точек на линию - предмет многих ссор на
инженерных семинарах, и это значение лежит в пределах от 704 до 720. Аналогично,
только 480 линий из 525 задействованы под изображение по вертикали. Настоящее
значение лежит в пределах от 480 до 496. В целях совместимости MPEG-1 и MPEG-2
определяет эти числа как 704х480 точек на интенсивность и 352х480 для
цветоразностей. Пересчитывая исходный поток, будем иметь:
Y704 точек/линию x 480 линий x 30 кадр/с x 10 бит/точку ~= 104 Мбит/сC2
компоненты x 352 точки/линию x 480 линий x 30 кадр/с x 10 бит/точку ~= 104
Мбит/сИтого:~ 207 Мбит/сОтношение (207/1.15) составляет всего 180:1.
3. Следует учесть большее количество бит/точку.
В MPEG на точку отводится 8 бит. Принимая во внимание этот фактор, отношение
становится 180 * (8/10) = 144:1.
4. Учтем более высокое разрешение цветности. Известный студийный сигнал CCIR-601
представляет сигнал цветности с половинным разрешением по горизонтали, но с
полным вертикальным разрешением. Это соотношение частот оцифровки известно как
4:2:2. Однако, MPEG-1 и MPEG-2 Main Profile устанавливают использование формата
4:2:0, который считается достаточным для бытовых приложений. В этом формате
разрешение цветоразностных сигналов в 2 раза меньше по горизонтали и вертикали,
чем интенсивность. Таки образом, имеем:
720 точек x 480 линий x 30 кадр/с x 8 бит/отсчет x 1.5 остчетов/точку = 124
Мбит/с, и, таким образом, отношение становится 108:1.
5. Учтем размер кодируемого изображения.
Последняя стадия предварительной обработки - это преобразование кадра формата
CCIR-601 в формат SIF уменьшением в 2 раза по горизонтали и вертикали. Всего в 4
раза. Качественное масштабирование по горизонтали выполняется с помощью
взвешенного цифрового фильтра с 7 или 4-мя узлами, а по вертикали -
выбрасыванием каждого второй линии, второго поля или, опять, цифровым фильтром,
управляемым алгоритмом оценки движения между полями. Отношение теперь становится
352 точек x 240 линий x 30 кадр/с x 8 бит/отсчет x 1.5 отсчетов/точку ~= 30
Мбит/с.
Таким образом, настоящее отношение A/B должно вычисляться между исходной
последовательностью в стадии 30 Мбит/с перед кодированием, поскольку это есть
действительная частота оцифровки, записываемая в заголовках потока и
воспроизводимая при декодировании. Так, сжатия можно добиться уже одним
сокращением частоты оцифровки.
6. Частота кадров.
Большинство коммерческих видеофильмов снимаются с киноленты, а не с видео.
Основная часть фильмов, записанных на компакт-диски, была оцифрована и
редактирована при 24 кадр/с. В такой последовательности 6 из 30 кадров,
отображаемых на телевизионном мониторе (30 кадр/с или 60 полей/с а NTSC),
фактически избыточна, и может быть не кодирована в MPEG поток. Это ведет нас к
шокирующему выводу, что действительный поток был всего 24 Мбит/с (24 кадр/с / 30
кадр/с * 30 Мбит/с), и коэффициент сжатия составляет всего каких-то 21:1.
Даже при таком коэффициенте сжатия, как 20:1, несоответствия могут возникнуть
между исходной последовательность изображений и восстановленной. Только
консервативные коэффициенты в районе 12:1 и 8:1 демонстрируют почти полную
прозрачность процесса сжатия последовательностей с сложными
пространственно-временными характеристиками (резкие движения, сложные текстуры,
резкие контуры и т.д.). Несмотря на это, правильно закодированное видео с
использованием предварительной обработки и грамотного распределения битов, может
достигать и более высоких коэффициентов сжатия при приемлемом качестве
восстановленного изображения. [2]
Сжатие видео
При сжатии видео используются следующие статистические характеристики:
1.Пространственная корреляция: дискретное косинусное преобразование 8х8 точек.
2. Особенности человеческого зрения - невосприимчивость к высокочастотным
составляющим: скалярное квантование коэффициентов ДКП с потерей качества.
3. Большая пространственная корреляция изображения в целом: предсказание первого
низкочастотного коэффициента преобразования в блоке 8х8 (среднее значение всего
блока).
4.Статистика появления синтаксических элементов в наиболее вероятном кодируемом
потоке: оптимальное кодирование векторов движения, коэффициентов ДКП, типов
макроблоков и пр.
5.Разряженная матрица квантованных коэффициентов ДКП: кодирование повторяющихся
нулевых элементов с обозначением конца блока.
6.Пространственное маскирование: степень квантования макроблока.
7.Кодирование участков с учетом содержания сцены: степень квантования
макроблока.
8.Адаптация к локальным характеристикам изображения: кодирование блоков, тип
макроблока, адаптивное квантование.
9.Постоянный размер шага при адаптивном квантовании: новая степень квантования
устанавливается только специальным типом макроблока и не передается по
умолчанию.
10.Временная избыточность: прямые и обратные векторы движения на уровне
макроблоков 16х16 точек.
11.Кодирование ошибки предсказаний макроблоков с учетом восприятия: адаптивное
квантование и квантование коэффициентов преобразования.
12.Малая ошибка предсказания: для макроблока может быть сигнализировано
отсутствие ошибки.
13.Тонкое кодирование ошибки предсказания на уровне макроблоков: каждый из
блоков внутри макроблока может быть кодирован или пропущен.
14.Векторы движения - медленное движение фрагмента изображения со сложным
рисунком: предсказание векторов движения.
15.Появления и исчезновения: прямое и обратное предсказание в B- фреймах.
16.Точность межкадрового предсказания: билинейно интерполированные
(фильтрованные) разности блоков. В реальном мире движения объектов от кадра к
кадру редко попадают на границы точек. Интерполяция позволяет выяснить настоящее
положение объекта, зачастую увеличивая эффективность сжатия на 1 дБ.
17.Ограниченная активность движения в P- фреймах: пропущенные макроблоки. Когда
вектор движения и ошибка предсказания нулевые. Пропущенные макроблоки очень
желательны в кодированном потоке, поскольку не занимают битов, кроме как в
заголовке следующего макроблока.
18.Компланарное движение в B- фреймах : пропущенные макроблоки. Когда вектор
движения тот же, а ошибка предсказания нулевая.
Стандарт MPEG-2 [10] полностью перекрывает стандарт MPEG-1 и содержит новые,
более строгие нормы, ориентированные на требования телевизионного вещания.
Например, он поддерживает чересстрочную развертку, как в аналоговом телевидении.
Широкое распространение стандарта MPEG-2 способно привести к цифровой революции
в области видео, которую давно ожидают и которая будет сравнима с цифровой
революцией в области аудио, свершившейся в последнее десятилетие.
Хорошие рыночные перспективы имеются у всех описанных выше стандартов: JPEG,
H.261 и MPEG.
Так, формат JPEG лучше всего применять для неподвижных изображений, а также для
видеомонтажа, если требуется высокая точность монтажа отдельных кадров. Стандарт
MPEG годится для видеопродукции, потребитель которой ждет качества изображения,
сравнимого с качеством изображения на бытовой аналоговой видеокассете:
компьютерных обучающих материалов, игр, кинофильмов на CD, а также видео по
требованию (video on demand). Для на сегодняшний день чаще всего используется
стандарт H.261, так как для них не требуется видеоизображения очень высокого
качества.
Стандарт Cell
Компания Sun Microsystems предложила свой стандарт компрессии видеоизображения
-- Cell. Существуют два метода компрессии по этому стандарту: CellA и CellB.
Метод CellA требует большей вычислительной мощности для компрессии/декомпрессии
сигнала, чем метод CellB. Поэтому в системах видеоконференций, требующих работы
видео в реальном времени, используется метод CellB. В этом методе изображение
делится на 4х4 группы пикселов, называемых ячейками (cell). В основу алгоритма
компрессии положен метод BTC (Block Truncation Coding). 16 пикселов в каждой
ячейке преобразуются в 16-битовую маску цветности и две 8-битовых маски
интенсивности, поэтому для кодировки 384 битов требуются всего 32 бита. Это
означает степень сжатия 12:1. Преимущество метода Cell заключается в том, что в
процессе декомпрессии можно использовать графические примитивы Windows-подобных
систем. Такие примитивы выполняются аппаратно стандартными графическими
акселераторами, что позволяет пользоваться аппаратной декомпрессией, используя
стандартное оборудование, уже установленное в компьютере.
Стандарт NV
Подразделение PARC компании Xerox предложило метод компресии NV (Network Video).
Метод используется чаще всего в системах телеконференций, работающих в Internet.
На первом шаге алгоритма текущее изображение сравнивается с предыдущим и
выделяются области, в которых произошли значимые изменения. Компрессии и
последующей пересылке подвергаются только эти области. В зависимости от того,
что являетсялимитирующим фактором -- полоса пропускания канала связи или
вычислительная мощность оборудования, для компрессии используются либо
преобразование Фурье, либо преобразование Гаара. После квантования
преобразованного изображения достигается степень сжатия до 20:1.
Стандарт CU-SeeMe
В экспериментальной системе видеоконференций CU-SeeMe, разработанной в
Корнуэлльском университете, входное изображение представляется 16 градациями
серого цвета с 4 битами на пиксел. Изображение разбивается на блоки пикселов
общим количеством 8х8. Кадр сравнивается с предыдущим, и пересылаются только
блоки, в которых произошли значимые изменения. Компрессия этих блоков происходит
по алгоритму сжатия без потерь, разработанному специально для системы CU-SeeMe.
С учетом возможных потерь данных в канале связи периодически пересылаются и
неизменившиеся блоки. Степень сжатия изображения составляет 1,7:1. Алгоритм
компрессии изначально был разработан для аппаратно-программной платформы
Macintosh. Он работает с восемью 4-битными пикселами как 32-битными словами. Для
системы CU-SeeMe минимальная пропускная способность канала связи должна быть не
ниже 80 Кбит/с.
Стандарт Indeo
Фирма Intel разработала метод компрессии/декомпрессии Indeo. В основе метода
лежит расчет изображения текущего кадра по данным предыдущего. Передача кадра
происходит только в том случае, если расчетные значения значимо отличаются от
реальных. Компрессия осуществляется по методу 8х8 FST (Fast Slant Transform), в
котором используются только алгебраические операции сложения и вычитания.
Степень сжатия в методе Indeo составляет 1,7:1.
Стандарты компрессии/декомпрессии аудиосигнала
Методы ИКМ
Некоторые стандарты компрессии аудиосигнала основаны на технологии оцифровки
звука, называемой импульсно-кодовой модуляцией или ИКМ [4](PCM, pulse code
modulation). Аналоговый звуковой сигнал дискретизируется по времени и квантуется
по амплитуде. Чем большее количество бит используется для квантования по
амплитуде, тем более высококачественным будет воспроизведение звука. Если
использовать логарифмический шаг квантования, то звук, квантованный 8 битами,
будет соответствовать по качеству звуку, квантованному 14 битами с равномерным
шагом. При этом степень сжатия сигнала составит 1,75:1. Известны два метода
логарифмического квантования: A-law PCM и mu-law PCM. Mu-law PCM используется в
США и Японии на цифровых линиях связи ISDN. В других странах на линиях ISDN
используется метод A-law PCM. Оба метода вошли в рекомендацию стандарта G.711
ITU-TSS и требуют минимальной пропускной способности канала не ниже 64 Кбит/с.
В методе импульсно-кодовой модуляции при временной дискретизации аудиосигнала
соседние по времени аудиоимпульсы кодируются независимо друг от друга. Но, как
правило, амплитуду каждого импульса можно предсказать с большой долей
вероятности, используя значение амплитуды предыдущего импульса. В методе
адаптивной дифференциальной импульсно-кодовой модуляции ADPCM (Adaptive
Differential Pulse Code Modulation) рассчитывается разница между амплитудой
каждого импульса и его рассчитанным по предыдущему импульсу значением. Для
кодировки такой разницы требуется всего 4 бита, поэтому в методе ADPCM степень
компрессии аудиосигнала составляет 2:1. ITU-TSS рекомендует несколько
стандартов, основанных на методе ADPCM -- G.721, G.722, G.723, G.726, G.727. В
методе G.722 используется "двухуровневый" ADPCM (Sub-Band ADPCM) со степенью
дискретизации 16 КГц, 14 бит на кодировку разницы сигналов. Метод предназначен
для пропускной способности канала не ниже 64 Кбит/с.
Компрессия/декомпрессия голоса
Для кодировки только человеческого голоса могут использоваться некоторые
специальные методы. При кодировании методом линейного предсказания LPC (Linear
Predictive Coding) реальная речь накладывается на аналитическую модель
голосового тракта. По каналу связи передаются только "параметры наилучшего
совпадения", которые при декодировании используются для генерации синтетического
голоса, близкого по звучанию к оригиналу. Для LPC-кодировки требуется полоса
пропускания не ниже 2,4 Кбит/с. Развитие метода LPC, метод линейного
предсказания с возбуждением кодов CELP (Code Excited Linear Prediction),
использует такую же аналитическую модель голосового тракта, как и в методе LPC.
Но в методе CELP рассчитываются отклонения между исходной речью и аналитической
моделью. По каналам связи передаются параметры модели и отклонения. Отклонения
представлены как индикаторы. Индикаторы заносятся в общую книгу кодов, которая
доступна кодировщику и декодировщику. Дополнительные данные в виде индикаторов
позволяют добиться декодированного сигнала более высокого качества, чем при
простой кодировке LPC. CELP требует пропускной способности канала не ниже 4,8
Кбит/с. В качестве стандарта G.728 ITU-SS предложен метод LD-CELP (Low Delay
CELP), для которого требуется полоса пропускания не менее 16 Кбит/с. Метод
LD-CELP требует большой вычислительной мощности и специальных аппаратных
средств.
Глава 2. Технические требования на абонентское устройство конференц связи
п. 2.1. Выбор структуры и форматов данных в системе видеоконференций
Идея создания Internet была предложения в связи с необходимостью построения
коммуникационной отказоустойчивой сети, которая могла бы продолжить операции,
если даже большая часть ее стала не доступной для работы . Решение состояло с
том, чтобы создать сеть , где информационные пакеты могли бы передаваться от
одного узла к другому без какого-либо централизованного контроля. Если основная
часть сети не работает, пакеты самостоятельно передвигалась бы по доступным
узлам до тех пор, пока не попадут в точку своего назначения. Кроме того сеть
должна быть устойчива к возможным ошибкам при передаче пакетов.
В начале 80-х были подключены первые локальные сети и для использования в
построенной сети ( Internet) был выбран, адаптирован и затем повсеместно принят
для работы набор протоколов Transmission Control Protocol/Internet Protocol
(TCP/IP)[9]. (TCP/IP) вполне удовлетворял всем требованиям, которые на него
возлагались.
Существует много причин, почему протоколы семейства TCP/IP были выбраны за
основу Internet. Это прежде всего возможность работы с этими протоколами как
локальных (LAN), так и в глобальных (WAN) сетях, способность протоколов
управлять большим количеством стационарных и мобильных пользователей.
К данному протоколу больше подходит название "Комплекс протокол Internet". В его
состав входят протоколы UDP,ARP, ICMP, TELNET, FTP и многие и другие, но часто
используют только термин TCP/IP.
Часть из семейства протоколов TCP/IP обеспечивает выполнение "низкоуровленых"
сетевых функций для множества приложений, таких, как работа с аппаратными
протоколами, поддержка механизма доставки пакета по адресу, назначения через
множества сетей и хостов, обеспечение достоверности и надежности соединения и
др..
Другая часть протоколов предназначена для выполнения прикладных задач, таких,
как передача файлов между компьютерами, отправка электронной почты или чтение
гипертекстовой страницы WWW-сервера.
Задачей ТСР является доставка всей информации компьютеру получателя, контроль
последовательности передаваемой информации, повторная отправка не доставленных
пакетов в случае сбоя работы сети. Кроме того, если сообщение достаточно
большое, чтобы отправить его в данном пакете , ТСР делит и отправляет его
несколькими блоками . ТСР также осуществляет контроль за составление
первоначального сообщения из этих блоков на компьютере получателя.
Подобно тому, как почтовый протокол использует ТСР, сам ТСР использует протокол
IP, который обеспечивает доставку пакета по адресу , т.е. адресацию и
маршрутизацию. Функции, которые представляет ТСР, необходимы для работы
множества приложений, однако существуют приложения, для работы которых эти
функции не требуются . Эти приложения используют вместо ТСР свой протокол,
обеспечивающий взаимодействие приложений, например UDP, которому для работы
также необходимы механизм, который бы осуществлял доставку пакета по адресу (
т.е. уровня IP).
Схему использования проколов легче всего представить в виде дерева. На этом
дереве листьями будут пользовательские приложения, которые работают с
протоколами самого верхнего уровня ( например почтовым протоколом). В свою
очередь, протоколы верхнего уровня представляют собой ветви кроны. Уровень ТСР
можно представить как толстые сучья, которые растут из ствола и держат крону. А
сам ствол - это уровень IP.
Подобная модель построения нескольких уровней протоколов называется
"многоуровневым передаванием сетевых протоколов". Под этим подразумеваем, что
протокол на более высоком уровне при своей работе использует сервисы,
передавленные протоколами более низкого уровня. Семейство протоколов TCP/IP
имеет 4 ярко выраженных уровня:
уровень приложений ( прикладной уровень)
уровень, реализующий транспортные функции ( транспортный уровень)
уровень , обеспечивающий доставку и маршрутизацию пакета ( сетевой уровень)
уровень сопряжения с физической средой ( канальный уровень)
Опишем состав и основные функции протоколов каждого уровня семейства TCP/IP:
Уровень сопряжения с физической средой ( канальный) обеспечивает надежный
транзит данных через физический канал. Этот уровень решает задачи физической
адресации, уведомления о неисправностях, упорядоченной доставки блоков данных и
управления потоком информации.
Ниже этого уровня расположен только аппаратный уровень, который определяет
электротехнические, механические, процедурные и функциональные характеристики
активизации, поддержания и деактивизации физического канала между конечными
системами ( уровни напряжений, синхронизации изменений напряжений, скорость
передачи физической информации , максимальные расстояния передачи информации,
физические соединения и др.)
Сетевой уровень - это комплексный уровень. Он обеспечивает возможность
соединение и выбор маршрута между двумя конечными системами, подключенными к
разным "подсетям", которые могут находится разных географических пунктах. К
этому уровню в TCP/IP относится межсетевой протокол IP, который является базовым
в структуре TCP/IP и обеспечивает доставку пакету по месту назначения -
маршрутизацию , фрагментацию и сборку поступивших пакетов на хосте получателя.
Этому уровню принадлежит протокол ICMP, в функции которого входят, в основном,
сообщения об ошибках и сбор информации о работе сети.
Транспортный уровень представляет услуги по транспортировке данных. Эти услуги
избавляют механизмы передачи данных прикладного уровня от необходимости вникать
в детали транспортировки данных. В частности, заботой транспортного уровня
является решение таких вопросов, как надежная и достоверная транспортировка
данных через сеть. Транспортный уровень реализует механизмы установки,
поддержания и упорядоченного закрытия каналов соединение, механизмы систем
обнаружения и устранения неисправности транспортировки, управления
информационным потоком.
Транспортный уровень семейства TCP/IP представлен протоколами ТСР и UDP. ТСР
обеспечивает транспортировку данных с установлением соединения, в то время как
UDP работает без установления соединения. Оба эти протокола имеют дело с
конкретными процессами ( приложениями ) на компьютере и могут обеспечивать связь
процессов на различных компьютерах сети, хоть в их компетенцию не входит
управлением сеансом работы. Если ТСР обеспечивает полный сервис транспортного
уровня - надежность, достоверность и контроль соединения, то UDP может
отправлять пакеты от одного процесса к другому без какого либо дополнительного
сервиса, за исключением, разве что, проверки контрольной суммы переданных
данных.
Прикладной уровень идентифицирует и устанавливает наличие предполагаемых
партнеров для связи , синхронизирует совместно работающие прикладные программы ,
устанавливает соглашения по процедурам устранения ошибок и управления
целостности информации. Кроме того протоколы прикладного уровня определяют ,
имеется ли в наличии достаточно ресурсов для предполагаемой связи. Прикладной
уровень также отвечает за то, чтобы информация, посылаемая из прикладного уровня
одной системы была читаемой на прикладном уровне другой системы. При
необходимости он осуществят трансляцию между множеством форматов представлений
путем использования общего формата и структур данных, а также согласует
синтаксис передачи данных для прикладного уровня. Прикладной уровень
устанавливает и завершает сеансы связи взаимодействия между прикладными задачами
, управляет этими сеансами, синхронизирует диалог между объектами и управляет
обменом информации между ними. Кроме того прикладной уровень предоставляет
средства для отправки информации и уведомления об исключительных ситуациях
передачи данных.
Комплект протоколов Internet включает в себя большое число протоколов высших
уровней, имеющих самые разнообразные применения, в том числе управление сети,
передача файлов, распределенные услуги пользования файлами, эмуляция терминалов
и электронная почта.
Стремительный рост Internet предъявляет новые требования к скорости и объемам
передачи данных. И для того , чтобы удовлетворить все эти запросы, одного
уведомления емкости сети недостаточно , необходимы разумные и эффективные методы
управления трафиком и контролем загруженности линий передач.
Наиболее широко используемый протокол транспортного уровня - это, как было
описано выше, ТСР. Несмотря на то, что ТСР позволяет поддерживать множество
разнообразных распределенных приложений, он не подходит для приложения реального
времени. Использование ТСР в качестве транспортного протокола ТСР для этих
приложений невозможно по нескольким причинам:
1. Этот протокол позволяет установить соединение только между двумя конечными
точками, следовательно, он не подходит для многоадресной передачи.
2. ТСР предусматривает повторную передачу потерянных сегментов, прибывающих,
когда приложение реального времени уже их не ждет.
3. ТСР не имеет удобного механизма привязки информации о синхронизации к
сегментам = дополнительное требование приложений реального времени.
Другой широко используемый протокол транспортного уровня - UDP не имеет части
ограничений ТСР, но и он не представляет критической информации о синхронизации.
Эту задачу и призван решить новый транспортный протокол реального времени - RTP
( Real-Time Transport Protocol), который гарантирует доставку данных одному или
более адресатам с задержкой в заданных пределах, т.е. данные могут быть
воспроизведены в реальном времени.
Пакеты RTP содержат следующие поля: идентификатор отправителя, указывающий, кто
из участников генерирует данные, отметки о времени генерирования пакета, чтобы
данные могли быть воспроизведены принимающей стороной с правильными интервалами,
информация о порядке передачи, а также информация о характере содержимого
пакета, например, о типе кодировки видеоданных (MPEG, Indeo и др.). Наличие
такой информации позволяет оценить величину начальной задержки и объема буфера
передачи.
Протокол RTP используется только для передачи пользовательских данных - обычно
многоадресной - всем участникам сеанса. Совместно с RTP работает протокол RTCP
(Real-Time Transport Control Protocol). , основная задача которого состоит в
обеспечении управления передачей RTP, RTCP использует тот же самый базовый
транспортный протокол, что и RTP ( обычно UDP), но другой номер порта.
RTCP выполняет несколько функций:
1. Обеспечение и контроль качества услуг и обратная связь в случае перегрузки.
Так как RTCP-пакеты являются много адресными, все участники сеанса могут
оценить, насколько хороша работа и прием других участников. Сообщения
отправителя позволяют получателям оценить скорость данных и качества передачи.
Сообщения получателей содержат информацию о проблемах, с которыми они
сталкиваются, включая утерю пакетов и избыточную неравномерность передачи.
Обратная связь с получателями важна также для диагностирования ошибок при
распространении. Анализируя сообщения всех участников сеанса, администратор сети
может определить, касается данная проблема одного участника или носит общий
характер. Если приложение - отправитель приходит к выводу, что проблема
характерна для системы в целом, например, по причине отказа одного из каналов
связи, то оно может увеличить степень сжатия данных за счет снижения качества
или вообще отказаться от передачи видео - это позволяет передавать данные по
соединению низкой емкости.
2. Идентификация отправителя. Пакеты RTCP содержат стандартное текстовое
описание отправителя. Они проставляют больше информации об отправителе пакетов
данных, чем случайным образом выбранный идентификатор источник синхронизации.
Кроме того, они помогают пользователю идентифицировать потоки, относящиеся к
различным сеансам.
3. Оценка размеров сеанса и масштабирование. Для обеспечения качества услуг и
обратной связи с целью управления загруженностью, а также с целью идентификации
отправителю все участники периодически посылают пакеты RTCP. Частота передачи
этих пакетов снижается с ростом числа участников. При небольшом числе участников
один пакет RTCP посылается максимум каждые 5 секунд.
Таким образом с протоколом сетевого уровня IP (Internet Prortocol)
взаимодействуют два протокола транспортного уровня: TCP и UDP. TCP (transmission
control protocol) обеспечивает надежную связь за счет мощных средств контроля
ошибок при отправке пакетов и повторной отправки пакета в случае ошибки. UDP
(user datagram protocol) такими средствами контроля над ошибками и повторной
отправки пакета не обладает. Настольные системы видеоконференций, работающие по
сетям Internet, используют протокол UDP для передачи аудио- и видеосигнала.
Протокол TCP используется для передачи данных, таких, например, как данные с
"настенной доски" или из разделяемых прикладных программ. При организации
конференций по сетям Internet возникает одна проблема. Суть конференции в том,
чтобы передавать изображение/голос/данные в общем случае в режиме широкого
вещания. Однако протокол IP подразумевает связь "точка-точка". Чтобы преодолеть
это препятствие, в 1989 г. было предложено расширение IP для поддержки
широковещательных пакетов в Internet — RFC (Request for Comments). Благодаря RFC
появилась возможность проводить конференции в Internet в режиме
"широковещательной магистрали" Multicast Backbone (MBone), что означает
возможность для одного участника конференции в Internet связываться одновременно
с несколькими участниками. В режиме MBone группы хостов, поддерживающих
широковещательный IP, связаны друг с другом по каналам чистого IP со связью
"точка-точка". Данные к хостам группы передаются через широковещательный
маршрутизатор. Это, как правило, рабочая станция, работающая в системе Unix. Для
выбора оптимального пути от отправителя к получателю широковещательный
маршрутизатор использует один из протоколов: DVMRP (Distance Vector Multicast
Routing Protocol), MOSPF (Multicast Open Shortest Path First), PIM (Protocol
Independent Multicast).
Необходимость передачи аудио- и видеоинформации по Internet привела к созданию
нового транспортного протокола RTP (Real-time Transport Protocol). Его рабочая
спецификация была предложена группой AVT (Audio/Video Transport working group)
разработчиков средств передачи аудио/видеоинформации, входящей в организацию
IETF (Internet Engineering Task Force). Протокол RTP отвечает за очередность,
тайминг и качество аудио/видеоинформации, передаваемой в режиме "точка-точка"
или "точка-многоточка". Большинство разработчиков систем MBone используют в
своих системах RTP. Среди них такие как Communique! (InSoft), InPerson (Silicon
Graphics), ShowMe (Sun Microsystems).
На сегодняшний день системы настольных видеоконференций, разработанные разными
производителями, практически несовместимы друг с другом. Поэтому возникла острая
необходимость создания общепринятых стандартов на эти системы.
Организация ITU, о которой речь уже шла ранее, является агентством ООН. В рамках
этой организации государственные и частные компании координируют работы по
созданию сетей телекоммуникаций и телекоммуникационных услуг. Сектор ITU-T
занимается разработкой стандартов для систем видеоконференций, работающих по
каналам ISDN. Рекомендация стандарта для систем конференц-связи H.320,
предложенная ITU-T, носит название "Narrow-Band Visual Telephone System and
Terminal Equipment". Спецификацию H.320 зачастую называют Р*64, где Р — целое
число, поскольку она была разработана для каналов ISDN с пропускной
способностью, кратной 64 Кбит/c. H.320 представляет из себя набор рекомендаций
по использованию стандартов компрессии/декомпрессии аудио- и видеосигнала, а
также cинхронизации, мультиплексирования и фрагментирования данных. Рекомендация
T.120 ITU-T называется "Transmission Protocols For Multimedia Data".
Рекомендация разработана для обмена данными в режиме конференц-связи. Такими
данными могут являться изображения и заметки "настенной доски", бинарные файлы и
пр.
Рекомендация ITU-T H.324 называется "Multimedia terminal for low bitrate visual
telephone services over the GSTN". H.324 определяет стандарты для передачи
аудио, видео и данных через модемы V.34 со скоростью 28,8 Кбит/с по аналоговым
телефонным линиям общего назначения.
Настольные системы видеоконференц-связи можно использовать для самых
разнообразных целей: проведения совещаний территориально рассредоточенных
рабочих групп, для дистанционной связи со специалистами, для целей заочного
обучения, при трансляции телевизионных программ, проведении брифингов и т.п.
Если члены группы, разрабатывающей программный продукт, находятся на
значительном расстоянии друг от друга, они могут отказаться от личных встреч и
согласовывать свои действия посредством видеоконференций, экономя тем самым
время и деньги.
П. 2.2. Выбор метода кодирования - декодирования, описание стандарта
кодирования.
Современный рынок требует сокращения производственных циклов, повышения качества
поставляемой продукции, сотрудничества между различными фирмами и глобализации
их деятельности. Средства связи, их расширенные возможности, играют при этом
решающую роль. Наличие быстрой и эффективной связи определяет
конкурентоспособность фирмы. Выигрывает тот, кто стартует раньше других,
используя самые современные технологии. На данный момент самым широко
используемый протоколом, по моему мнению , является стандарт Н.323.
Рассмотрим, что представляет собой рекомендация Н.323.
Рекомендация Международного Телекоммуникационного Объединения (ITU) H.323 -
международная спецификация, определяющая взаимодействие компьютеров при передаче
аудио- и видео- потоков по сетям intra- или Internet.
Система Intel Internet Phone создана на основе набора коммуникационных средств,
предлагаемых стандартом H.323 для работы с Internet. Передача звука при
использовании системы Intel Internet Phone осуществляется с помощью кодека
G.723, который обеспечивает возможность трансляции очень небольшого звукового
потока при сохранении хорошего качества звука.
Основное преимущество коммуникационных программных продуктов, совместимых с
H.323, - возможность правильного взаимодействия друг с другом. Смысл введения
стандарта H.323 прост - он предлагает протокол, с помощью которого
коммуникационные программные продукты, созданные различными производителями,
могут работать совместно (то есть взаимодействовать). Компания Intel внесла
большой вклад в создание, развитие и распространение технологии H.323.
Совместимые с H.323 приложения и поддерживающая их инфраструктура Internet
являются основой нового направления развития коммуникационных возможностей,
связанных с использованием ПК. Программное обеспечение, разработанное Intel и
другими компаниями на основе стандарта H.323, впервые позволит нам без проблем,
с помощью простого нажатия кнопки, осуществлять обмен аудио- и видео- данными.
Технический обзор H.323
Рекомендация H.323 описывает требования к терминалам, другому оборудованию и
различным службам, предъявляемые при передаче мультимедиа-потоков по локальной
сети с негарантированным качеством соединения. Терминалы, а также другое
оборудование, соответствующее требованиям H.323, могут использоваться для
передачи голоса, цифровых данных и видеоинформации, а также произвольного
сочетания этих потоков (например, для видеотелефонной связи) в реальном масштабе
времени.
Локальная сеть, с помощью которой связаны совместимые с H.323 терминалы, может
быть простым сегментом, соединением по типу "кольцо" или целым набором сегментов
сложной топологии соединений. Необходимо заметить, что сложность структуры сети
влияет на производительность H.323-терминалов. К сожалению, рассмотрение
способов, с помощью которых можно добиться нужной производительности терминалов
при работе со сложными сетями, выходит за рамки рекомендации H.323.
H.323-совместимые терминалы могут быть встроены в персональные компьютеры или
выполнены в виде отдельных устройств, например, видеотелефонов. Поддержка обмена
звуковыми данными для них обязательна, в то время как возможность передачи
цифровой информации и видеоданных является дополнительной. Однако, при
использовании режима обмена видеоданными или цифровой информацией для совместной
работы требуется поддержка нужного режима всеми устройствами. H.323 дает
возможность одновременно передавать данные по нескольким каналам каждого типа.
Среди стандартов, связанных с H.323, - рекомендации по сжатию и синхронизации
H.225.0, управлению H.245, видеокодированию H.261 и H.263, аудиокодированию
G.711, G.722, G.728, G.729 и G.723, а также серия коммуникационных
мультимедиа-протоколов T.120.
Стандарт H.323 разработан с учетом Рекомендаций H.245, описывающих
последовательность специальных процедур при открытии логического канала передачи
информации. Эти процедуры, определяющие содержание логического канала,
необходимы для согласования передающего устройства с приемным - таким образом,
передатчик будет транслировать только ту информацию, которую способен воспринять
приемник. Приемник может потребовать от передатчика ведения обмена данными в
нужном ему режиме. Поскольку аналогичные процедуры, описанные стандартом H.245,
предлагаются также в Рекомендациях H.310 для ATM-сетей, H.324 для GSTN и V.70,
взаимодействие H.323-систем с системами на их основе возможно без преобразования
H.242-H.245, как этого потребовали бы системы стандарта H.320.
Терминалы стандарта H.323 могут работать в многоточечных конфигурациях и
взаимодействовать с терминалами стандарта H.310 для B-ISDN, стандарта H.320 для
N-ISDN, стандарта H.321 для B-ISDN, стандарта H.322 для локальных сетей с
гарантированным качеством соединения, стандарта H.324 для GSTN и беспроводных
сетей и стандарта V.70 для GSTN.
Для передачи видеоизображения стандарт Н.323 требует использования стандарта
Н.261.
Видеопоток стандарта Н.261.
Рекомендация ITU-T Н.261. была разработана для передачи видеоинформации при
уровнях битового потока Рх64 Кбит/с, где р - может меняться от1 до 30. Стандарт
включает как кодирование отдельных кадров в стиле JPRG, так и использование
компенсации движения для устранения временной корреляции между кадрами. Он
относится к гибридным системам сжатия в пространственной и временной областях.
Burst bandwidth assumes that the transfer of video occurs only during the active
period.
Continuous bandwidth assumes entire frame time is used to transfer active video
Форматы исходных данных CIF QCIF ФорматРазрешениеШирина Полосы Частот
Мбайт/сек (1)Мбайт/сек
(непрерывный)
QCIF216x156176x1441.691.27
CIF432x312352x2886.745.07
Для того, чтобы обеспечить преобразование данных различных систем телевидения к
единому стандарту, был разработан стандарт CIF (общий промежуточный стандарт).
Для яркостной компоненты Y разрешение составляет 288 по вертикали и 360 пикселов
по горизонтали, из которых не используется по четыре крайних пиксела с каждой
стороны для обеспечения кратности 16 Используется цветовая модель - 4:2:0 с
серединным расположением пикселов цветности. Для яркости используется разрешение
352х288 ( область значимых пикселов, а для обоих цветоразностных компонентов
разрешение - 176х144. Используется также формат QCIF с половинным разрешением.
Частота кадров составляет 29,97 кадров/сек, но может быть и понижена до 10-15
кадров/се. Декодер должен способен рас кодировать поток с пропущенными кадрами ,
так. Как для увеличения сжатия предусмотрена возможность опускать при
кодировании отдельные кадры вместо того, чтобы поддерживать постоянную частоту
кадров.
Стандартом предусмотрено разбиение видео потока на четыре уровня:
- уровень кадров ( для CIF-формата - 352х288 пикселов, 396 макроблока, 1584
блока, 12 групп блоков):
код начала кадра ( 20 бит, 0000 0000 0000 0001 0000)
номер кадра в последовательности ( 5 бит)
тип кадра в последовательности ( 6 бит)
дополнительные данные
уровень группы блоков (GOB) ( 176х48 пикселов, 132 блока. 33 макроблока)
код начала группы ( 16 бит , 0000 0000 0000 0001)
номер группы в кадре ( 4бита)
уровень квантования в группе ( 5 бит)
дополнительные данные
уровень макроблока ( 16х16 пикселов, , 4 блока)
код адреса макроблока ( код переменной дилны, до11 бит)
код типа макроблока ( код переменной дины)
-уровень квантования маклоблока ( 5 бит)
код вектора движения ( код переменной длины, до 11 бит)
код присутствия данных блоков ( код переменной длины, до 9 бит)
-уровень блока ( 8х8 пикселов)
коэффициенты ДКП ( коды переменной длины, до 13 бит)
Алгоритм кодирования.
Стандарт не специализирует конкретных методов сжатия, и поиск наиболее
эффективных алгоритмов сжатия является задачей разработчиков кодера. Для
передачи CIF изображения по каналу (64 кбит/сек) степень сжатия должна превышать
300:1. В алгоритме кодирования можно выделить следующие этапы:
1.Входной поток подвергается предварительной обработке:
Если исходное изображение передается в виде чересстрочных полей, то из них
формируются кадры с прогрессивной разверткой, кадры передискретизиуются до
формата CIF или QCIF;
Производится преобразование RGB в YUV
Производится преобразование из формата цветности 4:4:4 в 4:2:0 ( горизонтальная
и вертикальная поддискретизация цветоразностных компонентов).
Эта схема преобразования обычно используется для стандарта Н. 261 .
На рис.5 изображена двумерная 2:1 подвыборка цветоразностных элементов по
отношению к элементам яркости. Элементы Cb и Cr не совпадают по расположению с
элементами яркости, но представляют информацию о цвете для группы четырех
элементов яркости, расположенных по углам квадрата. Значение Си СR обычно
вычисляются 4:4:4 путем горизонтальной и вертикальной фильтрации и интерполяции.
Обычно значения Cb и Cr вычисляются только для каждой второй линии элементов
яркости. Т. о. Остальные линии несут только яркостную составляющю.4:2:0. Ширина
полосы сигнала 4:2:0 идентична полосе сигнала 4:1:1. На рис.5 Представлен
построчный видеосигнал, в котором используется только одно поле сигнала.
Для устранений возможных искажений типа появления ложных элементов на границе
объектов или смещения позиции, может применяться перефильтрация низкочастотным
фильтром.
2.Изображение разбивается на макроблоки , для которых находятся вектора
движения. Вектора движения для макрблоков могут быть только целочисленными и по
абсолютной величине не превышать 15 пикселов.
3.Находятся ошибки предсказания движения.
4.Производится анализ информации о движении и принимается решение о способе
кодирования макроблока.
5.В зависимости от результатов предыдущей стадии или исходный или разностный
сигнал подвергается дискретному косинусному преобразованию
6.Осуществляется квантование коэффициентов ДКС, Z- упорядочивание, и кодирование
кодами переменой длины. На этом этапе необходимо строить выходной поток данных ,
поддерживая заданное значение битового потока, для чего требуется специальный
алгоритм выбора уровня квантования коэффициентов: если заполнение буфера
оказывается больше заданной пороговой величины, то уменьшается точность передачи
данных.
Кодирование I- блоков.
Процедура кодирования I-блоков похода на методику кодирования неподвижных блоков
стандарт JPEG. Однако в отличии от JPEG уровень квантования может быть
переменным, и коэффициент квантования подбирается кодером.
Кодирование Р-блоков.
Процедура кодирования Р-блоков гораздо сложнее процедуры кодирования неподвижных
блоков. Кодер должен выбрать метод кодирования макроблока. В этом случае также
стандарт не предписывает какого-либо алгоритма, оставляя это на разработчиков
кодера
1.Принимается решение, следует ли использовать компенсацию движения, т.к. в
случае отсутствия движения используется разность между текущим макроблоками и
его несмещенным базовым макроблоком ( можно считать нулевым вектором движения).
Достигается экономия за счет того, что вектор движения не передается. Для этого
вычисляется сумма несмещенной разности между текущим макроблоков и его базовым
макроблоком ( т.е. с нулевым вектором движения)D1., и та же сумма для разности с
вектором движения, D2.На основании ряда численных экспериментов была получена
эмпирическая крива выбора решения. Кривая имеет сложную форму в области
небольших значения разностей, т. к. любое ложное движение фона, вызванное
медленным движением перемещением объекта , является крайне нежелательным
эффектом. , заметно ухудшающее визуальное изображение.
В Р- блоках вектор движения передается с помощью разностного кодирования, что
обеспечивает значительную экономию для изображений с движением, вызванным
перемещением камеры, в которых вектора движения для большинства микроблоков
будут примерно одинаковы.
2. После получения информации об оптимальном варианте компенсации движения кодер
решает, следует ли ее использовать (т. е. Использовать нулевой или ненулевой
вектор движения и кодировать разностный сигнал) или кодировать исходный
макроблок как I-блок. Это можно было бы сделать, сравнив количество бит,
необходимое для передачи кодированной информации о макроблоке с компенсацией
движения и без нее при том же коэффициенте квантования. Однако ввиду
значительных вычислительных затрат на эту процедуру на основе численных
экспериментов была получена эмпирическая кривая выбора решения о внутрикадровом
или межкадровом кодирования на основе сравнения дисперсий текущего макроблока и
разностного сигнала.
Дисперсия V1 для текущего макроблока вычисляется:
V1 = ,
А дисперсия V2 - - для разностного сигнала , полученного с учетом принятого
решения о компенсации движения, т. е. С использование вектора движения (N,M),
нулевого или ненулевого по формуле:
V1 = X(i+n,j+m))/256
Для устранения блокинг -эффекта, связанного с компенсацией движения, может
производится фильтрация. Фильтрация осуществляется только внутри блока и
применяется как к яркостной , так и к цветоразностным компонентам. Фильтрация
ошибок в кодере после компенсации движения дает лучшие результаты, чем
постфильтрация в декодере.
4. После квантования принимается решение, следует ли изменять коэффициент
квантования, установленный по умолчанию. Визуально восприятие изображения будет
улучшаться, если применять переменный коэффициент квантования в зависимости от
детальности в блоке и свойство зрительного анаизатора при их восприятии.
Промышленные стандарты призваны сделать видеоконференции столь же
распространенными, как телефонная и факсимильная связь. Благодаря им системы
поддержки видеоконференций разных производителей могут без проблем устанавливать
связь между собой, как связываются между собой другие телекоммуникационные
устройства.
Продукты, соответствующие стандартам ITU, позволяют любому абоненту связываться
с любым другим абонентом. Стандарты, разработанные сектором стандартизации в
области телекоммуникаций ITU (ITU-TSS, предыдущее название - CCITT), сделали для
систем поддержки видеоконференций для ПК то, что сделали ранее выработанные
стандарты "V.xx" и "Group-III" для модемов и факсимильных аппаратов - обеспечили
совместимость изделий разных производителей в мировом масштабе.
Глава 3. Разработка структурной схемы устройства кодирования-декодирования
п. 3.1 Выбор элементной базы для абонентского устройства
В качестве демултиплексера выбираем микросхему фирмы GEC PLESSEY VP 2614.
Видео демультиплексор является частью набора микросхем для видеоконференций,
видеотелефонии и мультимединых приложений. Используется для протокола Н. 261.
Демультиплексор работает с входными данными до 4 Мбит/сек. Интерфейс разработан
для декодера VP2615
Рассмотрим работу структурной схемы :
Это устройство извлекает из потока Н.261. параметры, корректирующие ошибки, и
коэффициенты ДКП
FRAME ALIGNMET:
непрерывный битовый поток Н.261 разбивается на кадры по 512 бит , первый бит
каждого кадра является частью восьмибитового заголовка кадра. Для предотвращения
ошибочного детектирования настоящих данных заголовок должен повторяться не менее
трех раз перед сигналом “frame lock”. После того, как получен этот сигнал он
начинает постоянно отслеживаться. Если происходит ошибочное определение кадра ,
то следующие 4 кадра будут проверены на ошибки.
VALIDITY CHEK - проверка правильности ( верности) информации потока
VARIABLE LENGTH DECODE - декодирование с переменной длиной. Декодирование
информации видеопотока, который был закодирован при передачи видеоинформации в
кодирующем устройстве с переменной длиной слова, в данном блоке производится
обратный процесс.
HOST INTERFACE - интерфейс компьютера
Интерфейс системного процессора.
Интерфейс системного процессора является интерфейсом с картой памяти. Он был
разработан для использования с любым системным процессором и состоит из
следующих шин и сигналов:
HD7:0 - шина данных процессора
YF 3:0 - младшее значение бита адресной шины
WR - строб записи
RD - строб чтения
CEN -выбор микросхемы
SIDE INFORMATION - блок выделения служебных данных
ДЕКОДЕР
В качестве декодера возьмем микросхему фирмы GEC PLESSEY VP 2615,
Используется для видеоконференции, видеотелефонии. Разработан по рекомендации
стандарта CCITT Н.261 . Предназначен для декодирования CIF сигнала с разрешением
до 30 Гц. Выходным сигналом являются 8 битные пиксели в YUV формате.
Рассмотрим основные блоки этой микросхемы.
INPUT CONRTOLLER - входное устройство ( данные, импульс синхронизации , вход
режима передачи данных
RUN LENGHT DECODE & INV ZIG ZAG - блок обратного зигзагообразного сканирования,
процесс обратному , выполняемому в кодере.
Это блок - генератор адресов, который обеспечивает считывание коэффициента ДКП в
пространстве по зиг-загообразной траектории. Смысл - значившие коэффициенты .
располагаются в начале субблока , а нули в конце субблока .В результате
появляется последовательность коэффициентов. , имеющие короткие участки и
значащие участки, которые кодируются кодом переменой длины
INVERSE QUANTIZATION - блок обратного квантования
INVERSE DCT - блок обратного дискретного косинусного преобразования. В блоке
выполняется операция, обратная операции , выполняемая в кодеке.
ДКП осуществляется в соответствующем блоке и обрабатывает 8х8 субблока
изображения, либо в режиме межкадрового либо внутрикадрового кодирования.
В режиме межкадрового кодирования используется 8 разрядное представление
сигнала. При внутрикадровом кодировании используется разность между текущем и
блоком имеющим лучший шаг сдвига . В этом случае представление сигнала
осуществляется в удвоенном комплиментарном виде. 12 битные коэффициенты
Формируются в блоке ДСТ и посылаются на квантователь. Изображение делится 8х8
пикселов. Суть преобразования - изображение из пространственной области
перевести в частотную область
LOW PASS FILTER - фильтр нижних частот, для устранения высокочастотных
составляющих декодированного изображения
ADD - устройство суммирования
FRAME STORE CONTROLLER - контроллер памяти на кадр
CONTROL I/F- контроллер управления декодером
В качестве конвертора выберем микросхему фирмы
GEC PLESSEY VP 520 S
VP520 S разработан для преобразования 16 битного мультиплексированного сигнала
яркости и цветности между CCIR 601 и CIF/QCIF. Предусмотрены вертикальные и
горизонтальные фильтры, причем вертикальные фильтры обеспечиваются с помощью
внутренней памяти на одну строку. Коэффициент, используемый для фильтра
определяется пользователем и загружается от независимой шины данных . Внутренний
генератор адресов поддерживает внешнюю память на кадр и обеспечивает
преобразование строки в макроблок . Если входной сигнал конвертируется CIF/QCIF,
вертикальные и горизонтальные фильтры обеспечиваются путем 4х CIF линии
задержки, которые позволяют обрабатывать пять фильтров. Когда производится
преобразование в формат QCIF, используется доступная память, чтобы обеспечить
задержку на 6 строк, которая позволяет использовать 7 фильтров. Когда прибор
конвертирует в CCIR 601 сигнал , входные данные должны быть в формате макроблока
и вертикальные фильтры идут в формате макроблоков. Входные сигналы пишутся
сначала во внешнюю память , организованную под CIF кадром и считываются у памяти
построчно. VP 520 S поддерживает память по 2 полных
кадра и позволяет CIF/QCIF дольше читать попарно в порядке формирования двух
черезстрочных полей видеосигнала.
VP 520 S поддерживает преобразование между CIF/QCIF и NTSC стандартом. Когда
формируется CIF данные на каждые 5 строк данных, то формируются дополнительные
строки, а когда формируется сигнал NTSC , то из каждых 6 строк четыре убираются.
SYNC GENERATOR - генератор синхроимпульсов
RAM ADRESS..... - формирователь адреса памяти с поддержкой преобразования
адресов строк в адреса блоков
INPUT - буфер
MUX - мультиплексор
FOUR - задержка на 4 строки
фильтр яркостного сигнала
FILTER BLOCK - 2 фильтра цветоразности
MUXING - мультиплексор
COEFF STORE - память коэффициентов.
Рассмотрим микросхему конвертора VP510.
Он преобразует трехканальный RGB данные в два канала десятичных цветность и
яркость. Также он преобразует два канала данных Цветоразностных и яркостных в
три канала интерполированых данных RGB . Каждый канал имеет собственную таблицу
просмотра, которая может быть загружена из управляющей системы и затем
использована для гамма-коррекции. Направление потока данных контролируется битом
в управляющем регистре и позволяет переключаться между входом и выходом. Фильтры
переключаются с десятичного в интерполирующий режим. Матрица преобразования
размерностью 3х3 обеспечивается определяемыми пользователем 12 битными
коэффициентами, которые могут изменяться от -4 до 4 . Канал яркости
обеспечивается фильтром 23 порядка . Каждые Каналы цветности имеют два
последовательных фильтров 11 порядка. Такое устройство позволяет принимать или
производить данные RGB c частотой в два раза превышающую исходную, таким образом
избегая использование внешних аналоговых фильтров. Если необходимо, устройство
может принимать или производить видеоданные с исходной частотой .
ADRESS RAM - буферные устройства
COUNTNER - счетчик
3х3 MATRIX MULTIPLEX - схема матрицирования
23 ТАР - фильтр прореживания интерполирования
CONTROL - контроллер управления
RANGE - ограничитель уровня
PIPELINE DELAY - линия задержки
п. 3.2. Разработка структурной схемы абонентского устройства кодирования
Задачей работы является: прием и передачи данных. На входе - стандартный
компонентный телевизионный сигнал, на выходе - стандартный цифровой компонентный
сигнал формата 601/25.
Для аппаратной реализации данного устройства декодирования по выбранному
стандарту используем специализируемую элементарную базу фирмы GEC PLESSEY Plesse
т. к. она построена по интегральным технологией, обладает большой
функциональностью, позволяет сократить массу, габариты, стоимость.
На основе выбранных компонентов составим структурную схему декодирующего
абонентского устройства видеоконференций.
Входной поток по стандарту передачи видеоданных Н. 261 поступает на
демультиплексер, чтобы обеспечить постоянство цифрового потока. В устройстве
декодирования используют буфер приема RECEVE BUFER 32Кх8, который имеет размер
32 Кбайта . Для декодирования демультиплексированой информации поставим
видеодекодер VP2615, работа которого была описана выше. Для проведения операции
декодирования необходимо ОЗУ на 1 кадр. Т.к. мы используем формат CIF , объем
памяти должен быть 128 Кб . Для преобразования формата CIF в стандартный формат
, согласно рекомендации .CCIT 601 используем конвертор VP 520. Для обеспечения
преобразованиянеобходима память на два кадра. Объем информации 256 Кб . Для
преобразования цифрового цветоразностного сигнала в RGB используем конвертор
цветного изображения VP 510. Для управления декодером используем системный
контроллер, который может управляться центральным процессором компьютера .
п.3.3. Сравнительный анализ оконечных устройств имеющихся на рынке на данный
момент
Cybertronic Zydacron Z250
Комплект для проведения видеоконференций фирмы Cybertronic, работающий с ОС
Windows 3.х, 95, OS/2 Warp и Windows NT, представляет собой интегрированный на
единой плате видео- и аудиокодек с возможностью проведения видеоконференций по
линиям POTS и ISDN.
Cybertronic Zydacron Z250 представляет собой неплохую альтернативу другим
комплектам для проведения настольных видеоконференций. Среди несомненных
достоинств этого продукта - интегрированные на одной плате ISDN-адаптер и кодеки
и, следовательно, экономия как минимум одного разъема, а также длинный список
совместимых операционных систем, каким не могут похвастаться гораздо более
дорогие и известные продукты. Расширению возможностей комплекта в значительной
мере способствует наличие комплекта для разработчика Zydacron SDK. Относительно
высокое качество изображения и звуковой информации обеспечивается за счет
качественной реализации кодека. К сожалению, на этом список "плюсов" данного
продукта заканчивается. Среди наиболее существенных недостатков следует отметить
ограниченные возможности по реализации совместных действий (только передача
файлов и разделение экрана), а также отсутствие совместимости с T.120, что
сильно ограничивает возможности продукта с точки зрения его интеграции с другими
системами видеоконференций.
Технические характеристики Zydacron Z250
Видео: соответствие стандарту H.261; частота кадров и разрешение - 15 кадр/с и
CIF 352x288 или 30 кадр/с и QCIF 176x144; протоколы - эмуляция последовательного
порта, дополнительная эмуляция TCP/IP и поддержка T.123; максимальная пропускная
способность - до 56 Кбит/с.
Аудио: G.711, G.728, G.722
Коммуникации: BRI
Аппаратные требования: процессор 486/33 МГц или выше, оперативная память - не
менее 8 Мбайт, объем свободного пространства на жестком диске - 20 Мбайт.
ShareVision PC3000
Комплект фирмы Creative Labs включает в себя звуковую плату, видеоплату,
факс-модем, соответствующее ПО, наушники и 1/3" CCD цветную видеокамеру.
ShareVision, одна из немногих систем, поддерживающих только видеоконференции по
модемным линиям, представляет собой тем не менее разумный компромисс между
стоимостью комплектации одного рабочего места (около 1000 долл.) и
функциональными возможностями продукта. Несмотря на то что система включает
возможности разделения приложений, передачи файлов, захвата изображений,
проведения аудио- и видеосеансов, она характеризуется также рядом существенных
недостатков. Среди наиболее заметных - весьма невысокое качество изображения,
отсутствие возможностей проведения многоточечных конференций и использования
преимуществ ISDN. Однако ShareVision можно рассматривать как неплохое
техническое решение для тех пользователей, которым, в первую очередь, важны
стоимость комплекта видеоконференции, а также возможность работы по обычным
телефонным линиям.
Технические характеристики ShareVision Pc3000
Системные требования: ПК с процессором 486SX 33 МГц (рекомендуется 486 DX2-66),
оперативная память объемом не менее 8 Мбайт, объем свободного пространства на
жестком диске не менее 6 Мбайт, два свободных ISA-разъема, дисплей VGA или SVGA
(рекомендуется 16- или 24-разрядный видеоадаптер), MS Windows 3.1 или выше.
Имеется также версия ПО для платформы Macintosh
Видеовход: программно выбираемый источник видеоизображений (NTSC или PAL).
Режимы видеоадаптера: VGA (8-, 16- или 24-разрядный), SVGA.
Частота и размер кадров изображения: 15 кадров, 96х80 пикселов; 12 кадров,128х96
пикселов; 10 кадров, 160х112 пикселов.
Захват видеокадра: 320х240 пикселов; 640х480 пикселов; цветность - до 24
разрядов.
Аудиовход: микрофон
Аудиовыход: тандартные колонки или наушники.
Алгоритм сжатия: VATP (Vector Adaptive Transform Processing).
Видеокамера: тип - 1/3" CCD, цветная; выход: составной цветной NTSC-сигнал.
Модем: внешний, скорость передачи - до 28,8 Кбит/сек.
п.3.4. Разработка принципиальной схемы декодирования абонентского устройства.
Для разработки принципиальной схемы рассмотрим каждую микросхему в отдельности .
Принципиальная схема изображена в приложении 1VP 2614
ВыводыЗначения
LD линия выходных данных
LEN сигнал разрешения ввода данных ( при низком уровне)
LCLKстроб шины входа
LREDзапрет захвата данных ( при низком уровне)
DBUS 7:0шина управления и данных
DMODE 3:0 выходной идентификатор данных
PM 2:0идентификаторы для добавления информации для DBUS 7:0 ( не
используются для VP 2615)
DCLKпоследовательный О/Р строб для шины DBUS 7:0 тактируемый SCLK
SCLKсистемная тактовая частота. Должна быть 27 МГц для 30 Гц фреймов
HD7:0Двунаправленная шина данных
HA3:0шина адреса системного контроля
WRзапись строба системного контроллера ( активный низкий уровень)
RDчтение строба из системного контроллера ( активный низкий уровень)
CENвыбор микросхемы из системного контроллера ( активный низкий уровень)
ERRвыходная индикация фреймов и декодирования ошибок ( активный низкий
уровень)
EVTиндикация возможности установки данных нового кадра( активный низкий
уровень)
B7:0шина передачи данных к принимающему буферу
А14:0адресная шина к принимающему буферу
WSзапись строба для принимающего буфера ( активный низкий уровень)
BCSВыбор принимающего буфера ( активный низкий уровень)
BENразрешение выдачи на буфер ( активный низкий уровень)
ТСКтестовая тактовый сигнал JTAG
ТМCвыбор режима JTAC
TDII/P данные JTAC
TDOО/Р данные JTAC
TRCTсброс JTAC
ТОЕперевод всех в импедансное состояние ( активный низкий уровень)
RESсброс питания ( активный низкий уровень)
VP2615
DIN 7:0этот порт используется для ввода квантованных значений данных и
управляющей информации, его функции определяют DMODE 3:0, данные
тактируются фронтом DCLK
DMODE3:0управляющий вход для DIN 7:0, данные тактируются фронтом DCLK
DCLKсигнал используется для стробирования данных на входах DIN и DMODE.
Может запрещаться подачей WAIT STATE на DMODЕ, может получаться делением
SYSCLK
YUV7:0входная шина данных пикселей в формате YUV – блока с частотой равной
четвери SYSLCK
VPIXсинхронизирующие выходные импульсы с периодом более чем удвоенный
частотой SYSCLK, который позволяет работать с данными пикселей через YUV
порт
MBOUTсинхронизирующий выход с периодом больше чем макроблок и переходящей
на высокий уровень по последнему пикселю макроблока. В конце макроблока
MBOUT переходит в низкий уровень до следующего макроблока.
FRMOUTсинхронизирующий выход, принимающий высокое значение при новом
фрейме и сигнализирующий о новой фрейме для YUV порта. Он имеет высокое
значение до последнего выходного пикселя. FRMOUT переходит в низкий
уровень до начала нового фрейма
FS 15:0 шина данных для записи и чтения внешнего DRAM фрейма
ADR7:0адресная шина , управляющая внешним DRAM фреймом
RASвектор адресного строба, управляющая внешним DRAM фреймом
Casуправление стробом адресов строк внешним DRAM фреймом
RW1управление записью / чтения внешнего DRAM1
RW2управление записью / чтения внешнего DRAM2
ОЕ1разрешение вывода внешнего DRAM 1 или ADR8, если используется DRAM 256
K
ОЕ2разрешение вывода для внешнего DRAM 2 или ADR8, если используется DRAM
256 K
CBUS7:0двунаправленная шина данных, используемая микропроцессором. Данные
CSTRвходной строб данных и выхода порта CBUS
CENпри низком состоянии этого вывоза порт CBUS может использоваться для
ввода вывода данных
CADRпри высоком уровне сигнал на CBUS определяется как данные, при низком,
как инструкции
SYSCLKсистемная тактовая частота, максимум 27 МГц, может варьироваться от
35 % до 65% на каждый период. Все внешние тактовые частоты получаются
делением этой частоты.
RESETактивный низкий уровень. При использовании в течение операции все
данные фреймом будут потеряны.
ТСК -тестовая частота для JTAG
ТМSвыбор режима JTAC
TDII/P данные JTAC
TDOО/Р данные JTAC
TRSTвывод сброса JTAC
VP510
R7:0беззнаковые данные красного, диапазон может изменяться при помощи
таблицы ОЗУ
G7:0беззнаковые данные красного, диапазон может изменяться при помощи
таблицы ОЗУ
B7;0беззнаковые данные красного, диапазон может изменяться при помощи
таблицы ОЗУ
Y7:0беззнаковые входные или выходные данные яркости, диапазон определяется
пользователем.
С7:0 –двухкомпонентные или знаковые бинарные данные , мультиплексированые
монохромно, диапазон определяется пользователем
D7:0шина данных хоста, используемая для чтения записями
А4:0шина адреса хоста, коэффициенты матрицы и управляемые регистры
CLKвнешнее тактовая частота, все входы и выходы тактируются фронтом
HREFгоризонтальная или композитная частота, используемая как индикатор
начала линии и вырезаемая КИХ фильтрами
HDLYзадержка входного HREF на 39 периодов для коррекции сигнала с выхода
фильтра
FIфлаг входа определяется пользователем, не управляется изнутри
FOзадержка FI на 39 периодов для коррекции выходного сигнала фильтра
CRIвход, показывающий допустимость яркостных и цветоразностных данных
CROвыход , который показывает появление яркостных и цветоразностных данных
на выходных выводов
OENразрешает третье состояние шины при низких уровнях
CSвыбор схемы с хоста системы ( активно низкий)
RDзапрос на хост на чтение матричный коэффициентов и счетчика ОЗУ (
активный низкий)
WR – запрос с хоста на запись устройства ( активный низкий)
RESасинхронный сброс, используемый для инициализации устройства
VP520S
Y7:0входная – выходная шина яркостей
C7:0входная – выходная шина цветоразностей
М7:0входная – выходная шина макроблоков
D15:016 битная шина данных для DRAM фреймов
A7:0мултиплексированная адресная шина для DRAM
А8:0сигнальный бит адреса более значимый бит адреса или второй Cas
RASстрочный строб для DRAM
CASвертикальный строб для DRAM
R/Wсигнал чтения /записи для DRAM
HREFчастота синхронизации горизонтальная
VREFчастота синхронизации вертикальная
CREFвход или выход CREF
FREFвходной или выходной индикатор поля
HBLNKвыход горизонтального блинка
CSYNCкомпозитный выход синхронизации
CLMPопределяет уровень черного каждый период для АЗП
VRSTидентификатор начала фрейма
FRSTиндикатор поля
REQYUVприем макроблоков из декодера>
NCLKстроб ввода/вывода макроблока
FSIGсигнал начала готовности фрема
CSLKсистемная тактовая частота для систем Pal/NTSC 27 МГц
HD7:0шина данных хоста
HA3:0шина адреса контроллера хоста
RDстро чтения с хоста, активный низкий уровень)
WRстроб записи нахост активный низкий уровень
CERразрешение о стробирования ( акт
RSTсброс питания
TDII/P данные JTAG
TDOO/P данные JTAG
ТМSвыбор режима JTAC
TDII/P данные JTAC
TDOО/Р данные JTAC
TRSTвывод сброса JTAC
Предельно допустимые значения VP 2615VP 2614VP 520
Напряжение питания VDD-0,5 V до 7,0 V -0,5 V до 7,0 V -0,5 V до 7,0 V
Входное напряжение V in-0,5 V до VDD + 0.5 V -0,5 V до VDD + 0.5 V -0,5 V
до VDD + 0.5 V
Выходное напряжение V out-0,5 V до VDD + 0.5 V -0,5 V до VDD + 0.5 V -0,5
V до VDD + 0.5 V
Предельный прямой ток Ik18 mA
( см. замечание 2. )18 mA
( см. замечание 2. )18 mA
( см. замечание 2. )
Статистическое напряжение разряда 500 V500 V500 V
Температура хранения Ts-55 0 C до 150 0 С-65 0 C до 150 0 С-65 0 C до 150
0 С
Диапазон рабочих температур T AMB00 C до 70 0 С00 C до 70 0 С00 C до 70 0
С
Температура кристалла125 0 С100 0 С150 0 С
Мощность рассеивания корпуса1000 mW1000 mW5000 mW
Замечания.
Превышение перечисленных значений может привести к неустранимому нарушению
работоспособности.
Максимальные значения в течение первой секунды для одного тестируемого вывода.
Превышение абсолютного значения уровня в течение длительного периода может
понизить надежность устройства.
Измерения проводятся для вытекающего тока.
Статические электрические характеристики. ХарактеристикиЗначениеЕд.
измеренияНомер микросхемы
minmax
Выходное максимальное напряжение2.4-VVP 2615
2.4-VP 2614
2,4-VP 520
Выходное минимальное напряжение-0,4VVP 2615
-0.4VP 2614
-0,4VP 520
Входное максимальное напряжение2,0-VVP 2615
2.0-VP 2614
2,0-VP 520
Входное минимальное
напряжение-0,8VVP 2615
-0.8VP 2614
-0,8VP 520
Ток утечки входа-10+10m AVP 2615
-10+10VP 2614
-10+10VP 520
Емкость входа10rFVP 2615
10VP 2614
10VP 520
Ток утечки выхода-50+50m AVP 2615
-50+50VP 2614
-50+50VP 520
п. 3.5. Расчет цифровых потоков в системе видеоконференций
На вход видеофильтра подаем стандартный цифровой сигнал в соответствии с
рекомендацией CCIt 601. Цифровой поток = 720*288*2*1байт + 2*360*288*2*1 байт =
829440 байт. ( формат PAL).., . После прохождения сигнала через видеофильтр
скорость цифрового потока стала соответственно 360*288*2 + 180*144*2*2 = 311040
байт( формат CIF) . На выходе же видеокодека скорость потока будет от 64 К бит ,
до 2 Мбит, в зависимости от того, какой коэффициент сжатия применялся в кодере.
( от 20 до 100).