logo search
пособие_ТиАСО

Основные форматы цифрового телевизионного изображения*

Разрешение

Коэффициент пропорциональности

Кадровая развертка

HDTV

1920x1080

16:9

24p, 30p, 60i

1280x720

16:9

24p, 30p, 60p

SDTV

704x408

16:9

24p, 30p, 60i, 60p

704x408

4:3

24p, 30p, 60i, 60p

VGA

640x480

4:3

24p, 30p, 60i, 60p

* Каждый формат характеризуется разрешением, коэффициентом пропорциональности изображения, частотой и типом развертки: p – построчная, i – чересстрочная.

MPEG-3 разрабатывался как стандарт для цифрового кабельного телевидения высокой четкости HDTV (High Definition Television). Он использует очень высокий битрейт – до 40 Мбит/с, что в десять раз выше стандартного значения для MPEG-2. Вместе с тем реальных преимуществ по сравнению с MPEG-2 он не обеспечивает и поэтому данный формат не получил широкого распространения.

MPEG-4 создавался специально для использования на маломощных ПК и сети Интернет. Его наиболее очевидное преимущество перед остальными стандартами MPEG заключается в возможности организации трансляции видео через сеть, так как он оптимизирован под низкий битрейт (ниже 1 Мбит/с).

В настоящее время экспертная группа MPEG работает над созданием принципиально нового формата хранения мультимедиа, который позволит объединить видео с практически любым типом информации. Рабочее название проекта – MPEG-21.

Согласно разрабатываемой спецификации мультимедийная информация будет хранится в одном файле, который в терминологии MPEG-21 называется «цифровой единицей» (digital item). Новый стандарт будет поддерживать трансляцию через сеть. Благодаря системе идентификации пользователей «цифровой единицы», можно распределять права доступа к внутренней информации. Формат использует язык XML для описания данных; таким образом, он является независимым от платформы.

DivX. Популярность MPEG не могла не остаться незамеченной разработчиками других стандартов; вместе с тем говорить о том, что этот кодек лишен недостатков, нельзя. К большому сожалению, доработка формата MPEG силами энтузиастов является незаконной. Французский программист Джером Рота, приложивший немало усилий для расширения возможностей кодека MPEG, предпочел не распространять нелегальные исправления и дополнения, а создать на их основе доработанный вариант кодека MPEG. Так появился DivX 3.11 Alpha.

Реакция на появление нового кодека со стороны группы MPEG была отрицательной. Создателю DivX грозили длительными судебными разбирательствами. Для сохранения формата Д. Рота принял решение переписать кодек, чтобы устранить проблемы с его законностью. В 2000 г. он создал фирму DivX Inc., которая приступила к разработке нового кодека. Результатом работы стал полностью легальный кодек DivX 4.0. Работы по совершенствованию кодека продолжаются.

XviD. Еще до создания четвертой версии своего кодека компания DivX Inc. создала проект с открытым исходным кодом OpenDivX. В разработке нового кодека, который должен был стать основой для DivX 4.0, участвовало большое число энтузиастов. Однако в июле 2001 г. было объявлено о прекращении работ над OpenDivX и закрытии проекта. Но это не остановило сторонних разработчиков, которые решили продолжить работу над проектом без участия DivX Inc. Новый проект назвали XviD (анаграмма от DivX).

Рассмотрим упрощенный алгоритм работы наиболее распространенного видеокодека MPEG-2. Преобразование в цифровую форму включает сканирование изображения (или кадра) строка за строкой и выборку значений содержимого строки. Для сохранения качества изображения число выбранных значений в строке должно равняться числу пикселей, каждое выбранное значение (отсчет) представляет один пиксель. Число пикселей в телевизионном изображении определяется числом строк в изображении и форматом изображения. Система аналогового цветного телевидения PAL применяет 625 строк, 576 из которых являются «активными» в том смысле, что их можно использовать для передачи видеоинформации. Формат изображения выбирается равным 5:4 – это соотношение наиболее приемлемо для операции декодирования видеосигнала, которая включает в себя организацию элементов изображения в блоки и микроблоки.

Разрешающие способности по вертикали и по горизонтали должны быть одинаковыми; число пикселей в строке можно вычислить следующим образом: 576  5/4 = 720.

Таким образом, каждая строка будет представлена 720 отсчетами, причем каждый отсчет будет представлять один пиксель: отсчет 1 – пиксель 1, отсчет 2 – пиксель 2 и т. д. (рис. 163).

Рис. 163. Дискретизация изображения

Процесс повторяется для второй, третьей и последующих строк до конца кадра, а затем снова для следующего кадра и т. д. Чтобы отсчеты осуществлялись точно в одних и тех же точках строки в пределах каждого кадра, частота выборки должна быть синхронна с частотой строк. Поэтому частота выборки должна быть в точности кратна частоте строк.

Если каждый отсчет или группа отсчетов идентифицируется как пиксель или группа пикселей, то отсчеты можно реструктурировать, перегруппировывать или манипулировать ими по своему усмотрению, а потом обрабатывать и вновь собирать в исходном порядке.

Напоминаем, что цветное телевизионное вещание связано с передачей трех сигналов: сигнала яркости Y и двух цветоразностных сигнала Y–R и Y–В. В системе аналогового телевидения эти сигналы передаются непосредственно с использованием амплитудной модуляции (наземное вещание) или частотной модуляции (спутниковое вещание). В цифровом телевизионном вещании эти три сигнала сначала преобразуются в потоки цифровых данных, а затем модулируются и передаются (рис. 164).

Рис. 164. Цифровое ТВ-вещание: одна программа

Качество изображения при цифровом телевизионном вещании ограничивают два фактора: полоса видеосигнала (или число пикселей на один кадр) и битовая скорость. При 720 пикселях на строку и 576 активных строках на кадр общее число пикселей на кадр составит 720  576 = 414 720.

Для каждой пары пикселей требуется один период полного видеосигнала, по­этому максимальная частота аналогового видеосигнала составляет 414  720  25/2 = 5,18 МГц; при такой частоте сохраняется то же качество изображения, что и в традиционном аналоговом вещании. Вторым ограничением на качество изображения является битовая скорость. При сжатии данных в соответствии со стандартом MPEG-2 для цифрового телевизионного вещания хорошего качества требуется битовая скорость 15 Мбит/с. Меньшая битовая скорость приведет к ухудшению качества изображения. Для телевизионного вещания высокой четкости, использующего 1152 строки, требуется битовая скорость 60 Мбит/с для 1440 пикселей на строку и 80 Мбит/с для 1920 пикселей на строку.

Н а рисунке 165 представлены основные компоненты системы цифрового телевидения, осуществляющей вещание четырех программ по одному ВЧ-каналу. Программы, содержащие сжатую видеоинформацию и звук, вместе с пакетами служебных данных мультиплексируются (уплотняются) в один битовый поток, называемый элементарным программным потоком (Рrogramme elementary stream – PES). Элементарный поток каждой программы мультиплексируется еще раз в общий битовый поток, называемый транспортным потоком. Элементарный программный поток содержит идентификационные данные, временную метку и специфическую программную информацию – эти составляющие потока позволяют распаковывать пакеты данных на стороне приемника по программам и кадрам для восстановления исходного изображения. Транспортный поток поступает в модулятор и затем передается по одному ВЧ-каналу 8 МГц.

Основные компоненты системы кодирования программ показаны на рисунке 166. Сначала аналоговые видео- и звуковые сигналы подвергаются дискретизации, а затем передаются на свои кодирующие устройства. Кодирующие устройства удаляют несущественные или избыточные детали видео- и звуковых сигналов с точки зрения психофизиологических особенностей восприятия аудиовизуальной информации и выполняют операции уменьшения числа битов, формируя индивидуальные пакеты данных. Индивидуальные пакеты данных вместе со служебными пакетами данных передаются на мультиплексор, который формирует элементарный программный поток. Поскольку объем видеоинформации превышает объем звуковой или служебной информации, элементарный программный поток содержит больше пакетов видеоданных, чем пакетов звуковых или служебных данных (рис. 167). Затем элементарные программные потоки объединяются в мультиплексоре и поступают в модулятор для передачи. Тип применяемой модуляции определяется типом вещания: наземное, спутниковое или кабельное.

Рис. 166. Кодирование программ: А – кодирование видеосигналов по стандарту MPEG-2; Б – кодирование звуковых сигналов по стандарту MPEG-2

Видеоданные

Видеоданные

Звуковые данные

Видеоданные

Видеоданные

Видеоданные

Звуковые данные

Служебные данные

Видеоданные

Рис. 167. Структура элементарного программного потока

Кодирование видеоинформации состоит из трех основных этапов: подготовка видеоданных, их сжатие и квантование (рис. 168). На этапе подготовки данных исходные кодированные данные кадров организуются так, чтобы их было удобно сжимать. Сжатие видеоданных осуществляется в соответствии с международными стандартами, установленными системой MPEG-2. По стандарту MPEG-2 выполняются две основные операции сжатия: удаление временной избыточности и удаление пространственной избыточности. Удаление временной избыточности представляет собой межкадровое сжатие данных, при котором происходит сравнение двух последовательных видеокадров, удаление одинаковых областей и формирование разностей кадров для обработки. Удаление пространственной избыточности, называемое также внутрикадровым сжатием, исключает ненужные повторения содержимого конкретного видеокадра. Операции удаления выполняются на основе сложных математических выражений, называемых дискретным косинусным преобразованием (ДКП); отсюда происходит название этого способа – «сжатие данных на основе ДКП». За блоком сжатия данных стоит блок квантования, который обеспечивает дальнейшее битовое сжатие. Блок квантования преобразует коэффициенты ДКП в 8-битовые коды, образующие битовый поток данных.

Рис. 168. Кодирование видеоданных по стандарту MPEG-2; A – удаление пространственной избыточности на основе ДКП

В идеоинформация, поступающая на вход видеокодера, представлена последовательностью кодированных отсчетов сигнала яркости Y и сигналов цветности Y–R и Y–В, затем кадры этих сигналов перегруппировываются в блоки, макроблоки и вырезки. Сначала кадры Y, Y–R и Y–В делятся на ряд блоков пикселей (рис. 169). Каждый блок представляет собой матрицу 8×8 закодированных в цифровом виде отсчетов пикселей. Три компонента, представленных базовыми блоками, объединяются и образуют макроблок (рис. 169). Каждый макроблок состоит из четырех блоков яркости и двух блоков каждой составляющей цветности – Y–R (CR) и Y–В (CB). Это дает так называемый формат 4:2:0. Затем макроблоки выстраиваются в том порядке, в каком они появляются на изображении, чтобы получить вырезку. Вырезка может состоять из одного или нескольких макроблоков. На этом этапе к каждой вырезке добавляются биты обнаружения ошибки. Если в ступени декодирования приемника обнаруживаются ошибки, то декодер игнорирует информацию, содержащуюся в данной вырезке, и переходит к следующей. Последовательность вырезок восстанавливает полный видеокадр (рис. 170), содержащий все три составляющие изображения (Y, Y–R, Y–В) и готовый к следующему этапу кодирования видеоданных.