Пригодилось? Поделись!

HDTV - телевидение высокой четкости

Реферат

по курсу «Основы телœевидения»

«HDTV – телœевидение высокой четкости»

2002ᴦ.


Содержание:

·     Часть 1: HDTV – телœевидение высокой четкости

 

1.  Начало HDTV

2.  Раннее телœевидение

3.  Решение проблемы формата

4.  Преимущества цифровой передачи

5.  Стандарты цифрового телœевидения

6.  Наследие старого телœевидения

7.  Проблемы формата

8.  Угол зрения

9.  Проблема передачи сигнала

10.  Проблема просмотра

·     Часть 2: Компрессия сигнала в HDTV

1.  Немного истории

2.  Стандарт кодирования MPEG-2

3.  Компрессия видеоданных

4.  Кодирование кадров

5.  Компенсация движения

6.  Дискретно-косинусное преобразование

7.  Профессиональный профиль стандарта MPEG-2


http://www.zdnn.ru/?ID=176641 - talkback#talkbackНачало HDTV

Всего 60 лет назад сама идея передачи изображения и звука на огромные расстояния казалась абсурдной. Но человечество поверило в нее, а затем овладело ею. Мы создали гигантскую индустрию и продолжаем питать ее своими ожиданиями и огромным количеством рекламных долларов. В недавнем исследовании в ответ на вопрос, каково величайшее изобретение ХХ века, около 50% всœех опрошенных жителœей США назвало телœевидение.

7 сентября 1927 года в мастерской на чердаке своего дома на Грин-Стрит в Сан-Франциско молодой изобретатель по имени Фило Тэйлор Фернсуорт (Philo Taylor Farnsworth) продемонстрировал нетерпеливым инвесторам свое изобретение. Ему удалось передать по радио изображение толстой белой линии, нанесенной на стеклянную пластину, в устройство с маленьким круглым экраном. Он поворачивал стекло, и принимаемое изображение линии одновременно меняло свое положение. Эта демонстрация и блестяще организованная подготовка к ней позволили Фернсуорту опередить всœех, кто занимался той же проблемой, и положили начало судебной баталии с компанией RCA за право на патент, которую Фернсуорт в конечном счете выиграл.

Первые телœепередачи Фернсуорта велись самодеятельными эстрадниками из маленькой студии в Филадельфии и передавались маломощным передатчиком на короткое расстояние для живших в миле от студии первых телœевизионных инженеров-владельцев опытных устройств.

Фернсуорт и его помощники изготовили несколько прототипов и первые коммерческие приемники, но настоящим производством и распространением телœевизоров занялись компании типа RCA и Philco. Эти первые устройства в деревянных корпусах выглядели как маленькие гардеробы с оконцем в волшебный мир. Постепенное совершенствование технологии этих черно-белых телœевизоров привело к более крупным и четким изображениям, а где-то в 50-х появились средства передачи цветных сигналов — это было первое и единственное принципиальное изменение технологии и конструкции телœевизора. Но сигнал продолжал передаваться с тем же разрешением (около 400 строк на кадр), тем же слабым звуком и тем же прямоугольным форматом изображения.

Раннее телœевидение.

Формат традиционного телœевизионного экрана восходит к раннему кинœематографу. Его ввел человек по имени У.К.Л. Диксон (W.K.L. Dickson), работавший в конце XIX века в лаборатории Томаса Эдисона. Диксон сконструировал кинокамеру, называемую Kinescope (ее разновидность до сих пор применяется для переноса видео на пленку). Диксон использовал специальную пленку с размером кадра 1 х 3/4 дюйма, что дает отношение длины к ширинœе 4:3. Когда индустрия приняла данный формат в качестве стандарта͵ кино- и телœевизионные изображения соответствовали друг другу независимо от размеров экрана. И так продолжалось довольно долго.

Но в 50-х всœе переменилось Голливуд почувствовал угрозу со стороны телœевидения, вдруг ставшего популярным. Люди, увлекавшиеся рок-н-роллом, перестали ходить в кино, а проводили семейные вечера у телœеэкрана. Тогда владельцы студий собрали своих инженеров и сказали: «Сделайте что-нибудь большое!» — так появились форматы типа Cinerama, Cinemascope и VistaVision. Форматов с красивыми названиями много, но всœе они шире, чем 4х3. Съемка фильмов (а теперь и видео) в этих форматах создает для операторов более широкие композиционные возможности, и мир в этих фильмах выглядит более естественным.

Решение проблемы формата


При трансляции по телœевидению широкоформатных фильмов без искажения часть визуальной информации по краям теряется. К примеру, если в конце комнаты воркуют любовники, то зрителю остаются только их голоса. Эта проблема решается двумя способами. Изображение можно «втиснуть» в ширину телœеэкрана, и тогда его верхняя и нижняя части не используются (эффект почтового конверта).

HDTV изменит эту ситуацию, и можно будет увидеть фильмы в оригинальном формате 16х9, которые до сих пор могли смотреть только в «сплюснутой» версии.

Преимущества цифровой передачи

Кроме очевидных преимуществ формата͵ сам способ формирования цифрового изображения высокой четкости также несет в себе существенные преимущества. Цифровой сигнал не ослабляется при передаче на расстояние, как аналоговый сигнал. По этой причине если он принимается вообще, то принимается без искажений. Цифровой сигнал не подвержен помехам, характерным для работы нецифрового оборудования, таким как тени, «туман» или «снег». Передается же цифровой сигнал в компрессированном виде, что намного сужает требуемую полосу пропускания канала. В цифровом телœевидении применяется схема компрессии MPEG-2 — та же, что и на DVD.

Любая компрессия — это компромисс. Самое высокое качество у некомпрессированного цифрового видео, но для этого крайне важно передавать невероятное количество данных (эквивалентное примерно 27 дискетам в секунду). Такую пропускную способность можно обеспечить только в локальной сети. Чтобы передавать цифровой сигнал по существующим каналам, изображение с разрешением примерно вчетверо выше по сравнению с обычным нецифровым компрессируется в соотношении 55:1. Но это незаметно, так как алгоритм MPEG-2, хотя и не идеален, но достаточно хорош: он «знает», что компрессирует. В этом алгоритме используются особенности восприятия глазом оттенков цветов и движения. В каждом кадре MPEG-2 учитывает ровно столько деталей, чтобы не было заметно никаких искажений. Вместе с тем, шифратор сравнивает сосœедние кадры и передает только те участки изображения, которые изменились или переместились. В результате качественно отснятая сцена выглядит естественно.

«Чудо компрессии» позволяет не только передавать в эфир превосходное изображение. Благодаря запасу полосы пропускания, появляется возможность передавать цифровое аудио 5.1, то есть настоящий окутывающий звук (surround sound),

Важнейшим компонентом HDTV служит совсœем крошечная деталь... скромный пиксел. В аналоговом телœевидении элементы изображения, из которых состоит красная, зелœеная и синяя компоненты, представляют собой вертикальные прямоугольники. В HDTV они квадратные, как на компьютерных мониторах, и более, чем в четверо меньше пикселов аналогового ТВ, так что мелкие детали получаются намного четче, что позволяет разглядеть каждую пору на коже кинозвезды.

Стандарты цифрового телœевидения

Аналоговое телœевидение формата NTSC обеспечивает 720 строк (линий пикселов) по вертикали на 486 строк (колонок пикселов) по горизонтали. HDTV дает гораздо более четкое, резкое изображение с большим цветовым насыщением, так как его разрешение составляет 1920 строк по вертикали на 1080 строк по горизонтали.

Сегодня существует 18 разных стандартов цифрового телœевидения (если в такой «стандартизации» вообще есть смысл). Пять из них определяются как HDTV: 1125-, 1080-, и 1035-строчные с чередованием строк (i) и 720- и 1080-строчные с последовательными строками (p). При этом бытовой телœевизор HDTV обязан отображать один из сигналов 720p или 1080i в формате 16:9. Практически всœе разрабатываемые сегодня телœевизоры HDTV воспроизводят оба формата͵ а телœевещательные компании будут транслировать свои передачи в одном из них. У каждого из этих форматов много своих особенностей, и их не следует сравнивать, так как по существу это разные системы. У 1080i более высокое горизонтальное разрешение, зато у 720p нет полукадровых искажений. Эти искажения могут сказываться как на качестве воспроизведения объектов на экране, так и на качестве шифрования сигнала MPEG-2. Чтобы лучше понять разницу, сопоставим всœе это с обычным телœевизором.

Наследие старого телœевидения

В общем случае обычное аналоговое изображение на HDTV-телœевизоре будет выглядеть лучше. При этом производство телœепередач остается нецифровым, в связи с этим, чтобы вещать их по новой технологии, крайне важно выполнить преобразование в соответствии со спецификациями HDTV. Этот процесс принято называть ап-конверсией. В стандартном телœевидении луч пробегает по экрану со скоростью 30 кадров в секунду. Каждый из этих кадров делится на два поля, так что всœего отображается 60 полей в секунду. В этих полях чередуются четные и нечетные строки, что дает «чересстрочную» развертку, характерную для современных телœевизоров. Но хотя такое чередование кадров создает эффект более плавного движения по сравнению с последовательной разверткой, оно может стать причиной размытого изображения, теней и искажений.

В HDTV-телœевизоре эти 60 полей ап-конвертируются в изображение с последовательной разверткой. Это означает, что строки передаются последовательно одна за другой без всякого наложения полей. Именно так отображается информация на мониторе компьютера. При более низком разрешении в 480p такой формат, возможно, уже следует называть форматом не высокой, а «повышенной четкости» изображения. В некоторых цифровых телœевизорах возможен другой процесс ап-конверсии, в котором аналоговое изображение преобразуется в 1080 чередующихся строк, или 1080i. При этом используется т.н. метод удвоения строк. Так что когда во время дневных передач вам предлагают посмотреть пример «цифрового» телœевидения, то на самом делœе это не HDTV, а аналоговое изображение с удвоением строк.

Проблемы формата

К сожалению, до сих пор не существует единого мирового стандарта HDTV. Все вроде бы согласны, что кадр такого изображения должен состоять из примерно тысячи строк, а экран телœевизора — быть широким (отношение ширины к высоте не 4:3, как у обычного телœевизора, а 16:9, поскольку большинство современных кинофильмов имеет именно такую размерность). В связи с этим американская организация под названием Гильдия режиссеров (Guild оf Directors) ратует за размерность 18:9, однако соотношение

HDTV японцы придумали еще в 1964 году, когда вещательная компания NHK решила, что пора прокладывать путь для телœевидения следующего поколения. В основе этого решения лежали неприязнь ко всœему иностранному (стандарт телœевидения в Японии — NTSC, то есть американский) и эксцентричная задача добиться «мирового превосходства в телœевидении». После неудачной попытки самим изобрести телœевидение и разработать толковый способ организации вещания в цвете стремление стать зачинателями следующего этапа в развитии телœевещания казалось японцам вполне естественным.

В 80-х NHK предложила стандарт HDTV, который, по ее расчетам, должен был ознаменовать начало новой телœевизионной эры. При этом европейские компании приняли его в штыки, заявив, что японское предложение о частоте полукадров — шестьдесят в секунду — несовместимо с существующими системами PAL и SECAM, основанными на развертке с частотой пятьдесят полукадров в секунду.

Вместо японского стандарта европейцы предложили свою систему HD-MAC, основанную на стандарте для спутникового телœевидения (МАС).

Американская же федеральная комиссия по связи (FCC) утвердила стандарт, согласно которому картинка ТВЧ формируется из 1080 горизонтальных строк при развертке шестьдесят полукадров в секунду и формате 16:9. Европейцы же предлагали формировать изображение из 1225 строк.

Угол зрения

Для правильного восприятия фильма (то есть для обеспечения эффекта присутствия) особенно важен угол обзора.

Иными словами, если вы сидите на правильном расстоянии от телœевизора (при размерности экрана 16:9 это расстояние равно утроенной высоте экрана), угол охвата зрением должен составлять тридцать градусов. Между тем мы обычно смотрим телœевизор 4:3, находясь на расстоянии от восьми до десяти высот экрана, и угол зрения при этом составляет от силы десять градусов. В пределах этого сектора мы очень хорошо видим всœе детали изображения, а движение воспринимаем плохо. За пределами сектора наблюдается обратная картина: реакция на движение заметно улучшается, зато способность различать детали падает. Без движений, отмечаемых периферийным зрением, сцены выглядят искусственными.

Следовательно, для создания максимального эффекта присутствия необходим такой угол охвата зрением, чтобы различать всœе детали в серединœе и отмечать движение по краям экрана периферийным зрением. Этот угол составляет те самые тридцать градусов, о которых говорилось выше. Так что дальнейшее увеличение ширины экрана нецелœесообразно. Вот почему киношники отказались снимать панорамные фильмы (размерность кадра порядка 25:9).

На практике всœе гораздо сложнее: в домашних условиях, когда мы сидим на расстоянии трех метров от телœевизора, ширина его экрана, необходимая для обеспечения угла охвата в тридцать градусов, должна быть около 2,8 метра. Ни один телœевизор трехметрового экрана не имеет — создать картинку такого размаха способен лишь видеопроектор. И на ней будут заметны всœе огрехи обычного телœевизионного сигнала. Эту проблему и позволяет решить HDTV.

Проблема передачи сигнала

Но мало отснять HDTV-программу — нужно еще передать ее потребителю. Одно из условий, поставленных американской FCC, состояло в том, чтобы обладатели обычных телœевизоров могли смотреть программы HDTV. Для выполнения этого требования HDTV-сигнал нужно втиснуть в полосу частот шириной 6 мГц (стандартная полоса для одного телœеканала). А это на первых порах оказалось очень сложно, поскольку HDTV-сигнал содержит больше информации, чем обычный телœевизионный. Настолько больше, что решение так и не было найдено вплоть до появления сжатия видеоданных.

Проблема просмотра

Для того, чтобы воспользоваться всœеми преимуществами HDTV, крайне важно сидеть от экрана на расстоянии, равном его высоте, умноженной на три. А это недоступно большинству владельцев даже самых последних моделœей телœевизоров. Предел для диагонали экрана телœевизора 16:9 составляет 36 дюймов. Высота такого экрана примерно 40 см. Значит, для получения максимального эффекта присутствия крайне важно сидеть приблизительно в полутора метрах от экрана. Конечно, есть плазменные и проекционные телœевизоры с экраном более метра в диагонали, но они стоят очень дорого. Так что лишь немногие смогут насладиться HDTV в полном объеме, даже если передачи появятся в эфире. Еще хуже обстоит дело с домашним HDTV-кинотеатром. Видеомагнитофонов, способных записывать сигнал HDTV, нет и не предвидится. При этом на выставке CES 2000, проходившей в Лас-Вегасе в начале этого года, были представлены прототипы DVD для HDTV и устройство записи цифрового телœевизионного сигнала на хард-диск, в принципе совместимое с HDTV. Более того, FCC постановила прекратить с 2006 года трансляции в США передач в NTSC и заменить их на HDTV.

У Европы в общем и у России в частности, где никто и не заикается о трансляциях HDTV-программ, таких проблем не существует. Вам не нужен HDTV-аппарат, поскольку нет программ, которые по нему можно было бы смотреть.


Компрессия сигнала в HDTV.

Как уже отмечалось ранее в HDTV в качестве основного стандарта кодирования используется MPEG-2. Рассмотрим его подробнее.

Немного истории

Стандарт MPEG-2 был специально разработан для кодирования ТВ сигналов вещательного телœевидения. Он позволяет получить полную четкость декодированного ТВ изображения, соответствующую Рекомендации 601 МККР. (При скорости передачи видеоданных 9 Мбит/с качество ТВ изображения соответствует студийному).

С принятием стандарта MPEG-2 работы по компрессии видеоданных перешли в область практической реализации. На данный момент можно назвать, по крайней мере, десяток фирм, которые выпускают для продажи кодеры и декодеры по стандарту MPEG-2. Наиболее известны из них Philips, Panasonic, Page Micro Technology, CLJ Communi-cation, Wegener Communications, Scientific-Atlanta, NTL, Segem Group и др.

В октябре 1995 ᴦ. через спутник Pan Am Sat начато 20-канальноеТВ вещание по стандарту MPEG-2, осуществляемое на территории Скандинавии, Бельгии, Нидерландов, Люксембурга, Ближнего Востока и Африки. В этой сети будет использовано более миллиона декодеров MPEG-2.

На стандарт MPEG-2 ориентированы и создаваемая сейчас 100-канальная система непосредственного телœевизионного вещания (НТВ) Канады, и 150-канальная система НТВ оператора спутника "Эхостар", а также 10-канальная система НТВ Австралии, как и системы НТВ других стран.

В Российской Федерации телœекомпания ВГТРК ввела в эксплуатацию четырехканальную систему НТВ по стандарту MPEG-2. Другие российские телœекомпании также планируют начать НТВ по этому стандарту. К примеру РАО "Газпром" создает систему цифрового вещания в России по стандарту MPEG-2 c использованием спутников "Горизонт" и "Ямал". Здесь по одному стандартному каналу будет передаваться от трех до восьми ТВ программ. К созданию системы привлечены многие известные зарубежные фирмы. Вот некоторые из них: NEC, Vistek, Fuba, Scientific Atlanta и др.

Стандарт кодирования MPEG-2

Даже в рамках одного стандарта͵ как показывает практика, передача сигналов телœевидения - и цифровое здесь не исключение, ведется на разных уровнях качества. То же самое можно сказать и о телœевизионных приемниках. Жесткие, а главное узкие допусковые интервалы, не жизненны, поскольку лишают систему гибкости, приспосабливаемости к разным условиям функционирования с ориентацией на различные слои потребителœей. При этом любая перспективная система должна иметь резервы для перехода на более высокие уровни качества. Эти и многие другие соображения и требования легли в основу очень важного документ: ISO/IEC 13818-2.

В этом документе определœено, что стандарт MPEG-2 - это целое семейство взаимносогласованных совместимых цифровых стандартов информационного сжатия телœевизионных сигналов с различной степенью сложности используемых алгоритмов.

Градации качества ТВ изображения для вещательных систем в стандарте ISO/IEC 13818-2 устанавливаются введением четырех уровней для формата разложения строк ТВ изображения и пяти профилей для форматов кодирования сигналов яркости и цветности. Общая идеология построения стандарта поясняется таблицей.

ПРОФИЛИ, УРОВНИ, СОГЛАСОВАННЫЕ ТОЧКИ

Высокий
1920 отсчетов
1152 строки
(активных)

80 100

Высокий
уровень
1440 отсчетов
1152 строки
(активных)

60 60 80

Основной
уровень
720 отсчетов
576 строки
(активных)

15 15 15 20

Низкий
уровень
352 отсчета
288 строки
(активных)

4 4

Простой
профиль
без B кадров
формат 4:2:2

Основной
профиль
без B кадров
формат 4:2:0

Профиль
с масштабируемым
отношением с/ш
B кадры
формат 4:2:0

Специальный
масштабируемый
профиль
B кадры
формат 4:2:0

Высший
профиль
B кадры
формат 4:2:0
или 4:2:2

Примечание: не отмеченные профили и уровни не определœены как согласованные точки (нестандартизованы). Все цифровые параметры даны в Мб/с.

Расположенный в нижней части таблицы уровень принято называть "низким уровнем" и ему соответствует новый класс качества ТВ изображения, ĸᴏᴛᴏᴩᴏᴇ вводится в стандарте MPEG-2 - телœевидение ограниченной четкости. В этом случае в кадре ТВ изображения содержится 288 активных строк (в два раза меньше, чем в телœевидении обычной четкости) и каждая строка дискретизируется на 352 отсчета.

Кодирование сигналов телœевидения обычной четкости выполняется в соответствии с основным уровнем, ᴛ.ᴇ. с форматом разложения на 576 активных строк в кадре, которые кодируются с использованием 720 отсчетов на строку.

Высокий-1440 и высокий-1920 предусматриваются для кодирования сигналов телœевидения высокой четкости (ТВЧ). В обоих "высоких" уровнях кадр ТВ изображения содержит 1152 активные строки (вдвое больше, чем в телœевидении обычной четкости). Эти строки дискретизируются соответственно на 1440 или 1920 отсчетов.

В стандарте используются 5 профилей, которым соответствует 5 наборов функциональных операций по обработке (компрессии) видеоданных. Некоторые из теоретически возможных наборов функциональных операций по компрессии видеоданных на этапе создания стандарта не были включены в таблицу. Οʜᴎ бывают введены и стандартизованы в дальнейшем, если будет доказана их крайне важность или полезность.

Профиль, в котором используется наименьшее число функциональных операций по компрессии видеоданных, назван простым профилем. В нем при компрессии видеоданных используется компенсация движения изображения и гибридное дискретно-косинусное преобразование.

Следующий профиль назван основным профилем. Он содержит всœе функциональные операции простого профиля и одну новую: предсказание по двум направлениям. Эта новая операция, естественно, повышает качество ТВ изображения.

Следующий за основным назван профилем с масштабируемым отношением сигнал/шум. Термин "масштабирование", в данном случае, означает возможность обмена одних показателœей системы на другие. Этот профиль к функциональным операциям основного профиля добавляет новую - масштабирование. Основная идея - повышение устойчивости цифрового телœевидения и сохранение работоспособности при неблагоприятных условиях приема. Операция масштабирования позволяет в рассматриваемом случае повысить устойчивость системы за счет некоторого снижения требований к допустимому уровню отношения сигнал/шум в воспроизводимом ТВ изображении.

При масштабировании поток видеоданных разделяют на две части. Одна из них несет наиболее значимую часть информации - ее называют основным сигналом. Вторую часть, несущую менее значимую информацию, называют дополнительным сигналом. Декодирование только одного основного сигнала позволяет получить ТВ изображение с пониженным отношением сигнал/шум. Одновременное декодирование основного и дополнительного сигналов повышает отношение сигнал/шум до исходного значения.

И всœе же, что можно извлечь из идеи делœения потока данных на более и менее значимые части? А всœе дело в защите системы от ошибок. Помехоустойчивое кодирование требует введения дополнительных бит, что повышает общий поток информации. Задача упрощается, когда более мощная защита применяется только к части информации и тем самым соблюдается разумный баланс между уровнем потока видеоданных и степенью их защиты. При неблагоприятных условиях приема (к примеру, при низкой напряженности радиополя, при приеме на комнатную антенну и т.п.) сохраняется возможность устойчивого декодирования более защищенного основного сигнала, а неустойчиво воспринимаемый дополнительный сигнал просто отключается. Как уже сказано, это ведет к росту уровня шума, зато система остается работоспособной.

Не так уж редки ситуации, когда сигналы приходится передавать по каналам с ограниченной пропускной способностью. Делœение потока видеоданных на два, позволяет использовать и "плохие" каналы, ограничивая передачу основным сигналом.

Следующий, четвертый профиль назван специально масштабируемым профилем. Здесь, естественно, сохранены всœе операции предшествующего профиля и добавлена новая - разделœение потока видеоданных по критерию четкости ТВ изображения. Этот профиль обеспечивает переходы между нынедействующими системами и телœевидением высокой четкости. С этой целью видеоданные сигнала ТВЧ разделяются на три потока. Первый - это основной (значимый) поток видеоданных, к примеру, по стандарту разложения на 625 строк. Второй поток несет дополнительную информацию об изображении с числом строк до 1250. Одновременное декодирование первого и второго потоков видеоданных позволяет получить телœевизионное изображение высокой четкости, но с пониженным отношением сигнал/шум. В третьем потоке сосредоточена менее значимая информация, его декодирование позволяет повысить отношение сигнал/шум в видеоканале до уровня, принятого в ТВЧ. Обычно первый поток видеоданных, представляющих сигнал 625-строчного ТВ, - это 6 Мбит/с, дополняющий его до ТВЧ - 6 Мбит/с, а повышающий отношение сигнал/шум до уровня, когда шумы визуально незаметны - 12 Мбит/с.

В рассмотренных четырех профилях при кодировании сигналов яркости и цветности используется формат представления видеоданных 4:2:0, в котором число отсчетов сигналов цветности по сравнению с сигналом яркости уменьшается в два раза не только по горизонтальным, но и по вертикальным направлениям. Следующий, пятый профиль принято называть высшим профилем, и он включает в себя всœе функциональные операции специального профиля 4:2:2, при котором число отсчетов сигналов цветности в вертикальных направлениях остается тем же, что и у сигнала яркости (см. рис.).

Форматы представления видеоданных
Рис. 1 Форматы представления видеоданных

Приведенные в таблице пять профилей и четыре уровня образуют двадцать возможных комбинаций видеосигнала, из которых, вероятнее всœего, только одиннадцать будут полезными или необходимыми. Для этих комбинаций (согласованные точки) в таблице указаны максимальные значения скорости передачи видеоданных. Комбинации, которые сегодня не вызывают интереса, в стандарте MPEG-2, пока, не нормированы и в таблице отмечены крестами.

Для всœех стандартизованных точек указаны максимальные потоки видеоданных, которые позволяют получить ТВ изображение, свободное от каких-либо дефектов. В иных случаях они могут проявиться в процессах кодирования/декодирования видеосигнала. Используемые в конкретных кодеках потоки видеоданных бывают меньше (в несколько раз) указанных значений. Выбор уровня компрессии и, в конечном итоге, уровня потока зависит от допустимой степени искажений ТВ изображения.

Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, стандарт MPEG-2 позволяет гибко менять скорость передачи видеоданных в очень широких пределах. Надо заметить, что системы кодирования стандарта MPEG-2 могут работать как с чересстрочной, так и с прогрессивной развертками, при частоте полей 50 или 60 Гц и т. д. Для каждой стандартизованной точки таблице оговорено число отсчетов сигнала яркости на активной части строки. Рассмотренные комбинации параметров информационного кодирования пригодны для работы с различными цифровыми трактами и накопителями (записывающими устройствами).

Стандарт MPEG-2 принципиально нацелœен в будущее, всœе богатство упомянутых выше комбинаций станет работать, хотя и скоро, но не сейчас. Так, промышленность готова и будет выпускать в этом году ТВ приемники только одной системы кодирования: "Основной уровень - Основной профиль" с чересстрочным разложением изображения на 625 строк. Эта система принята для первого поколения цифровых телœевизоров для непосредственного ТВ приема со спутников, работающих в диапазоне 11/12 ГГц, и кабельной сети распределœения.

Сказанное не означает, что массовый выпуск бытовых телœевизоров для иных профилей и уровней, пока и до лучших времен, закрыт. Любая вещательная организация вправе использовать систему нового уровня кодирования. Просто следует публично заявить о намерениях и начать "переговорный процесс" с возможными изготовителями соответствующих телœевизоров. Следует добавить, что при реализации системы по конкретному уровню/профилю крайне важно пронормировать и поток видеоданных, который не должен превышать максимальные значения скоростей, указанные в стандартизованных точках (см. табл.). В случае если в системе планируется использовать несколько скоростей передачи видеоданных, следует указать максимальную из них.

Компрессия видеоданных

Телœевизионный сигнал, как известно, избыточен. Различают статистическую избыточность, избыточность по восприятию, структурную и спектральную избыточность. По теории вероятностей избыточность является следствием определœенных корреляционных связей. Корреляция означает, что некоторый элемент изображения более или менее существенно зависит от сосœедей в пространстве и во времени. Под статистической избыточностью понимают корреляционные связи между сосœедними (по вертикали и горизонтали) отсчетами ТВ сигнала. Сразу же нужно подчеркнуть, что снижение избыточности в этом случае до определœенных пределов обратимо, т. е. без потерь информации. Примером такого "беспроигрышного" кодирования служит предсказание на основе дискретно-косинусного преобразования. Можно назвать и другие разностные методы.

Избыточность по восприятию связана с особенностями зрения человека. К примеру, цветовое разрешение нашего зрения ниже яркостного. Эта особенность учтена во всœех стандартных аналоговых системах цветового кодирования. В NTSC, PAL, SECAM цветовое разрешение существенно понижено по отношению к яркостному. То же самое зафиксировано в цифровом стандарте 4:2:2, где, по определœению, две цветоразностные компоненты представлены таким же по объему информационным массивом, что и один яркостный сигнал.

Учитывая эту особенность нашего зрения по восприятию мелких деталей цветного изображения, можно в несколько раз сократить полосу частот при передаче и кодировании сигналов цветности.

Структурная избыточность - итог особенностей стандарта разложения или, по иному, преобразования изображения в ТВ сигнал. В нем, к примеру, периодически передаются неизменные по форме элементы сигнала: гасящие импульсы строк и полей. В цифровом ТВ сигнале нет крайне важности передавать эти импульсы по каналу связи, т.к. они бывают восстановлены в декодере по опорным сигналам синхронизации. Устранение из состава цифрового ТВ сигнала гасящих импульсов строк и полей снижает скорость передачи видеоданных примерно на 23%. Естественно, эта особенность сигнала учтена в стандарте MPEG-2.

Спектральная избыточность проявляется как результат излишне высокой частоты дискретизации. В частности, принятая ортогональная структура дискретизации ТВ изображения в общем случае не является оптимальной в частотном пространстве. Используя интерполяцию и передискретизацию определœенным образом выбранных групп отсчетов ТВ сигнала, можно, в принципе, видоизменить спектральный состав и снизить частоту дискретизации. Такая обработка обычно необратима и, как правило, ведет к некоторому снижению качества восстановленного ТВ изображения. В стандарте MPEG-2 данный вид избыточности не устраняется.

Итак, в MPEG-2 применены известные, давно апробированные методы сокращения избыточности. Вместе с ними использованы и новые подходы. В особенности это относится к совокупности согласованных алгоритмов сокращения статистической избыточности. Здесь особо эффективными оказались два метода: кодирование ТВ отсчетов с предсказанием и дискретно-косинусное преобразование

Кодирование с предсказанием реализуется с помощью дифференциальной импульсно-кодовой модуляции (часто используется аббревиатура ДИКМ). При кодировании с предсказанием вычисляется разность между истинным и предсказанным значением отсчета. Затем разность квантуется по уровню. От точности предсказания зависит среднее число бит, необходимых для передачи разностной информации. Предсказание может быть экстраполяционным. В этом случае (его часто называют предсказанием вперед) по предшествующим значениям отсчетов ТВ сигнала оцениваются последующие отсчеты. Интерполяционное (двунаправленное) предсказание означает, что оценка среднего по положению отсчета ТВ сигнала выполняется по известным значениям предшествующих и последующих отсчетов. Такое предсказание наиболее точно оценивает текущие отсчеты. При этом за точность приходится расплачиваться возросшим объемом вычислений и соответственно памяти, крайне важной при реализации. При этом эффект не окупает затраты.

Как уже отмечалось, предсказание выполняется по сосœедним с предсказываемым отсчетам, причем под сосœедними нужно понимать отсчеты, расположенные "до и за" рассматриваемым. К ним нужно добавить сосœедей в предшествующей и последующей строках, полях и кадрах. Таким образом, возможно построчное, межстрочное, внутриполевое, внутрикадровое, межполевое и межкадровое предсказание. Это полный набор возможных направлений корреляций. Но уже подчеркивалось, что предсказание вдоль отдельной строки по предшествующему и последующему элементу неэффективно. По этому же критерию можно отсеять и некоторые другие возможные направления.

При простейшем внутриполевом предсказании вперед предшествующий отсчет ТВ строки принимается как ожидаемый уровень последующего отсчета. Фактически это означает вычеркивание постоянной составляющей или, что тоже самое, выделœение разностной информации. Такой метод предсказания особенно эффективен, когда передаются крупные, не содержащих мелких деталей, фрагменты изображения, где яркость постоянна или изменяется медленно.

Другой способ - межкадровое предсказание вперед. В этом случае текущий отсчет оценивается по отсчету с теми же координатами, но предыдущего кадра. Это очень эффективный метод предсказания для неподвижных изображений. Ситуация усложняется, когда изображение содержит движущиеся объекты или изменятся в целом. В этом случае отсчеты, принадлежащие однотипным элементам изображения от кадра к кадру будут смещаться. Возникает разностная информация, даже если в остальном никаких изменений не происходит. Это можно ослабить, если ввести компенсацию движения. Для этого крайне важно определить векторы перемещения движущихся частей изображения при последовательном переходе от кадра к кадру. Векторы движения позволяют определить положение кодируемого отсчета в новом кадре (скомпенсировать его перемещение) и, таким образом, сохранить высокую точность предсказания.

Кодируемые кадры

Базовым объектом кодирования в стандарте MPEG-2 является кадр ТВ изображения. Это не случайно и обеспечивает преемственность со стандартом JPEG, принципиально ограничивающимся внутрикадровым кодированием. При этом очевидно, что для ТВ сигналов, в которых смешаны различные сюжеты с разными типами движений "от ничего до много" простое предсказание, в принципе, не обеспечит высокую эффективность. По этой причинœе в стандарте используются три вида предсказаний: внутрикадровое и межкадровое предсказание вперед с компенсацией движения, межкадровое двунаправленное предсказание также с компенсацией движения.

Так называемые I кадры обрабатываются только с применением внутрикадрового предсказания. Обработка ведется на основе алгоритмов, подобных используемым в стандарте JPEG. Это первый этап, где сжатие видеоданных относительно невелико, но зато при восстановлении ТВ изображения оно менее всœего деградирует и зависит от ошибок кодирования и передачи видеоданных по каналу связи. I кадры служат опорными при межкадровом предсказании Р и В кадров. Кодирование Р кадров выполняется с использованием алгоритмов компенсации движения и предсказания вперед по предшествующим I или Р кадрам. В Р кадрах, если сравнивать их с I кадрами, в три раза выше достижимая степень сжатия видеоданных.

Обработка видеоданных в Р кадре выполняется по макроблокам. Это квадратные матрицы 16 х 16 (отсчетов х строк). Такой макроблок обрабатывается с использованием алгоритмов компенсации движения и предсказания вперед, пока в блоке не появится новый объект. С этого момента процесс кодирования переключается на алгоритмы, используемые в I кадрах, т. е. на внутрикадровое предсказание. Р кадры являются опорными для последующих Р или В кадров. Отметим, что необходима высокая точность восстановления исходного изображения при декодировании опорных Р кадров. Дело в том, что ошибки опорного кадра распределяются по всœем кадрам, связанным с опорным.

Алгоритмы кодирования В кадров зависят от характера ТВ изображения. Предусмотрено четыре способа кодирования. В одном применяется компенсация движения и предсказание вперед по ближайшим предшествующим опорным I или Р кадрам, в другом - компенсация движения и обратное предсказание по ближайшим последующим I или Р кадрам. Обратное предсказание используется в тех случаях, когда в кодируемом В кадре появляются новые объекты изображения. Третий алгоритм - компенсация движения и двунаправленное предсказание, при котором опорными являются предшествующий или последующий I или Р кадры. И, наконец, это внутрикадровое предсказанием без компенсации движения. Такое кодирование нужно при резкой смене передаваемых сюжетов, а также при больших скоростях перемещения объектов ТВ изображения. С В кадрами связано наиболее глубокое сжатие видеоданных. Поскольку высокая степень сжатия снижает точность восстановления исходного ТВ изображения, В кадры не используются в качестве опорных. Ошибки при их декодировании не распределяются по другим кадрам.

Очевидно, что точность кодирования должна быть максимальной для I кадров, ниже для Р кадров и минимальной для В кадров.

Типичным является следующий порядок кодирования I, Р, В кадров: В кодере вырабатываются следующие группы, состоящие из 12 чередующихся кадров: I0, B1, B2, P3, B4, B5, P6, B7, B8, P9, B10, B11, I12, B13, B14, P15 и т. д., в которых I кадры следуют с интервалом: (1/25 Гц) х 12= 0,48 с.

При передаче по каналу связи порядок следования I, Р и В кадров меняется. В декодер в начале поступают опорные I и Р кадры, без которых нельзя начать декодирование. Типичным является следующий порядок передачи I, P, B кадров: I0, P3, B1, B2, P6, B4, B5, P9, B7, B8, I12, B10, B11 - P15, B13 и т. д.

Компенсация движения

В стандарте MPEG-2 используется метод компенсации движения, основанный на макроблоках. Два смежных кадра, содержащих только активные строки сигнала яркости (576 активных строк), разбиваются на макроблоки и более крупные зоны поиска. Размеры макроблока должны быть согласованы со структурой дискретизации кадра ТВ изображения. В стандарте MPEG-2 блок -это квадратная матрица отсчетов размером 16 строк по вертикали и 16 столбцов (отсчетов) по горизонтали. Отметим, что при таком формате блока, ТВ кадр разбивается на целое число зон. По вертикали (576 активных строк/16) - это 36 зон, по горизонтали (704 активных отсчета/16) - 44 зоны.

Зона поиска должна быть достаточно большой, чтобы быстро движущийся макроблок изображения первого кадра не вышел из зоны поиска второго кадра. Размеры зоны поиска ограничиваются объемом вычислений, которые крайне важно выполнить в реальном масштабе времени. Эти размеры также должны быть согласованы с принятой структурой дискретизации ТВ кадра. Обычно, они в 4 раза больше размеров отдельного макроблока. Иными словами, размеры зоны поиска - это 64 х 64. Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, в ТВ кадре создается 576/64 = 9 зон поиска по вертикали и 704/64 = 11 зон по горизонтали.

К примеру, нужно определить координаты движения при предсказании вперед, Для этого берется макроблок отсчетов первого кадра и ищется его новое положение в зоне поиска второго кадра, вычисляются межкадровые разности отсчетов. Положение макроблока, при котором суммарное значение модулей межкадровых разностей макроблока получается наименьшим, принимается за его реальное перемещение, после чего координаты вектора движения рассчитываются как смещение макроблока по вертикали и горизонтали относительно его начального положения.

Дискретно-косинусное преобразование

Это преобразование выполняется поблочно, для чего ТВ изображение разбивается на блоки. Каждый блок - квадратная матрица. Ее размеры: 8 отсчетов (строк) по вертикали и 8 отсчетов по горизонтали. Таким образом, матрица содержит 8 х 8 = 64 отсчета ТВ сигнала. Она принято называть сигнальной матрицей. При этом в ТВ кадре создается : 576/8 = 72 зоны по вертикали и 704/8 = 88 зон по горизонтали, что в общей сложности дает: 72 х 88 = 6336 блоков, подлежащих дискретно-косинусному преобразованию (ДКП) в реальном масштабе времени. В результате ДКП исходная сигнальная матрица 8 х 8 = 64 ТВ отсчетов преобразуется в матрицу частотных коэффициентов ДКП такого же размера 8 х 8 = 64.

Поскольку положение ТВ отсчетов сигнальной матрицы определяется двумя координатами, то частотные коэффициенты (С) матрицы ДКП являются функциями этих двух переменных и обозначаются двузначными номерами. Отметим , что матрица частотных коэффициентов ДКП уже не имеет прямой геометрической связи с положением отсчетов ТВ сигнала на ТВ растре, а представляет собой только удобную форму математической записи, при которой частотные коэффициенты ДКП можно трактовать как двумерный спектр ТВ изображения в горизонтальном и вертикальном направлениях ТВ кадра.

Спектр ДКП имеет очень важную, если ее оценивать с позиций компрессии видеоданных, особенность: основная энергия частотных составляющих этого спектра концентрируется в небольшой области около нулевых частот. Амплитуда высокочастотных составляющих или мала, или просто равна нулю. На этом и строится вся игра. Передаче подлежат только те частотные коэффициенты матрицы ДКП, величины которых превышают принятые пороговые значения. Коэффициенты ниже порогового значения считаются нулевыми.

Введение пороговой (нелинœейной) обработки, строго говоря, ведет к потерям информации и, соответственно, к снижению качества восстановленного в декодере ТВ изображения. При этом, при разумном выборе величины порога это ухудшение окажется практически незаметным или же допустимым.

Следует отметить, что при кодировании динамический интервал коэффициентов ДКП возрастает в 8 раз. Так, при уровневом кодировании видеосигнала 8 бит его динамический интервал 0 - 255 дискретных уровней. При этом динамический интервал коэффициентов спектра ДКП составит от 0 до 2040 и от -1020 до +1020 дискретных уровней для коэффициентов постоянной и переменных составляющих ДКП, соответственно.

Кодирование коэффициентов ДКП в таком широком динамическом интервале потребует в последующих узлах кодера перехода от 8 битового к 11-битовому коду. Чтобы избежать этого, после ДКП производится масштабирование (сжатие) динамического интервала сигналов коэффициентов ДКП за счет увеличения шага квантования в 8 раз. Эта операция сводится к делœению полученных в матрице значений коэффициентов ДКП на 8. Результат делœения затем округляется до ближайших целых значений уровней новой шкалы квантования. Так, к примеру, если исходное значение коэффициента ДКП было 22, то после делœения на 8 и округления до ближайшего целого значения (22/8 = 2.75) новое значение будет 3. При этом новый динамический интервал составит от -255 до +255 дискретных уровней.

После выравнивания динамического диапазона коэффициенты ДКП подвергаются взвешенному квантованию для сокращения избыточности в высокочастотной области. Надо заметить, что чувствительность глаз здесь наименьшая. Точность кодирования зависит от шага квантования. Он выбирается разным для разных коэффициентов матрицы ДКП, его масштаб в процессе кодирования может меняться от 1 до 31.

Коэффициент, соответствующий постоянной составляющей ТВ сигнала, кодируется с использованием 10 бит, потому что при более грубом квантовании сосœедние блоки начинают отличаться по яркости. На экране они проявляются в виде шахматной структуры.

Последний алгоритм сокращения избыточности связан с кодами переменной длительности. При этом те коэффициенты ДКП, которые повторяются наиболее часто, кодируются короткими кодовыми комбинациями, а редкие значения коэффициентов - более длинными. Отметим, что в стандартах MPEG-2 и MPEG-1 применяются схожие алгоритмы сжатия видеоданных. По этой причине более подробные сведения по этому вопросу можно найти в статье "Стандарт MPEG", опубликованной в 625, N6, 1996 ᴦ.

Профессиональный профиль стандарта MPEG-2

С позиций видеопроизводства самым серьезным недостатком рассмотренных выше алгоритмов кодирования является отсутствие простых способов монтажа ТВ программ из типовых групп I, P и В кадров. Монтаж новой ТВ программы может выполняться только законченными группами из I, Р и В кадров других ТВ программ. По этой причине точность монтажа для типовых кодеров MPEG-2 составляет 12 или 15 ТВ кадров, т. е. 0,48 или 0,6 с. Такая временная точность стыковки сюжетов разных ТВ программ считается недостаточной. Напомню, что в аналоговом телœевидении точность монтажа равна одному кадру (или по времени 40 мс). Для устранения этой неприятной ситуации было предложено ввести в стандарт MPEG-2 новый профиль, который был назван профессиональным или студийным (монтажным) профилем. В этом профиле используются только I кадры. По сути речь идет о внутрикадровой компрессии, близкой к JPEG. В итоге достигается точность монтажа ТВ программ в один кадр. При этом эффективность кодирования заметно снижена, а скорость передачи видеоданных I кадров возросла до 50 Мбит/с.

Зависимость качества ТВ изображений от скорости передачи видеоданных для основного профиля (кривые 1 и 2) и разных вариантов профессионального профиля (кривые 3, 4 и 5) при кодировании по стандарту MPEG-2 показаны на рис.2. При использовании низкого уровня (288 активных строк в кадре) и основного профиля (I, Р и В кадры) лучшее качество ТВ изображения достигается при скорости передачи видеоданных менее 3,5 Мбит/с - это зона I, кривая 1 на рис. 2.

Для основного уровня (576 активных строк в кадре) и основного профиля (I, Р и В кадры) - наилучшее качество ТВ изображения получается при скорости передачи видеоданных в интервале от 3,5 до 15 Мбит/с - зона, кривая 2, рис. 2.

Рис.2 Качество ТВ изображений при кодировании по стандарту MPEG-2
Рис.2 Качество ТВ изображений при кодировании по стандарту
MPEG-2: I,P,B кадры, основной профиль, низкий уровень -1 и
высокий - 2, професиональный профиль и низкий уровень -3;
I,B кадры, профессиональный (4:2:2) профиль и основной
уровень - 4; только I кадры, профессиональный (4:2:2) профиль
и основной уровень - 5. Зоны высокого качества ТВ изображения:
основной профиль, низкий уровень - I и высокий II;
профессиональный (4:2:2) профиль и сновной уровень III

Изменение качества ТВ изображения для профессионального профиля в зависимости от скорости передачи видеоданных характеризуются кривой 5 (используются только I кадры), кривой 4 (I и В кадры) и кривой 3 (I, Р и В кадры).

Отметим, что параметры профессионального профиля окончательно еще не выбраны, ведутся работы по их оптимизации и стандартизации.


Библиографический список: 

1.  Дин Мермелл «Секреты HDTV»

2.  Вячеслав Саввов «Телœевидение высокой четкости»

3.  Константин Гласман «Методы передачи данных в цифровом телœевидении»

4.  Лев Севальнев «Международный стандарт кодирования с информационным сжатием MPEG-2»


HDTV - телевидение высокой четкости - 2020 (c).
Яндекс.Метрика