Банк Рефератов - MPEG форматы - скачать рефераты, бесплатно рефераты

Рефераты. MPEG форматы

Синхронизация

Принцип постоянной задержки

Кадры телевизионного изображения поступают на вход кодера MPEG-2 с постоянной частотой, точно с такой же частотой должны воспроизводиться кадры телевизионного изображения на выходе декодера. Это означает, что общая задержка в системе, представляющая собой сумму задержек в отдельных элемента схемы, должна быть постоянной (рис.18). Объем данных, необходимый для представления кодированных изображений, не является постоянной величиной. Он зависит от детальности изображения, от наличия быстро перемещающихся объектов, от способа кодирования (I, P и B изображения характеризуются разными объемами данных). Энтропийное кодирование формирует слова с переменной длиной. А для равномерной загрузки канала связи данные должны следовать с постоянной скоростью. Проблема решается за счет использования буфера кодера (данные поступаю в буфер с переменной скоростью, а выходят – с постоянной).

Кодированные изображения (блоки доступа) в силу отмеченных особенностей кодирования поступают в декодер с переменной частотой, но воспроизводиться декодированные изображения должны с постоянной частотой, равной частоте кадров. И в декодере проблема решается за счет буфера. Компенсация одной переменной задержки другой – вот принцип реализации постоянной задержки во всей системе.

Метки времени

Механизм, обеспечивающий компенсацию задержек и синхронизацию – метки времени, которые ставятся в соответствие каждому блоку доступа (рис.19) и которые сообщают декодеру точное время, когда блок доступа должен быть извлечен из буфера декодера и декодирован. Для того, чтобы придавать блокам доступа метки времени, кодер должен знать текущее системное время, обеспечиваемое генератором опорного времени. Но метки времени блоков доступа не являются копиями текущего времени. Надо помнить, что метка времени указывает время, когда декодер будет декодировать данный блок доступа, что должно произойти в будущем. Поэтому должен быть некоторый сдвиг между текущим временем и меткой. Насколько велик должен этот сдвиг, зависит от многих факторов, среди которых размер буферов кодера и декодера, скорость, с которой элементарный поток поступает в мультиплексор. Сдвиг должен быть достаточно большим, чтобы блок доступа прошел через буфер кодера, мультиплексор и был полностью записан в буфер декодера. При расчете сдвига надо также предотвратить возможное переполнения или полное опустошения буфера декодера, ведь и в том, и в другом случае возникает сбой в непрерывном воспроизведении декодированных изображений. Для этого в кодере используется гипотетический декодер, который подключен к выходу кодера. Конечно, это не настоящий декодер, а вычислительная модель, сопровождаемая определителем степени заполнения буфера декодера. Назначение моделей – наложить ограничения на процесс кодирования с целью обеспечения отсутствия переполнения или полного освобождения емкости буфера декодера. Данные о степени заполнения буфера сообщаются реальному декодеру, чтобы он мог сопоставить вычисленные значения с текущими значениями аналогичных параметров в процессе настоящего декодирования.

Подстройка системных часов

Для правильной интерпретации меток времени декодер должен иметь свое собственное системное время, причем должна быть обеспечена подстройка «часов» декодера под время «часов» кодера. Для этого текущее время кодера регулярно передается декодеру. Системное время каждой программы отсчитывается в единицах периода колебаний с частотой 27МГц. Отсчеты этого времени передаются в программном потоке в одном из полей заголовка блока (они называются SCR – System Clock Reference) не реже, чем через 0,7 секунды. В транспортном потоке могут переноситься данные нескольких телевизионных программ, каждая из которых может иметь свое независимое время, называемое программным. Отсчеты программного времени PCR (Program Clock Reference) переносятся в поле адаптации транспортного пакета с соответствующим идентификатором PID (обычно он совпадает с идентификатором элементарного потока видеоданных, что иллюстрирует рис.15). Метки PCR должны появляться не реже, чем раз в 0,1 секунды. Несмотря на разницу в названиях, основные функции PCR и SCR совпадают. Принцип синхронизации декодера с кодером путем использования отсчетов программного времени иллюстрирует рис.20.

Время декодировать и время предъявлять

Метки времени, ассоциируемые с блоками доступа, выражаются в единицах времени периода колебаний с частотой 90кГц, полученных путем деления частоты 27МГц. Эти метки бывают двух типов: метки времени представления PTS и метки времени декодирования DTS. Метки PTS определяют момент времени, в который декодированный блок доступа (кодированное изображение или фрагмент звукового сопровождения) должен быть предъявлен зрителю. Для всех элементарных потоков, кроме видео, PTS – это единственные метки, которые необходимы. Для потока видеоданных необходимы метки времени декодирования DTS, определяющие моменты времени, в которые блоки доступа извлекаются из буфера и декодируются, но не предъявляются зрителю. Декодированные изображения временно хранятся и предъявляются в боле позднее время, назначаемое метками PTS. Метки DTS необходимы изображениям типа I и P, которые должны декодироваться раньше, чем B-изображения, для кодирования которых I и P изображения использовались в качестве опорных. Метки DTS не появляются в одиночку, а должны сопровождаться метками PTS. Метки не должны сопровождать каждый блок доступа. Ограничение, определяемое стандартом MPEG-2, заключается в том, чтобы в элементарных потоках видео и звука метки должны появляться не реже, чем раз в 0,7 секунды. Метки переносятся в заголовках PES-пакетов (рис.10). Если метка сопровождает блок доступа, то она появляется в заголовке PES-пакета, в котором этот блок доступа начинается.

Монтаж. Можно ли монтировать MPEG?

Иногда считается, что монтаж программ, закодированных в соответствии со стандартом MPEG-2 невозможен. Такое суждение объясняется тем, что в результате кодирования с предсказанием в процессе устранения временной избыточности все кадры связаны в единую цепь, разорвать которую якобы нельзя без сбоя в воспроизводимом изображении. Утверждается, что единственно возможный способ монтажа требует декодирования, т.е. преобразования компрессированных потоков в исходную форму, после которого можно выполнить монтажную операцию и повторное кодирование смонтированной программы. Конечно, такой вид монтажа возможен, но он связан с потенциальными искажениями и артефактами, возникающими в результате цикла компрессии – декомпрессии. Однако возможен и монтаж видеопотоков, компрессированных по стандарту MPEG-2, хотя, конечно, система компрессии накладывает значительный отпечаток на методы монтажа. Прежде всего следует отметить, что все изображения связаны и образуют цепь с взаимозависимыми элементами только в случае использования открытых групп изображения. Кадры изображения в пределах закрытой группы (она заканчивается изображением типа P) не зависят от кадров других групп (предсказание выполняется строго в пределах одной группы). Поэтому видеопотоки из закрытых легко могут коммутироваться и монтироваться на границах групп. Однако и потоки, основанные на открытых группах изображений, могут монтироваться в компрессированной форме. Для этого надо разорвать цепь непрерывности в выбранной точке монтажного перехода. Однако смонтированная программа должна обладать всеми свойствами потока данных MPEG-2.

Перемаркирование кадров в области монтажного перехода

Один из вариантов коммутации элементарных потоков иллюстрирует рис.21. Этот вариант основан на перемаркировании кадров – изображений типа B, которые связаны в результате предсказания и с предыдущими и с последующими кадрами типа I и P, в изображения типа P без изменения соответствующего блока доступа (кадры B15 и B16 элементарного потока 1 переименованы в кадры P15’ и P16’). Непрерывная цепь предсказаний разрывается, (при декодировании P15’ и P16’ в качестве опорного будет использоваться изображение P14), и коммутация с целью монтажа оказывается возможной.
То, что стратегия декодирования трансформируется без изменения закодированной ошибки предсказания, не связано с высокой заметностью потенциальных искажений благодаря кратковременности монтажного перехода. Более серьезным является то, что такая коммутация может привести к потенциальному переполнению или опорожнению буфера декодера, что связано с большими искажениями. Возможное решение этой проблемы – вставка предварительно кодированного черного потока данных, который может быть вставлен между первым и вторым потоками для нормализации состояния буфера.

Перекодирование кадров в области монтажного перехода

Другой и, вероятно, лучший с точки зрения качества изображения метод, связан с перекодированием коммутируемых элементарных потоков в окрестности монтажного перехода (рис.22). Такой вариант может быть рекомендован для дисковых систем, в которых телевизионные программы хранятся в компрессированном виде.

Монтажные магнитофоны MPEG

Возможности монтажа телевизионных программ в компрессированном виде в условиях студийного производства предоставляет студийный профиль 422 стандарта MPEG-2, уже реализованный в формате видеозаписи Betacam SX. В нем используются открытые группы изображений из 2 кадров (I и B). Данный профиль позволяет, например, выполнять монтаж путем дописывания нового потока данных без нарушения непрерывности смонтированного потока в точках монтажа (рис.23). Если точка монтажного перехода выбрана на границе кадров B15 и I16, то после монтажа будет невозможно использовать кадр I16, а его наличие при обычном декодировании было бы необходимо, поскольку при для декодирования B15 в качестве опорной информации должны использоваться кадры I14 и I15. В процессе монтажа кадр B15 не просто перемаркируется, как показано на рис.21, а перекодируется как кадр типа B, но с предсказанием только на основе предшествующего кадра I14, в результате чего образуется кадр BU15 (правила профиля 422 разрешают такую операцию). Ключ к высококачественному выполнению такого способа монтажа – опережающее считывание, достигаемое с помощью специальной вращающейся головки. Опережающее считывание позволяет получать данные о предшествующих кадрах, которые после перекодирования записываются спустя некоторое время головками записи на место прежних кадров.

Совершенно очевидно, что такой способ, основанный на перекодировании кадров с двунаправленным предсказанием в сочетании с опережающим считыванием, позволяет выбирать точку монтажного перехода в любом месте и выполнять монтаж с точностью 0 кадров. Еще более высокого качества монтажных операций позволяет достичь реализация профиля MPEG 422, основанная на однокадровых группах изображений. Казалось бы, зачем в таком случае MPEG, если используется только внутрикадровое кодирование? Однако MPEG – это не только кодирование с целью сокращения временной избыточности, но и гибкая универсальная форма представления кодированных изображений в виде потоков данных, достоинства которой сохраняются при любых группах изображений.

Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18