Рефераты. MPEG форматы

MPEG форматы

               

Описание формата MPEG


В январе 1988 года в рамках объединенного технического комитета по информационным технологиям JTC1 Международной организации по стандартизации ISO и Международной электротехнической комиссии IEC была образована рабочая группа экспертов по кодированию движущихся изображений, перед которой была поставлена задача разработки стандартов кодирования изображения и звука с целью устранения избыточности. Группа получила официальное наименование ISO/IEC JTC1/SC29/WG11 (11 рабочая группа 29 подкомитета), но мировую известность она приобрела под названием MPEG - Moving Picture Expert Group. В первом заседании группы в мае 1998 года участвовало 25 экспертов, сейчас группа MPEG объединяет сотни специалистов, представляющих около 200 организаций из более чем 20 стран. Общая цель работы группы остается прежней – компрессия, обработка и кодовое представление изображения, звука и их комбинаций. Основные проекты группы – это MPEG-1 (стандарт ISO/IEC 11172) - Кодирование изображение и звука при скоростях передачи данных до 1.5Мбит/с, MPEG-2 (ISO/IEC 13818) – Обобщенное кодирование изображения и звука, MPEG-4 (ISO/IEC 14496) – Кодирование аудиовизуальных объектов, MPEG-7 (ISO/IEC 15938) – Описание содержания объектов мультимедиа. Из этого списка лишь стандарт MPEG-7 пока не утвержден ISO, но работа над всеми проектами (кроме MPEG-1) продолжается.

- MPEG-1: оригинальный формат для хранения и воспроизведения видео- и аудиоданных на мультимедиа носителях данных. Принят в качестве официального стандарта в 1992 г. Разрабатывался для доставки видео на CD-ROM (скорость около 1,5 Мбит/с) и получил широкое распространение во многом благодаря дискам VideoCD. Потенциально поддерживает телевизионное качество видео.

- MPEG-2: более новый стандарт (утвержден в ноябре 1994 г.). Разработан как дополнение к стандарту MPEG-1. Поддерживает передачу высококачественного видео по высокоскоростным цифровым каналам. Интенсивность потока данных от до 2 до 10 Мбайт/сек. Разрешение 720х480 и 1280х720, частота 60 кадров в секунду со звуковыми данными CD-качества. Подходит для всех стандартов телевидения и даже систем телевидения высокой точности (HDTV, High Definition Television). Используется при записи DVD дисков.

Параллельно с разработкой стандарта MPEG-2 группа MPEG занималась также работой по созданию стандарта MPEG-3, ориентированного на использование в системах телевидения высокой четкости. Однако, в ходе исследований было установлено, что в системах телевидения высокой четкости можно использовать уже созданные стандарты MPEG-1 и MPEG-2. В качестве стандарта для систем телевидения высокой четкости был принят MPEG-2.

- MPEG-4: начинал разрабатываться как формат для передачи видео и аудиоданных по каналам с низкой пропускной способностью, в том числе беспроводным. MPEG-4, версия 1 был одобрен в октябре 1998 г. , как стандарт ISO/IEC 14496. Этот формат был расчитан для применения в системах видеотелефонии, мультимедийной электронной почте, электронных информационных изданиях. Предусматривал разрешение 174х144 пиксела при 10 кадрах в секунду и позволял передавать данные со скоростью от 4800 до 64000 бит/сек.

Базируется на формате файлов Quiсktime (QuickTime - стандарт, архитектура программного обеспечения, которая позволяет создавать, объединять и публиковать все типы цифровых мультимедиа данных. Используя QuickTime, программные приложения могут легко работать с широким кругом форматов файлов и кодеков. QuickTime включает три основополагающих элемента - QuickTime видео формат (Movie file format), слой абстрактного носителя (Media Abstraction Layer) и богатый набор встроенных медиа - служб. QuickTime видео формат хорош тем, что он платформенно независим, открыт для расширения. В связи с названными преимуществами, поддерживается многими производителями. QuickTime слой абстрактного носителя определяет исчерпывающий набор сервисных функций покрывающих все аспекты создания, редактирования и воспроизведения цифрового материала. Среди них: синхронизация по времени, компрессия и декомпрессия аудио- и видеоданных, преобразование форматов, масштабирование, смешивание и транскодирование, аудио- и видеоэффекты и переходы, синхронизация чтения и записи, захват данных, импорт и экспорт данных, стандартный пользовательский интерфейс. QuickTime поддерживает широкий набор типов мультимедиа данных (видео, аудио, текст, временной код, музыкальный MIDI - интерфейс, спрайты, анимацию и др.).)#"1.files/image002.gif">Разработка формата сжатия MPEG 21 - это долговременный проект, который называется "Система мультимедийных средств" (Multimedia Framework). Над разработкой этого формата сжатия эксперты начали работать в июне 2000 г. На первых этапах планировалось провести расширение, унификацию и объединение форматов MPEG 4 и MPEG 7 в единую обобщающую структуру. Подразумевалось, что она будет обеспечивать глубокую поддержку управления правами и платежными системами, а также качеством предоставляемых услуг.

MPEG1

Как и метод группы JPEG, алгоритм MPEG-1 использует дискретное косинусное преобразование (Diskrete Cosine Transform). В частности, при применении MPEG-алгоритма специальные средства позволяют при сжатии текущего кадра включать ссылки на части изображения, оставшегося неизменным от предыдущего кадра. Как обычно, вначале идет преобразование информации в базис YUV и ее прореживание. После этого выполняется дискретное косинусное преобразование. Аналогичным образом используется и кодирование Хаффмана (В основе алгоритма кодирования Хаффмана лежит довольно простой принцип: символы заменяются кодовыми последовательностями различной длины. Чем чаще используется символ, тем короче должна быть кодовая последовательность. Именно поэтому алгоритм Хаффмана называется также кодированием символами переменной длины (Variable-Lenth Coding). Код переменной длины позволяет записывать наиболее часто встречающиеся символы короткими кодовыми последовательностями, а редко встречающиеся – более длинными. Например, для английского текста символам Е,Т и А можно поставить в соответствие 3-битовые последовательности, а J, Z и Q – 8-битовые. В одних алгоритмах реализации алгоритма Хаффмана используются готовые кодовые таблицы, в других – кодовая таблица строится только на основе статистического анализа имеющейся информации. Кодирование по Хаффману гарантирует возможность полного последующего декодирования.). Тем не менее основной задачей для MPEG-алгоритма является определение вектора движения, то есть основного направления, в котором происходят изменения. Для этой цели на различных этапах выполнения алгоритма могут использоваться операции сравнения, а также предсказания назад и вперед, осреднения блоков и т.д.

В соответствии с MPEG существует три вида кадров: типа I (Inter frame) - исходные (ключевые), типа Р (Predicted frame) - предсказуемые и типа В (Bi-directional frames) - двунаправленные. Кадр типа I является базовым. Сжатие такого кадра может происходить только по методу обработки неподвижного изображения, например, методом типа JPEG. Кадр типа Р получается на основе информации одного I - или одного предсказуемого Р-кадра. А вот кадр типа В получается на основе I- или Р-кадров, причем одного из них в прошлом, а другого — в будущем. На самом деле все выглядит не так фантастически. как кажется. Разумеется. что декодирующее устройство получает сначала фрейм I, затем Р и только после этого формирует фрейм В. Данный метод обеспечивает коэффициенты сжатия в пределах от 40:1 до 200:1.

MPEG2

Поток видеоданных, определяемый спецификацией 13818-2, представляет собой иерархическую структуру, элементы которой строятся и объединяются друг с другом в соответствии с определенными синтаксическими и семантическими правилами. Существует 6 типов элементов этой иерархической структуры:

·   Видеопоследовательность

·   Группа изображений

·   Изображение

·   Срез

·   Макроблок

·   Блок.

Видеопоследовательность – элемент потока видеоданных высшего уровня. Она представляет собой серию последовательных кадров телевизионного изображения. MPEG-2 допускает как построчные, так и чересстрочные последовательности. Чересстрочная последовательность – это серия телевизионных полей. В процессе компрессии поля могут кодироваться раздельно. Это дает изображения типа «поле». Два поля, кодируемые как телевизионный кадр, образуют изображение типа «кадр». В одной чересстрочной последовательности могут использоваться и изображения-поля, и изображения-кадры. В последовательностях с построчным разложением каждое изображение представляет собой кадр. В соответствии с используемыми методами дифференциального кодирования различают три типа изображений: I, P и B. Изображение типа I кодируется с использованием только той информации, которая содержится в нем самом (I - Intra-coded picture). В нем устраняется только пространственная избыточность. При кодировании P и B изображений используется межкадровое кодирование. При кодировании изображения типа P формируется разность между исходным изображением и предсказанием, полученным на основе предшествующего или последующего изображения типа I (P – Predictive-coded picture). Изображение типа B – это изображение, при кодировании которого используется предсказание, сформированное на основе предшествующего и последующего изображений типа I или P (B – Bidirectionally-predicted-coded picture). В изображениях типа P и B устраняется и пространственная, и временная избыточность. Серия изображений, содержащих одно I-изображение, называется группой изображений. Пример видеопоследовательности с различными типами изображений показан на рис.1 (стрелками показаны направления предсказания в пределах одной группы изображений). Чем больше группа изображений, тем большая степень компрессии может быть достигнута.

 




















 


















С информационной точки зрения каждое изображение представляет собой три прямоугольных матрицы отсчетов изображения: яркостную Y и две матрицы цветности Cb и Cb. Стандарт MPEG-2 допускает различные структуры матриц. Соотношение между количеством отсчетов яркости и цветности определяется форматом дискретизации. В случае формата 4:2:0 размеры матриц Cb и Cb в 2 раза меньше, чем Y, и в горизонтальном, и в вертикальном направлениях (рис.5). Формат 4:2:2 отличается тем, что все три матрицы имеют одинаковые размеры по вертикали, но в горизонтальном направлении матрицы цветности имеют в два раза меньшее количество элементов (рис.6). В формате 4:4:4 все матрицы одинаковы (рис.6).

Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18



2012 © Все права защищены
При использовании материалов активная ссылка на источник обязательна.