Банк Рефератов - Аналоговая и цифровая аудио и видеоинформация

Рефераты. Аналоговая и цифровая аудио и видеоинформация

Окончательной версии выше упоминаемой психоакустической модели пока не существует, как нет и определенного стандартного алгоритма кодирования. В связи с этим в общем случае объем и степень ощутимости потерь определяются, с одной стороны, потоком, а с другой — особенностями конкретной разновидности психоакустической модели, использованной в каждом конкретном кодере. Последний момент имеет особенно большое значение на низких потоках. Существует набор эффектов, которые на таких потоках крайне плохо поддаются кодированию.

И еще одна особенность человеческого слуха была учтена при разработке алгоритма компрессии — использование минимального порога слышимости. Наибольшей чувствительностью (2-4 дБ) органы слуха обладают в среднем диапазоне частот порядка 2-5 кГц. На других частотах порогом чувствительности может стать значение громкости звука в 40 дБ. Иными словами, звуки, лежащие за порогом чувствительности, нет смысла сохранять, поскольку они все равно не будут услышаны.

На основании подобных эффектов создается так называемая психоакустическая модель, разбивающая весь частотный спектр на части, в которых уровень звука примерно одинаков, после чего удаляет звуки, не воспринимаемые человеком, как это было описано выше.

Существует три уровня audio MPEG для сжатия стереофонических сигналов:

· коэффициент сжатия 1:4 при допустимом потоке данных 384 Кбит/с;

· 1:6..1:8 при 256..192 Кбит/с;

· 1:10..1:12 при 128..112 Кбит/с.

Теперь попробуем понять, какова разница между уровнями (Layers). Например, в Layer 3 части разбитого спектра намного меньше, чем в первых двух, и по этой причине сжатие этим методом является наиболее продуктивным, а коэффициент его достигает 1:12 без заметной на слух потери качества. Поэтому столь широкое распространенное получило расширение файлов MP3 (MPEG Layer 3).

Для получения звука с качеством CD необходимо компрессировать аудиофайлы с потоком 256 Кбит/с, но для большинства слушателей и большинства применений вполне достаточно 128 Кбит/с (по 64 Кбит/с на канал). Однако среди великого множества кодеров MP3-файлов следует отметить немногие, позволяющие сжимать звуковой ряд с переменным потоком (variable bitrate), обеспечивая, таким образом, максимальное качество и экономя дисковое пространство. Основой таких кодеков является использование в каждый момент времени определенного значения потока и, как следствие, изменяющейся во времени природы звукового сигнала (частоты и амплитуды звуковых колебаний). Для сжатия речи с отличным качеством вполне достаточно 24 или 32 Кбит/с.

Построение той самой психоакустической модели — сложный математический процесс, изобилующий вычислениями с плавающей запятой. Как следствие, подобный процесс, равно как и процесс сжатия, методом Хаффмана, требует солидной вычислительной мощности и при декодировании файлов формата MPEG, и особенно — при кодировании. Первоначально для этой цели использовались специализированные устройства, выполнявшие все математические преобразования на аппаратном уровне, и лишь в последние годы, после появления достаточно мощных процессоров, способных справляться с подобными вычислениями без особого ущерба для остальных приложений, это стало возможным и с помощью специальных программ.

5. Видеоинформация.

5.1. В начале был аналог.

Самым ранним методом передачи видеосигналов является аналоговый метод. Одним из первых видеоформатов на основе этого принципа стал композитный видеосигнал. Композитное аналоговое видео комбинирует все видеокомпоненты (яркость, цвет, синхронизацию и т. п.) в один сигнал. Из-за объединения этих элементов в одном сигнале качество композитного видео далеко от совершенства. В результате мы имеем неточную передачу цвета, недостаточно "чистую" картинку и другие факторы потери качества.

Композитное видео быстро уступило дорогу компонентному видео, в котором различные видеокомпоненты представлены как независимые сигналы. Дальнейшие усовершенствования этого формата привели к появлению различные его вариаций: S-Video, RGB, Y, Pb, Pr и др.

Тем не менее, все вышеперечисленные форматы остаются аналоговыми по своей сути, и, следовательно, обладают одним существенным недостатком: при копировании дубль всегда уступает по качеству оригиналу. Потеря качества при копировании видеоматериала аналогична фотокопированию, когда копия никогда не бывает такой же четкой и яркой, как оригинал.

5.2. Цифровое видео.

Недостатки, присущие аналоговому способу воспроизведения видео, в конце концов привели к разработке цифрового видеоформата. На смену аналоговому видео пришло цифровое. В области профессионального видео применяется несколько цифровых видеоформатов: D1, D2, Digital BetaCam и др. В отличие от аналогового видео, качество которого падает при копировании, каждая копия цифрового видео идентична оригиналу.

Хотя современный видеоряд базируется на цифровой основе, практически все цифровые видеоформаты до сих пор в качестве носителя исходного сигнала используют пленку с последовательным доступом. Поэтому большинству профессионалов в области видео все еще привычней работать с пленкой, чем с компьютером.

Конечно, пленка в качестве источника данных все еще остается более предпочтительной, чем жесткий диск компьютера, поскольку вмещает значительно больший объем данных. Но зато для цифрового видеомонтажа использование компьютеров дает ряд существенных преимуществ: не только обеспечивает прямой доступ к любому видеофрагменту (что невозможно при работе с пленкой, поскольку к необходимым участкам можно добраться лишь последовательно просматривая видеоматериал), но и предполагает широкие возможности обработки изображения (редактирование, сжатие).

Это достаточно веские причины для перехода видеопроизводства с традиционного оборудования на компьютерное.

Компьютерное цифровое видео представляет собой последовательность цифровых изображений и связанный с ними звук. Элементы видео хранятся в цифровом формате.

Существует множество способов захвата, хранения и воспроизведения видео на компьютере. С появлением компьютерного цифрового видео стихийно стали возникать самые разнообразные форматы представления видеоданных, что поначалу привело к некоторой путанице и вызвало проблемы совместимости. Однако в последние годы благодаря усилиям Международной организации по стандартизации (ISO -- International Standards Organisation)[1] выработаны единые стандарты на форматы видеоданных, которые мы позже рассмотрим.

5.3. Основные характеристики цифрового видео.

Цифровое видео характеризуется четырьмя основными факторами: частота кадра (Frame Rate), экранное разрешение (Spatial Resolution), глубина цвета (Color Resolution) и качество изображения (Image Quality).

Частота кадра (Frame Rate). Стандартная скорость воспроизведения видеосигнала -- 30 кадров/с (для кино этот показатель составляет 24 кадра/с). Каждый кадр состоит из определенного количества строк, которые прорисовываются не последовательно, а через одну, в результате чего получается два полукадра, или так называемых "поля". Поэтому каждая секунда аналогового видеосигнала состоит из 60 полей (полукадров). Такой процесс называется interlaced видео.

Между тем монитор компьютера для прорисовки экрана использует метод "прогрессивного сканирования" (progressive scan), при котором строки кадра формируются последовательно, сверху вниз, а полный кадр прорисовывается 30 раз каждую секунду. Разумеется, подобный метод получил название non-interlaced видео. В этом заключается основное отличие между компьютерным и телевизионным методом формирования видеосигнала.

Глубина цвета (Color Resolution). Этот показатель является комплексным и определяет количество цветов, одновременно отображаемых на экране. Компьютеры обрабатывают цвет в RGB-формате (красный-зеленый-синий), в то время как видео использует и другие методы. Одна из наиболее распространенных моделей цветности для видеоформатов -- YUV. Каждая из моделей RGB и YUV может быть представлена разными уровнями глубины цвета (максимального количества цветов).

Для цветовой модели RGB обычно характерны следующие режимы глубины цвета: 8 бит/пиксель (256 цветов), 16 бит/пиксель (65,535 цветов) и 24 бит/пиксель (16,7 млн. цветов). Для модели YUV применяются режимы: 7 бит/пиксель (4:1:1 или 4:2:2, примерно 2 млн. цветов), и 8 бит/пиксель (4:4:4, примерно 16 млн. цветов).

Экранное разрешение (Spatial Resolution). Еще одна характеристика - экранное разрешение, или, другими словами, количество точек, из которых состоит изображение на экране. Так как мониторы PC и Macintosh обычно рассчитаны на базовое разрешение в 640 на 480 точек (пикселей), многие считают, что такой формат является стандартным. К сожалению, это не так. Прямой связи между разрешением аналогового видео и компьютерного дисплея нет.

Стандартный аналоговый видеосигнал дает полноэкранное изображение без ограничений размера, так часто присущих компьютерному видео. Телевизионный стандарт NTSC (National Television Standards Committe), разработан Национальным комитетом по телевизионным стандартам США. Используемый в Северной Америке и Японии, он предусматривает разрешение 768 на 484. Стандарт PAL (Phase Alternative), распространенный в Европе, имеет несколько большее разрешение -- 768 на 576 точек.

Поскольку разрешение аналогового и компьютерного видео различается, при преобразовании аналогового видео в цифровой формат приходится иногда масштабировать и уменьшать изображение, что приводит к некоторой потере качества.

Страницы: 1, 2, 3, 4