Реферат: Перспективы цифрового видео
Компьютерное цифровое видео представляет собой последовательность цифровых изображений и связанный с ними звук. Элементы видео хранятся в цифровом формате.
Существует множество способов захвата, хранения и воспроизведения видео на компьютере. С появлением компьютерного цифрового видео стихийно стали возникать самые разнообразные форматы представления видеоданных, что поначалу привело к некоторой путанице и вызвало проблемы совместимости. Однако в последние годы благодаря усилиям Международной организации по стандартизации (ISO -- International Standards Organisation)[1] выработаны единые стандарты на форматы видеоданных, которые мы позже рассмотрим.
2.1. Основные характеристики цифрового видео
Цифровое видео характеризуется четырьмя основными факторами: частота кадра (Frame Rate), экранное разрешение (Spatial Resolution), глубина цвета (Color Resolution) и качество изображения (Image Quality).
Частота кадра (Frame Rate). Стандартная скорость воспроизведения видеосигнала -- 30 кадров/с (для кино этот показатель составляет 24 кадра/с). Каждый кадр состоит из определенного количества строк, которые прорисовываются не последовательно, а через одну, в результате чего получается два полукадра, или так называемых "поля". Поэтому каждая секунда аналогового видеосигнала состоит из 60 полей (полукадров). Такой процесс называется interlaced видео.
Между тем монитор компьютера для прорисовки экрана использует метод "прогрессивного сканирования" (progressive scan), при котором строки кадра формируются последовательно, сверху вниз, а полный кадр прорисовывается 30 раз каждую секунду. Разумеется, подобный метод получил название non-interlaced видео. В этом заключается основное отличие между компьютерным и телевизионным методом формирования видеосигнала.
Глубина цвета (Color Resolution). Этот показатель является комплексным и определяет количество цветов, одновременно отображаемых на экране. Компьютеры обрабатывают цвет в RGB-формате (красный-зеленый-синий), в то время как видео использует и другие методы. Одна из наиболее распространенных моделей цветности для видеоформатов -- YUV. Каждая из моделей RGB и YUV может быть представлена разными уровнями глубины цвета (максимального количества цветов).
Для цветовой модели RGB обычно характерны следующие режимы глубины цвета: 8 бит/пиксель (256 цветов), 16 бит/пиксель (65,535 цветов) и 24 бит/пиксель (16,7 млн. цветов). Для модели YUV применяются режимы: 7 бит/пиксель (4:1:1 или 4:2:2, примерно 2 млн. цветов), и 8 бит/пиксель (4:4:4, примерно 16 млн. цветов).
Экранное разрешение (Spatial Resolution). Еще одна характеристика - экранное разрешение, или, другими словами, количество точек, из которых состоит изображение на экране. Так как мониторы PC и Macintosh обычно рассчитаны на базовое разрешение в 640 на 480 точек (пикселей), многие считают, что такой формат является стандартным. К сожалению, это не так. Прямой связи между разрешением аналогового видео и компьютерного дисплея нет.
Стандартный аналоговый видеосигнал дает полноэкранное изображение без ограничений размера, так часто присущих компьютерному видео. Телевизионный стандарт NTSC (National Television Standards Committe), разработан Национальным комитетом по телевизионным стандартам США. Используемый в Северной Америке и Японии, он предусматривает разрешение 768 на 484. Стандарт PAL (Phase Alternative), распространенный в Европе, имеет несколько большее разрешение -- 768 на 576 точек.
Поскольку разрешение аналогового и компьютерного видео различается, при преобразовании аналогового видео в цифровой формат приходится иногда масштабировать и уменьшать изображение, что приводит к некоторой потере качества.
Качество изображения (Image Quality) . Последняя, и наиболее важная характеристика - это качество видеоизображения. Требования к качеству зависят от конкретной задачи. Иногда достаточно, чтобы картинка была размером в четверть экрана с палитрой из 256-ти цветов (8 бит), при скорости воспроизведения 15 кадров/с. В других случаях требуется полноэкранное видео (768 на 576) с палитрой в 16,7 млн. цветов (24 бит) и полной кадровой разверткой (24 или 30 кадров/с).
3.Сжатие видео
Следует исходить из разумной достаточности при определении необходимой степени сжатия. При этом необходимо учитывать, как четыре характеристики (частота кадра, экранное разрешение, глубина цвета и качество изображения) влияют на объем и качество видео. Вы должны ясно себе представлять, какую "цену" придется заплатить за качественное изображение. Чем больше глубина цвета, выше разрешение и лучше качество, тем большая производительность компьютера вам потребуется, не говоря уж о громадных объемах дискового пространства, необходимого под цифровое видео. Учитывая эти характеристики, можно выбрать оптимальный коэффициент сжатия. Надо отметить, что в профессиональном видео действует простое правило - чем ниже коэффициент сжатия, тем лучше.
Простейшие расчеты показывают, что 24-битное цветное видео, при разрешении 640 на 480 и частоте 30 кадров/с потребует передачи 26 Мбайт данных в секунду! Этот поток не только выходит за рамки пропускной способности компьютерной шины, но и моментально "съест" любое дисковое пространство. Для наглядности приводим здесь наши расчеты.
640 горизонтальное разрешение X 480 вертикальное разрешение
307,200 точек на кадр X 3 байтов на каждую точку/пиксель
921,600 всего байтов на кадр X 30 кадров в секунду
27,648,000 всего байтов в секунду / 1,048,576 конвертируем байты в Мбайты
Итого: 27,648,000 байт/с, или 26,36 Мбайт/с
Иногда для уменьшения этого сумасшедшего объема данных до разумного уровня достаточно оптимизировать один из вышеперечисленных параметров видеосигнала. Современные приложения (игры, компьютерные тренажеры, видеокиоски[2] и некоторые деловые пакеты) зачастую не требуют полноэкранного видео. Такие программы обычно используют видео в окне, и для них не требуется оцифровывать целый кадр. Так давайте изменим параметры видеосигнала и сделаем новый расчет для разрешения 320 на 240.
320 горизонтальное разрешение X 240 вертикальное разрешение
76,800 точек на кадр X 3 байтов на каждую точку/пиксель
230,400 всего байтов на кадр X 15 кадров в секунду
3,456,000 всего байтов в секунду / 1,048,576 конвертируем байты в Мбайты
Итого: 3,456,000 байт/с, или 3,3 Мбайт/с
Как видите, уменьшив размер изображения, мы добились весьма существенного уменьшения объема данных, передаваемых в единицу времени. Однако стандартная ISA-шина имеет пропускную способность всего около 600 Кбайт/с. Поэтому, даже существенно пожертвовав качеством видео, мы все еще вынуждены оперировать данными, объем которых в 6 раз больше допустимого уровня. К тому же, не забудьте, что 3,3 Мбайт занимает всего лишь одна секунда видео. Для двухчасового фильма потребуется 23,73 Гбайт дискового пространства! За счет дальнейшего уменьшения размера окна, понижения качества изображения и перехода с RGB формата на YUV (4:1:1) можно добиться еще некоторого снижения объема данных, примерно до 1,5 Мбайт/с. Но этого все равно явно недостаточно.
3.1. Все о сжатии видеоданных :
Очевидно, что сжатие видео нужно для уменьшения объема цифровых видео файлов, предназначенных для хранения, при этом желательно максимально сохранить качество оригинала. Различают сжатие обычное в режиме реального времени, симметричное или асимметричное, с потерей качества или без потери, сжатие видеопотока или покадровое сжатие.
Сжатие обычное (в режиме реального времени ). Термин real-time (реальное время) имеет много толкований. Применительно к сжатию данных используется его прямое значение, т. е. работа в реальном времени. Многие системы оцифровывают видео и одновременно сжимают его, иногда параллельно совершая и обратный процесс декомпрессии и воспроизведения. Для качественного выполнения этих операций требуются очень мощные специальные процессоры, поэтому большинство плат ввода/вывода видео для PC бытового класса не способны оперировать с полнометражным видео и часто пропускают кадры.
Недостаточная частота кадров является одной из основных проблем для видео на PC. При производительности ниже 24 кадров/с видео перестает быть плавным, что нарушает комфортность восприятия. К тому же, пропущенные кадры могут содержать необходимые данные по синхронизации звука и изображения.