Учебное пособие для студентов и преподавателей Автор составитель

Вид материалаУчебное пособие

Содержание


3.7.5. Цифровые камеры
Дефицит памяти
3.7.6. Цифровое видео
3.7.7. Форматы цифрового видео
Подобный материал:
1   ...   6   7   8   9   10   11   12   13   14

3.7.5. Цифровые камеры



Качество изображения, полученного с помощью цифровой камеры, уступает качеству отпечатков, полученных с использованием фотопленки.

Изготовители цифровых фотокамер ориентируются на делового пользователя. Цифровая фотокамера позволяет быстро и просто фиксировать изображение и вводить его непосредственно в ПК, что для многих приложений в деловой сфере представляется более важным, чем качество изображения.

Безусловно, существует целый ряд цифровых камер, лучшие из которых позволяют получать отпечатки, сравнимые по качеству с пленочными камерами высшего класса. Однако такие устройства стоят десятки тысяч долларов и предназначены для профессиональных студийных фотографов и фотожурналистов.

Рассмотрим менее дорогостоящие устройства начального уровня, предназначенные в основном для пользователей из сферы бизнеса и непрофессиональных фотографов.

Беспленочные (цифровые) камеры очень похожи на традиционные фотокамеры. В камерах обоих типов имеются объектив, затвор и диафрагма. Фактически, в некоторых профессиональных беспленочных камерах используются готовые корпуса от 35-мм аппаратов Nikon, Minolta или Canon. Различие же их заключается во внутреннем устройстве или в способе сохранения изображения.

В традиционных фотокамерах изображение фокусируется на пленке, покрытой светочувствительным слоем кристаллов галоидного серебра. Затем в темной комнате или в автоматической установке (мини-лаборатории) пленка последовательно погружается в растворы химических реактивов для проявки и фиксации отснятого изображения.

В беспленочных камерах изображение фокусируется на фоточувствительном размером с почтовую марку кристалле полупроводника, называемом прибором с зарядовой связью (ПЗС). В электронном мире персональных компьютеров ПЗС выступает в качестве замены фотопленки и служит для преобразования воспринимаемого изображения в пикселы (элементы изображения). ПЗС применяются также в сканерах, факсимильных аппаратах и видеокамерах, хотя обычно качество большинства ПЗС для беспленочных камер выше и такие ПЗС, безусловно, дороже.

ПЗС содержат сотни тысяч или даже миллионы резисторов, или элементов выборки. Чем больше элементов-ячеек в ПЗС, тем выше разрешение и качество изображения. При открывании затвора фотокамеры свет, попадая на ячейки ПЗС, приводит к образованию электрического заряда; чем больше света, тем больше ток. В темных местах заряд не образуется. Для получения цветного изображения оно пропускается через многослойный набор, содержащий красный, синий и зеленый светофильтры. После этого свет попадает на пиксели ПЗС, которые чувствительны к красному, синему или зеленому цвету. Эта комбинация пикселей и образует полноцветное изображение.

Затем электрические заряды усредняются и преобразуются посредством аналого-цифрового преобразователя (АЦП) в сочетания нулей и единиц. В цифровых фотокамерах используются встроенные схемы АЦП, осуществляющие преобразование изображения в момент его восприятия. После этого цифровые данные подвергаются сжатию и запоминаются в памяти камеры. В зависимости от камеры, степени сжатия и типа используемой запоминающей среды процесс сжатия и запоминания изображения занимает около 5 с. Еще несколько секунд уходит на перезарядку встроенной фотовспышки (при ее наличии), и вы можете делать следующий снимок.

Второй тип беспленочных фотокамер очень близок к получившим широкое распространение видеокамерам. Видеокамеры для съемок неподвижных сцен воспринимают изображение аналогично цифровым фотокамерам, но в отличие от них не преобразуют изображение в цифровую форму немедленно, а сохраняют его в аналоговом виде на миниатюрных гибких 2-дюймовых дисках. В последующем информация с дисков преобразуется в цифровую форму во внешнем накопителе с АЦП или непосредственно при воспроизведении из камеры посредством платы цифрового преобразователя видеосигналов (устройства захвата кадра).

Основное преимущество видео-фотокамер по сравнению с цифровыми состоит в том, что они позволяют немедленно воспроизвести изображение на телевизионном приемнике или мониторе компьютера, записать его на видеомагнитофоне или передать в телевизионную сеть.

Цифровые камеры - автоматические устройства, не требующие ручной настройки. Загрузка изображений в ПК не вызывает затруднений и требует только подключения соединительного кабеля к камере и последовательному порту компьютера, открытия файлов поставляемого с фотокамерой программного обеспечения и выбора мышью команды, по которой ваши изображения будут автоматически переданы и запомнены на жестком диске.

Но с другой стороны при всех своих успехах и достоинствах беспленочные камеры начального уровня имеют множество практических ограничений, главное из которых состоит в очень невысоком качестве получаемых отпечатков вследствие низкого разрешения камер.

Все описываемые беспленочные фотокамеры обеспечивают 24-бит представление цвета, но имеют разное разрешение - от 320х240 (у Casio) до 640х480 (у Apple, Chinon и Dycam), 756х504 (у Kodak) и 756х512 (у Logitech).

Эти значения вполне достаточны для формирования изображения на экране VGA или получения отпечатков размером не более 3х4 дюйм (7,6х10,2 см) или 4х5 дюйм (10,2х12,7 см) при разрешении принтера 300 точка/дюйм. Но если еще больше увеличить эти снимки, то на отпечатках появятся артефакты (паразитные узоры, вызванные ложными информационными точками в изображении), станет заметной дискретность изображения (пятна тени и света и неровные края, вызванные квадратными пикселями) и изображение в целом будет страдать от недостаточной проработки деталей.

Помимо посредственного качества снимков есть еще ряд серьезных недостатков, присущих беспленочным камерам начального уровня. Один из них - отсутствие возможности управлять процессом съемки (не предусмотрена ручная установка диафрагмы и выдержки, чтобы можно было адаптировать процесс съемки к различным условиям освещения).

Подобные недостатки устранены в цифровых фотосистемах профессионального уровня, как, например, Kodak DCS460 и Nikon E2. В этих дорогих камерах применяются также более сложные конструкции по сравнению с их аналогами начального уровня, что позволяет улучшить качество изображения. Например, в Minolta RD-175 и AGFA ActionCam (ценой около 10 тыс. долл. каждая) для получения изображения с разрешением 1528х1146 и 24-бит представлением цвета вместо одной ПЗС-матрицы с высокой плотностью размещения элементов используются три сравнительно недорогие ПЗС-атрицы и светорасщепляющая система. Применение трех матриц ПЗС по существу устраняет искажение цветов.

Еще большим числом индивидуальных особенностей обладают камеры Nikon E2 и Fujix DS-515 (цена каждой из них составляет около 16,5 тыс. долл.) с большой емкостью встроенной памяти. Это позволяет производить ими съемку до 7 кадров в непрерывном режиме со скоростью 3 кадр/с, что делает их пригодными для скоростной съемки объектов, например спортивных эпизодов.

Дефицит памяти

Когда в обычной фотокамере у вас кончается пленка, вы просто вставляете новую кассету. Поскольку в беспленочных камерах изображение сохраняется во встроенной памяти, на общее число отснятых вами кадров налагаются более жесткие ограничения. В режиме высокого качества снимков камеры Chinon и Dycam позволяют сохранить только пять кадров (хотя в обе камеры могут быть установлены дополнительные, но дорогостоящие платы PC Cards с емкостью памяти от 1 до 16 Мбайт), камера Apple - 16 кадров, Kodak и Logitech - по 48 кадров и Casio - 96 кадров. После этого вы должны сохранить эти кадры в свой ПК и очистить память фотокамеры для дальнейших съемок. Выгрузка отснятых кадров в ПК может занять от 5 до 20 мин в зависимости от типа камеры, скорости передачи данных через последовательный порт компьютера и используемого формата файла. (Передача сжатых файлов в собственном формате и восстановление их в первоначальном несжатом виде вне камеры требуют значительно меньше времени, чем одновременное восстановление, передача и запоминание в форматах, подобных TIFF или BMP).

Во всех рассмотренных нами беспленочных камерах, за исключением Casio, предусмотрена возможность увеличить число сохраняемых кадров, выполняя съемку в режиме низкого разрешения. Однако этот термин несколько неточен, поскольку разрешение (за исключением камеры Logitech) остается прежним, а изменяется степень сжатия и, следовательно, качество изображения. Камера Apple позволяет сохранять во встроенной памяти до 32 кадров стандартного качества, Kodak - 96, Logitech - 150, a Chinon и Dycam - по 10 кадров высокого (среднего) и 40 кадров нормального (низкого) качества. Переключение режимов в камерах Apple, Chinon и Dycam пользователь может производить для каждого снимаемого кадра, в то время как для камер Kodak и Logitech уровень качества изображения должен репрограммироваться с помощью компьютера.

Однако не забывайте, что при среднем и низком разрешении качество изображения получается плохим и непригодным для большинства практических применений.

Существенное различие между беспленочными и обычными камерами состоит в задержке длительностью в несколько секунд, которая требуется беспленочной камере для фиксации изображения, его преобразования, сжатия и сохранения в цифровом виде.

В отличие от пленочных каждая из этих цифровых камер позволяет стереть последний отснятый кадр, чтобы не занимать драгоценную память каким-либо неудачным снимком, можно удалять несколько кадров вразбивку. Во всех камерах предусмотрен также механизм защиты, предохраняющий от случайного стирания отснятых кадров, хранящихся в памяти камеры. Еще одна важная особенность заключается в программном обеспечении, поставляемом вместе с камерой. Во многих случаях в состав ПО входят небольшие прикладные программы, позволяющие кадрировать, поворачивать и корректировать изображения без необходимости импортировать их в более сложные программы редактирования изображений (например, в Adobe Photoshop).

При наличии у камеры средств цифрового входа и видеовыхода вы можете загрузить деловую презентацию в ее память и затем воспроизвести ее на телевизионном приемнике.

Так вытеснит ли в конечном итоге цифровая фотография пленочную при любых съемках - от снимков для журналов до снимков вашего летнего отпуска? Безусловно, но ключевыми в этой фразе служат слова "в конечном итоге". ПЗС предстоит пройти еще долгий путь, прежде чем они смогут обеспечить получение изображений с высоким разрешением и непрерывными полутонами при доступных широкому кругу пользователей ценах.

Видеостандартом называется описание формы кодирования видеоизображения определенным видеосигналом. Такое описание является неизменным и поддерживается различными производителями видеооборудования. В настоящее время в мире существует множество видеостандартов, определяющих различные типы телевизионного вещания.

Исторически сложилось, что видеостандарты варьируются в зависимости от географического расположения той или иной страны. К примеру, NTSC стандарт используется в Северной Америке, в Центральной Америке, в Японии, на Южном побережье Тихого океана и в некоторых частях Южной Америки. Стандарт PAL используется в Англии, Западной Германии и Нидерландах. Стандарт SECAM - во Франции и в ее бывших колониях, в бывшем Восточном блоке и в странах Среднего Востока.

Наиболее старым видеостандартом является стандарт NTSC (National Television Systems Committee). Стандарт NTSC был создан в 1948 году как национальный стандарт для телевещания. NTSC определяет все параметры, которые позволяют любому телевизору в Северной Америке принимать телевещательный сигнал. Стандарт определяет метод кодирования информации в композитный видеосигнал.

Этот стандарт имеет частоту 30 кадров в секунду в чересстрочном режиме (нечетные строки отображаются за первый проход, четные - за следующий). Такая система показа делит каждый кадр на два поля и, следовательно, каждую секунду - на 60 полей. Вертикальное разрешение NTSC составляет 525 сканирующих строк, но диапазон видимых строк составляет 484 строки. Обеспечивается поддержка 16 миллионов разных цветов. В настоящее время разрабатываются новые разновидности стандарта NTSC "Super NTSC" и "16 х 9", которые будут входить в состав стандарта MPEG и стандарта разработки DVD.

 Еще одним распространенным стандартом является стандарт PAL (Phase Alternation Line). PAL предполагает следующую частоту кадров: 25 череcстрочных кадров в секунду, имеющих 625 сканирующих строк. Разработанный после NTSC, PAL выдает более широкий диапазон для модуляции цветности, что, естественно, улучшает разрешение цвета. В 1967 году видеостандарт PAL был адаптирован в Англии, Западной Германии и Нидерландах, а затем распространился и в других странах мира. Однако в Бразилии используется модификация этого стандарта, названная PAL-M, которая объединяет улучшенный диапазон цветности и частоту кадров, равную 30 кадрам в секунду, с 525 строками в кадре.

  В России телевидение использует стандарт SECAM (SEquential Couleur Avec Memoire). Частота кадров в SECAM соответствует частоте кадров в стандарте PAL. Для кодирования сигнала цветности используется частотная модуляция. Эта система также дает более высокое разрешение цвета, чем NTSC стандарт. Существуют две модификации SECAM стандарта - горизонтальный SECAM и вертикальный SECAM.

Так как частота кадров и количество строк соответствует стандарту PAL, есть возможность просматривать видео в формате SECAM на видеоплеере PAL стандарта (и наоборот), но в монохромном варианте.

Видеоформаты

Для хранения и воспроизведения видеоизображения применяются специальные устройства, называемые видеомагнитофонами. В зависимости от конструкции видеомагнитофонов видеоизображение хранится в различных видеоформатах.

Видеоформаты, прежде всего, классифицируются по ширине магнитной пленки. Все видеомагнитофонамы используют так называемые бобинные форматы (reel-to-reel formats), поскольку запись/считывание основаны на перемещении магнитной ленты вблизи магнитной головки видеомагнитофона.

Физический принцип действия видеомагнитофона основан на эффекте намагничивания. В момент записи изображения магнитное поле, создаваемое магнитной головкой, ориентирует магнитные элементы на ленте. При воспроизведении магнитная головка воспринимает магнитное поле, создаваемое магнитной лентой, и специальная электронная схема соответствующим образом формирует видеосигнал. Следует отметить недостатки такой системы записи/воспроизведения. Во-первых, система очень чувствительна к пыли и загрязнению. Во-вторых, с годами основа магнитной ленты стареет, что приводит к частичному осыпанию магнитного слоя и соответственному ухудшению изображения. В-третьих, в процессе эксплуатации видеолента может порваться, помяться, растянуться и т.д. Однако в настоящее время такой принцип хранения видеоизображения является доминирующим.

На качество воспроизводимого изображения влияет множество различных факторов. Основным из них является размер видеопленки и скорость протяжки ленты. В зависимости от конструктивных особенностей и предназначения видеомагнитофонов, применяются различные схемы записи. Например, бытовые магнитофоны используют видеокассету закрытого типа (что защищает ленту от пыли) с шириной ленты 1/2 дюйма. Такая же по размеру лента, но с другим магнитным покрытием используется в профессиональных видеомагнитофонах, работающих в стандартах S-VHS и Betacam.

В профессиональном телевизионном оборудовании используются не видеокассеты, а специальные бабины с видеолентой шириной 3/4 дюйма. Такая ширина ленты позволяет записывать видеоизображение более высокого качества с минимальными потерями при перезаписи и воспроизведении.

VHS (Video Home System) формат объединяет видеодорожку, предназначенную для записи видеоизображения в форме композитного сигнала, и звуковую дорожку для записи стереозвука стандарта Hi-Fi (High-Fidelity). Разрешение кадра VHS изображения составляет 240 строк, что позволяет записывать видеоматериал с удовлетворительным качеством. В связи с этим VHS стал массовым форматом при распространении видеопродукции для просмотра в домашних условиях на обычных телевизионных приемниках, но не был рекомендован для записи и обработки видеопродукции.

В 1987 году фирма JVC представила новый формат S-VHS (Super Video Home System). Он использовал такие же по размеру кассеты, как и VHS, но с лучшим магнитным слоем пленки. Важным отличием S-VHS является тот факт, что для получения большего разрешения кадра (в S-VHS 400 строк) используется видеосигнал формата Y/C, где яркость и цветность хранятся как отдельные сигналы. В связи с этим S-VHS дает улучшенное отношение основного сигнала к помехам в сигнале яркости и цветности. Этот стандарт также предусматривает запись Hi-Fi звука.

Представленный в 1985 году в качестве совместного стандарта нескольких производителей, формат 8 мм использует пленку самой маленькой ширины и самую маленькую кассету, что сделало его очень популярным для легковесных портативных камер (8 мм = 1/4" или 0.25 дюйма). Относительно небольшая поверхность компенсируется использованием пленки со специальным "металлическим" покрытием, позволяющим записывать сигналы высокого уровня. Конструкция видеоустройств формата 8 мм такова, что пленка огибает магнитную головку примерно на 30 градусов больше, чем в других вариантах. Это обеспечивает качество звукового сигнала аудио компакт-дисков.

В 1989 году улучшенной модификацией формата 8 мм был представлен формат Hi8. Диапазон несущей частоты яркости был расширен до 2 МГц, в то время как в формате 8 мм ширина диапазона - 1,2 МГц. В результате разрешение кадра изображения повысилось и стало более 400 строк, кроме того, улучшилось качество цветопередачи. В формате Hi8 впервые был применен прием, который достаточно давно применялся в профессиональной видеоаппаратуре. Совместно с видеоизображением и аудиосопровождением на ленту могут записываться синхрoнизирующие импульсы (тайм-код). При монтаже видеофрагментов синхронизация по тайм-коду позволяет осуществлять более качественный монтаж.

Формат Betacam SP (Superior Performance) является вторым поколением формата Betacam, разработанного фирмой Sony. Этот формат стал достаточно популярным в области промышленного и конечного телевещания, поскольку он использует форму компонентного видеосигнала на 1/2" пленке. Betacam SP может использовать как стандартные металлооксидные пленки, так и пленки с "металлическим" покрытием, что улучшает качество изображения.

3.7.6. Цифровое видео



Недостатки, присущие аналоговому способу воспроизведения видео, в конце концов привели к разработке цифрового видеоформата. На смену аналоговому видео пришло цифровое.

В области профессионального видео применяется несколько цифровых видеоформатов: D1, D2, Digital BetaCam и др. В отличие от аналогового видео, качество которого падает при копировании, каждая копия цифрового видео идентична оригиналу. Хотя современный видеоряд базируется на цифровой основе, практически все цифровые видеоформаты до сих пор в качестве носителя исходного сигнала используют пленку с последовательным доступом. Поэтому большинству профессионалов в области видео все еще привычней работать с пленкой, чем с компьютером. Конечно, пленка в качестве источника данных пока еще остается более предпочтительной, чем жесткий диск компьютера, поскольку вмещает значительно больший объем данных.

Но зато для цифрового видеомонтажа использование компьютеров дает ряд существенных преимуществ: не только обеспечивает прямой доступ к любому видеофрагменту (что невозможно при работе с пленкой, поскольку к необходимым участкам можно добраться лишь последовательно просматривая видеоматериал), но и предполагает широкие возможности обработки изображения (редактирование, сжатие). Это достаточно веские причины для перехода видеопроизводства с традиционного оборудования на компьютерное.

Компьютерное цифровое видео представляет собой последовательность цифровых изображений и связанный с ними звук. Элементы видео хранятся в цифровом формате. Существует множество способов захвата, хранения и воспроизведения видео на компьютере. С появлением компьютерного цифрового видео стали стихийно возникать самые разнообразные форматы представления видеоданных, что поначалу привело к некоторой путанице и вызвало проблемы совместимости. Однако в последние годы благодаря усилиям Международной организации по стандартизации (ISO - International Standards Organisation) выработаны единые стандарты на форматы видеоданных.

Для создания цифрового представления видеоизображения применяется следующая процедура. Аналоговые сигналы от видеоисточников, например, с камеры, преобразуются перед оцифровкой в цветовую систему YUV или в аналогичное цветовое представление. Затем полученный видеосигнал преобразуется в цифровую форму при помощи специального устройства, называемого "аналого-цифровой преобразователь" (АЦП, ADC - Analog-to-Digital Converter). Результат этого преобразования представляет собой последовательность байтов, кодирующих цвет каждого пикселя в кадре изображения. Объединение информации о каждом кадре формирует поток данных, полностью описывающих видеофрагмент. Видео-изображение в таком представлении можно в дальнейшем обрабатывать, хранить или передавать неограниченное число раз.

Для того чтобы просмотреть цифровое видеоизображение, необходимо преобразовать цифровую информацию обратно в аналоговую форму. Данную процедуру осуществляет цифро-аналоговый преобразователь (ЦАП, DAC - Digital-to-Analog Converter). ЦАП формирует необходимый аналоговый видеосигнал, который воспринимается видеомонитором или телевизором, что позволяет осуществить просмотр видеофрагмента.

3.7.7. Форматы цифрового видео


  Motion-JPEG

Стандарт компрессии JPEG был разработан объединенной группой экспертов по фотографии (JPEG - Joint Photographic Expert Group) международной организации стандартов (ISO). Как ясно уже из названия, схема компрессии была разработана для неподвижных изображений. Так как телевидение, в сущности, и есть последовательность неподвижных изображений, то JPEG кодирование может применяться и для компрессии видеоизображений. Иногда этот стандарт называют "динамический" JPEG.

В основе схемы компрессии JPEG лежит дискретное косинусоидальное преобразование (DCT). К преимуществам JPEG относится тот факт, что каждый кадр сжимается независимо от остальных и для восстановления исходного изображения не нужно задействовать информацию из соседних кадров. Такое построение сжатых данных позволяет осуществлять произвольный доступ, коммутацию и монтаж видеофрагментов проще, чем при использовании других методов кодирования. Недостатком данного формата является относительно меньшая степень кодирования JPEG по сравнению с другими системами. Например, в системе с JPEG может понадобиться 20 Мбит для записи одной секунды видеоизображения "вещательного" качества, с разрешением 525/625 строк, что слишком много для компьютерной обработки.

  AVI (Audio Video Interleave).

Разработанный фирмой Microsoft метод сжатия, записи и воспроизведения движущих изображений (Live Video) и звука на компьютере с использованием только программных средств. Файлы, созданные с использованием этого метода, имеют расширение AVI.

AVI может иметь или не иметь звуковые дорожки. При создании AVI файлов, включающих звуковое сопровождение, важным является правильная синхронизация звука с видеоизображением. Для этого используется технология чередования видеокадров и звука, которой, собственно, и определяется аббревиатура AVI (Audio Video Interleaved). Разные по типу видео и аудиоданные записываются в один файл на диске следующим образом: все информационные потоки разбиваются на множество равных частей (chunks) и затем записываются в один файл друг за другом по очереди. Например, сначала записывается заголовок; затем - 1-я часть видео; затем - 1-я часть звука; затем - 2-я часть видео; затем - 2-я часть звука и т.д.

Microsoft Video for Windows использует четыре основных кодека для сжатия AVI файлов цифрового видео - Microsoft Video 1, RLE compression, Cinepak Codec by SuperMatch и Intel Indeo Video R3.2 (INDEO - INtel viDEO).

Кодек Microsoft Video 1 предназначен для сжатия реалистических видеофрагментов и рассчитан на разрешение цвета не более, чем 16 бит.

Кодек RLE compression (run-length encoding) предназначен для сжатия в AVI анимаций.

Cinepak Codec by SuperMatch и Intel Indeo Video R3.2 используют 24-битное разрешение цвета и имеют достаточно большую степень сжатия - порядка 10:1.

QuickTime

QuickTime - стандарт, архитектура программного обеспечения, которая позволяет создавать, объединять и публиковать все типы цифровых мультимедиа данных. Используя QuickTime, программные приложения могут легко работать с широким кругом форматов файлов и кодеков.

QuickTime включает три основополагающих элемента - QuickTime видео формат (Movie file format), слой абстрактного носителя (Media Abstraction Layer) и богатый набор встроенных медиа - служб.

QuickTime видеоформат хорош тем, что он платформенно независим, открыт для расширения. В связи с названными преимуществами, поддерживается многими производителями. QuickTime видео также поддерживается на платформе Windows.

QuickTime слой абстрактного носителя определяет исчерпывающий набор сервисных функций покрывающих все аспекты создания, редактирования и воспроизведения цифрового материала.

Среди них:

· синхронизация по времени;

· компрессия и декомпрессия аудио- и видеоданных;

· преобразование форматов, масштабирование, смешивание и транскодирование;

· аудио- и видеоэффекты и переходы;

· синхронизация чтения и записи;

· захват данных;

· импорт и экспорт данных;

QuickTime поддерживает широкий набор типов мультимедиа данных (видео, аудио, текст, временной код, музыкальный MIDI - интерфейс, спрайты, анимацию и др.).

Формат QuickTime имеет несколько отличных друг от друга кодеков - Video, Animation, Cinepak, Graphics, Photo-JPEG и другие. Наиболее качественными являются кодеки Cinepak и Video.

MPEG

В январе 1992 года группа экспертов в области движущихся изображений MPEG (Motion Picture Experts Group) представила первую часть стандарта для сжатия цифрового видео и звука - MPEG phase 1, или просто MPEG-1 (ISO 11172). Стандарт определяет методы компрессии и воспроизведения видео- и аудиоданных. Комитет MPEG также определил ряд других форматов для сжатого видео- и аудиоматериала. Форматы MPEG различаются по качеству результатов и скорости передачи данных:

MPEG-1: оригинальный формат для хранения и воспроизведения видео- и аудиоданных на мультимедиа носителях данных. Потенциально поддерживает телевизионное качество видео. Однако, при скорости передачи данных в диапазоне 150 - 255 Кбайт/сек. качество сопоставимо с видеозаписью VHS (разрешение 352 х 228 (PAL) или 320 x 240 (NTSC) при частоте 25 или 30 кадров в секунду соответственно).

MPEG-2: более новый стандарт (утвержден в ноябре 1994 г.). Разработан как дополнение к стандарту MPEG-1. Поддерживает передачу высококачественного видео по высокоскоростным цифровым каналам. Интенсивность потока данных от до 2 до 10 Мбайт/сек. Разрешение 720х480 и 1280х720, частота 60 кадров в секунду со звуковыми данными CD-качества. Подходит для всех стандартов телевидения и даже систем телевидения высокой точности (High Definition Television). Используется при записи DVD дисков.

MPEG-4: предназначен для передачи видео и аудиоданных по низкоскоростным линиям. Этот формат расчитан для применения в системах видеотелефонии, мультимедийной электронной почте, электронных информационных изданиях и т.п.. Базируется на формате файлов QuickTime. MPEG-4, версия 1 одобрен в октябре 1998 г. Стандарт ориентирован на разрешение 174х144 пиксела при 10 кадрах в секунду и позволяет передавать данные со скоростью от 4800 до 64000 бит/сек. Формат MPEG-4 версия 2 должен быть одобрен в декабре 1999 г.

MPEG-7: стандарт представления содержания для информационного поиска.

 MPEG-1 и MPEG-2 признаны международными стандартами для сжатия видео.

  Технология MPEG использует поточное сжатие видео, при котором обрабатывается не каждый кадр по отдельности (как это происходит при сжатии видео с помощью алгоритмов Motion-JPEG), а анализируется динамика изменений видеофрагментов и устраняются избыточные данные. Поскольку в большинстве моментов фон изображения остается достаточно стабильным, а действие происходит только на переднем плане, алгоритм MPEG начинает сжатие с создания исходного (ключевого) кадра. Играя роль опорных при восстановлении остальных изображений, они размещаются последовательно через каждые 10-15 кадров. Только некоторые фрагменты изображений, которые находятся между ними, претерпевают изменения, и именно эта разница сохраняется при сжатии. Таким образом, MPEG-последовательность содержит три типа изображений:

Intro (I) - исходные кадры, содержащие основное изображение;

Predicted (P) (предсказуемые) кадры и Bi-directional Interpolated (В) (двунаправленные) кадры сжаты с использованием предыстории, причем В-кадры используют как в предыдущих так и в последующих кадрах.

Изображения объединяются в группы (GOP - group of pictures), представляют собой минимальный набор повторяемых последовательных изображений.

Рекомендуемая MPEG последовательность: I B B P B B P B B P ...

Отдельные изображения состоят из структурных единиц - макроблоков, соответствующих участку изображения размером 16Х16 пикселов. Компьютер анализирует изображения и ищет идентичные или похожие макроблоки, сравнивая базовые и последующие кадры. В результате сохраняется только данные о различиях между кадрами, называемые вектором смещения (vector movement code) .

Макроблоки, которые не претерпевают изменений, игнорируются, так что количество данных для реального сжатия и хранения существенно снижаются. Для повышения устойчивости процесса восстановления изображения к возможным ошибкам передачи данных последовательные макроблоки объединяют в независимые друг от друга разделы (slices). В свою очередь, каждый макроблок состоит из шести блоков, четыре из которых несут информацию о яркости, а два определяют цветовые компоненты. Блоки являются базовыми структурным единицами, над которыми осуществляются основные операции кодирования, в том числе выполняется и дискретное косинусоидальное преобразование (DCT - Discrete Cosine Transform). В результате при использовании MPEG-технологии можно достигнуть рабочего коэффициента более чем 200:1, хотя это приводит к некоторой потере качества.