Представление изображений в ис
Вид материала | Документы |
Secam b,g,h |
- Белорусский государственный университет применение информационных технологий при анализе, 187.23kb.
- Некоторые методы распознавания изображений, 261.7kb.
- Представление предметной области «Анализ изображений» в виде специализированного тезауруса, 329.52kb.
- Обработка и передача изображений, 213.76kb.
- Секция 6 А. В. Ковальчук, А. Е. Иванов, В. Г. Яхно, 89.91kb.
- Особенности ранних антропоморфных изображений на археологических памятниках V-II тысячелетия, 187.57kb.
- Обработка и передача изображений, 243.48kb.
- Примерная рабочая программа по дисциплине «Компьютерная обработка изображений» Факультет:, 75.51kb.
- Процедуры графики в языке Turbo Pascal, 62.62kb.
- Суворова Ирина Викторовна план-конспект, 55.68kb.
NTSC (National Television Systems Committee):
Линии/Развертка | 525(~487 видимых ~240 на поле)/60 |
Частота по горизонтали | 15.734 kHz |
Частота по вертикали | 60 Hz (60 half frames per second) |
Частота несущей цветового компонента | 3.579545 mHz |
Полоса пропускания видео | 4.2 mHz |
Частота несущей звука | 4.5 mHz |
PAL:
Система | PAL B,G,H | PAL I | PAL D | PAL N | PAL M |
Линии/Развертка | 625(~540 видимо) /50 | 625 (~ 288 на поле ) /50 | 625/50 | 625/50 | 525/60 |
Частота по горизонтали | 15.625 kHz | 15.625 kHz | 15.625 kHz | 15.625 kHz | 15.750 kHz |
Частота по вертикали | 50 Hz | 50 Hz | 50 Hz | 50 Hz | 60 Hz |
Частота несущей цветового компонента | 4.433618 MHz | 4.433618 MHz | 4.433618 MHz | 3.582056 MHz | 3.575611 MHz |
Полоса пропускания видео | 5.0 MHz | 5.5 MHz | 6.0 MHz | 4.2 MHz | 4.2 MHz |
Частота несущей звука | 5.5 MHz | 6.0 MHz | 6.5 MHz | 4.5 MHz | 4.5 MHz |
SECAM:
Система | SECAM B,G,H | SECAM D,K,K1,L |
Линии/Развертка | 625/50 (~540 видимо) | (~ 288 на поле ) 625/50 |
Частота по горизонтали | 15.625 kHz | 15.625 kHz |
Частота по вертикали | 50 Hz | 50 Hz |
Полоса пропускания видео | 5.0 MHz | 6.0 MHz |
Частота несущей звука | 5.5 MHz | 6.5 MHz |
- Основные понятия сжатия видео.
Определимся с основными понятиями, которые используются при сжатии видео. Видеопоток характеризуется разрешением, частотой кадров и системой представления цветов. Из телевизионных стандартов пришли разрешения в 720х576 и 640х480, и частоты в 25 (стандарты PAL или SECAM) и 30 (стандарт NTSC) кадров в секунду. Для низких разрешений существуют специальные названия CIF - Common Interchange Format, равный 352х288 и QCIF - Quartered Common Interchange Format, равный 176х144. Поскольку CIF и QCIF ориентированы на крайне небольшие потоки, то с ними работают на частотах от 5 до 30 кадров в секунду.
Требования приложений к алгоритму: Для алгоритмов сжатия видео характерны большинство тех же требований приложений, которые предъявляются к алгоритмам сжатия графики, однако есть и определенная специфика: произвольный доступ - подразумевает возможность найти и показать любой кадр за ограниченное время. Обеспечивается наличием в потоке данных так называемых точек входа - кадров, сжатых независимо (т.е. как обычное статическое изображение). Приемлемым временем поиска произвольного кадра считается 1/2 секунды. Быстрый поиск вперед/назад - подразумевает быстрый показ кадров, не следующих друг за другом в исходном потоке. Требует наличия дополнительной информации в потоке. Эта возможность активно используется всевозможными проигрывателями. Показ кадров фильма в обратном направлении. Редко требуется в приложениях. При жестких ограничениях на время показа очередного кадра выполнение этого требования может резко уменьшить степень сжатия. Аудио-визуальная синхронизация - самое серьезное требование. Данные, необходимые для того, чтобы добиться синхронности аудио и видео дорожек, существенно увеличивают размер фильма. Для видеосистемы это означает, что, если мы не успеваем достать и показать в нужный момент времени некий кадр, то мы должны уметь корректно показать, например, кадр, следующий за ним. Если мы показываем фильм без звука, то можно позволить себе чуть более медленный или более быстрый показ. Во времена сравнительно несовершенного немого кино кадры шли настолько неравномерно, насколько неравномерно крутил ручку камеры оператор. Показ без звука фильма, снятого столь несовершенными методами, воспринимается нормально даже при условии, что частота показываемых кадров постоянна (и герои фильма то передвигаются карикатурно быстро, то медленно). Однако смотреть фильм (например, боевик), в котором видеосистема не успевает за звуком - становится мучением. Устойчивость к ошибкам - требование, обусловленное тем, что большинство каналов связи ненадежны. Испорченное помехой изображение должно быстро восстанавливаться. Требование достаточно легко удовлетворяется необходимым числом независимых кадров в потоке. При этом также уменьшается степень сжатия, так как на экране 2-3 секунды (50-75 кадров) может быть одно и то же изображение, но мы будем вынуждены нагружать поток независимыми кадрами. Время кодирования/декодирования. Во многих системах (например, видеотелефонах) общая задержка на кодирование-передачу-декодирование должна составлять не более 150 мс. Кроме того, в приложениях, где необходимо редактирование, нормальная интерактивная работа невозможна, если время реакции системы составляет более 1 секунды.
Редактируемость. Под редактируемостью понимается возможность изменять все кадры так же легко, как если бы они были записаны независимо.
Масштабируемость - простота реализации концепции "видео в окне". Мы должны уметь быстро изменять высоту и ширину изображения в пикселах. Масштабирование способно породить неприятные эффекты в алгоритмах основанных на ДКП (дискретном косинусном преобразовании). Корректно реализовать эту возможность для MPEG на данный момент можно, пожалуй, лишь при достаточно сложных аппаратных реализациях, только тогда алгоритмы масштабирования не будут существенно увеличивать время декодирования. Интересно, что масштабирование достаточно легко осуществляется в так называемых фрактальных алгоритмах. В них, даже при увеличении изображения в несколько раз, оно не распадается на квадраты, т.е. отсутствует эффект "зернистости". Если необходимо уменьшать изображение (что, хоть и редко, но бывает нужно), то с такой задачей хорошо справляются алгоритмы, основанные на wavelet преобразовании (см. описание JPEG-2000). Небольшая стоимость аппаратной реализации. При разработке хотя бы приблизительно должна оцениваться и учитываться конечная стоимость. Если эта стоимость велика, то даже при использовании алгоритма в международных стандартах, производители будут предлагать свои, более конкурентоспособные, алгоритмы и решения. На практике это требование означает, что алгоритм должен реализовываться небольшим набором микросхем.