stat
 
 
 
 
 
 
 
  TBS - Журнал Цифровое Видео    
Скидки
Разделы форума
Системы нелинейного
монтажа
Общие вопросы
Видеооборудование
Аудиооборудование
Светофильтры
Осветительное
оборудование
Барахолка
Поиск по архиву

Режим: "и" "или"
Избранное
Архив журнала
Цифровое Видео
#4 #5 #6
  #1 #2 #3
#4 #5 #6
  #1 #2 #3
#4 #5 #6
  #1 #2 #3
#4 #5 #6
  #1 #2 #3
#4 #5 #6
  #1 #2 #3

Как сделать качественное Web-видео

Бен Уэггонер


      Используя предлагаемые приемы, вы можете быть уверены, что ваше потоковое Web-видео будет выглядеть так хорошо, как только возможно.

      Во времена, когда повсеместно были распространены модемы на 14,4 K, Web-видео предполагало многочасовую загрузку ради 30-секундного клипа сомнительного качества. Появившиеся несколько лет назад технологии потокового видео позволили выйти из этого тупика, но качество изображения даже в простых сценах типа "говорящая голова" оставалось низким. Сегодня же происходят интересные вещи. Модемы на 56 K становятся практически стандартными, а кабельные модемы и DSL обеспечивают широкополосный доступ все большему числу пользователей. QuickTime 4.0 компании Apple, RealSystem G2 компании RealNetworks и Windows Media компании Microsoft - три крупные, конкурирующие и все более совершенствующиеся технологии доставки Web-видео. Так как нужные каналы и инструменты теперь уже существуют, давайте поговорим о том, как делать высококачественное потоковое Web-видео, передаваемое по запросу. Мы не будем рассматривать загружаемые файлы или кодирование "живого" видео, а сосредоточимся на создании видео, предназначенного для передачи с видеосервера.
      Заветная цель создателя Web-видео -прозрачность. Мы хотим сделать технологии компрессии и доставки прозрачными, такими, чтобы люди, которые смотрят видео, не чувствовали, что они смотрят его на компьютере, а просто смотрели. Учитывая, что большинству людей приходится "впитывать" океан видео через тоненькую соломинку, достичь прозрачности удается редко. Так что мы стараемся быть настолько прозрачными, насколько это возможно. Мой любимый критерий следующий: "Web-видео является приемлемым, если смешной фильм остается столь же смешным на Web, как и на ТВ". Прежде чем перейти к делу, я, по совету Стивена Брилла, должен сделать одно признание. Я недавно поступил на работу в фирму Terran Interactive, являющуюся разработчиком системы Media Cleaner Pro, в качестве директора службы консультаций. Я сделал это потому, что очень высоко оцениваю эту систему. Я твердо верю, что все мои похвалы в ее адрес совершенно справедливы, но вы должны знать, где я получаю зарплату.

Как работает Web-видео

ДО
ПОСЛЕ

Рис. 1. Черное в видеосигнале не имеет естественного соответствия черному на экране компьютера, так что при сбрасывании видео на черную Web-страницу может возникнуть значительный контраст. Небольшая регулировка контраста вкупе с использованием фильтра Black Restore из Media Cleaner позволяет привести в соответствие оба черных цвета

      Говоря простым языком, поток компрессированного видео состоит из последовательности кадров изображений и последовательности отсчетов звука. Видео разбивается на два типа кадров -ключевые кадры и дельта-кадры. Ключевые кадры являются полными изображениями. Дельта-кадры содержат только ту визуальную информацию, которая отличается от предыдущего кадра. Ключевые кадры больше дельта-кадров (по количеству килобайтов), но произвольный доступ возможен только к ним. Поток аудиоданных - это последовательность пакетов компрессированного звука в соответствующем порядке. Передача потоков через Интернет вносит дополнительную сложность. Вместо стандартного протокола TCP (Transmission Control Protocol) потоковое видео обычно использует UDP (Universal Datagram Protocol). Протокол TCP хорош тогда, когда критически важна целостность данных, потому что сервер автоматически контролирует получение адресатом каждого пакета. Если пакет не дошел, он посылается заново. Но такой контроль сильно отражается на скорости. Доставка всей информации до последнего байта гораздо менее важна при передаче видео, чем, скажем, электронной почты: в первом случае может слегка дернуться звук, а во втором - пропасть кусок сообщения. Фактическая скорость передачи важнее строгой целостности данных. Протокол UDP обеспечивает более быструю по сравнению с TCP доставку информации конечному пользователю, и его низкие накладные расходы позволяют серверу поддерживать гораздо больше потоков при заданной нагрузке процессора. Но возможность потери пакетов означает, что технологии Web-видео должны предусматривать какой-то способ замещения пропавших данных. Все кодеки для Web-видео используют сложные методы компрессии с тем, чтобы пересылать через модем нечто, что можно распознать как поток видео. Некомпрессированное видео с полным разрешением и полной передачей движения требует скорости передачи данных около 21 Мбайт/с. Модем на 28,8 K обеспечивает меньше 1/1000 этой скорости. Кажется невозможным? Вот почему специалистам по компрессии так хорошо платят.

Грязь на входе - грязь на выходе

      Эта старая аксиома применима и к Web-видео. Когда вы сжимаете видео, вы просто подаете последовательность растровых изображений на вход некоторого алгоритма компрессии. Чем лучше исходные изображения, тем лучше будет и результат. Высокое качество исходного видео очень важно для качества компрессированного. Рассуждения типа: "Это всего лишь Web-видео - при маленьком окошке качество источника роли не играет", - приводят к плохому Web-видео. Даже если его разрешение невелико, Web-видео вполне в состоянии извлечь пользу из точной цветопередачи, высокого контраста и низкого уровня шума, свойственных профессиональной видеоаппаратуре.
      Лучший способ получить хорошее компрессированное видео - создавать такое видео, которое хорошо сжимается. Несколько простых (и ряд более сложных) советов помогут вам оптимизировать исходный материал для компрессии. Найдите в своем материале все то, что напоминает вам MTV, и уберите его. Быстрая смена сцены, съемки ручной камерой, сложные текстовые эффекты, стильные переходы, вращающиеся источники света, включенные телевизоры - все это буквально пожирает полосу пропускания. Вы получите гораздо лучший результат, если сделаете все как можно более спокойным: неподвижные камеры, немного монтажа, прямые переходы вместо наплывов, приглушенные цвета, плавные движения. Кто-то скажет, что эти ограничения могут сделать материал очень скучным. Но я считаю, что статичные, но четкие, узнаваемые кадры гораздо интереснее, чем красивый наплыв, превратившийся в мешанину точек при передаче по модему 28,8 K. Один умный человек как-то сказал, что качество - это "пригодность для использования". Красивый ролик, который нельзя хорошо воспроизвести на Web, превращается в низкокачественный, независимо от того, насколько хорошо он смотрится на вашей системе нелинейного монтажа. Общее правило состоит в том, чтобы каждый кадр был как можно больше похож на предыдущий. Тогда дельта-кадры получаются меньше, и суммарная требуемая скорость передачи данных снижается. А если речь идет о передаче по каналу с фиксированной полосой пропускания, то дельта-кадры будут точнее отображать исходное видео.

QuickTime 4.0

     QuickTime — ветеран цифрового видео. Его первая версия появилась еще в 1991 г., когда никто и не думал о потоковом Web-видео. Первоначальный замысел, архитектура и конструкция системы были блестящими, универсальными и гибкими. QuickTime постоянно развивается, предлагая отличные технические решения во все новых областях. В прошлогодней версии QuickTime 3.0 была достигнута полная эквивалентность вариантов для Windows и Macintosh, а также реализована поддержка загружаемого Web-видео с использованием новых кодеков, рассчитанных на низкую пропускную способность. В версии 4.0, выпущенной этой весной, добавлена поддержка настоящего потокового видео. Для QuickTime основным кодеком Web-видео является Sorenson Video фирмы Sorenson Vision ( www.s-vision.com).
     Версия QuickTime 4.0 включает базовый вариант алгоритма компрессии, более чем адекватный для CD-ROM, широкополосных каналов и загружаемых клипов. Однако в «Издании для разработчика» (Developer Edition, $499) значительно усовершенствованы средства подготовки видео, рассчитанного на передачу через модем, а также все алгоритмы кодировки фирмы Sorenson. В этом издании гораздо лучше организовано управление скоростью передачи данных, предусмотрена масштабируемость воспроизведения, позволяющая иметь один файл, который будет хорошо воспроизводиться на компьютерах с самым разным быстродействием, имеется «сглаживающий» фильтр, который делает изображение менее «блочным», ускорена работа модулей кодировки.
     Основные кодеки Web-аудио в QuickTime — Music Codec 2 фирмы QDesign для музыки и PureVoice фирмы Qualcomm ( http://eudora.qualcomm.com/purevoice/) для речи. В PureVoice предусмотрены две разные скорости компрессии звука. Отметим, что в потоковой среде PureVoice дает гораздо более низкие конечные скорости передачи данных — скорости 9:1 и 19:1 превращаются при потоковой передаче примерно в 15:1 и 30:1 соответственно.
     Как и у изделий фирмы Sorenson, в бесплатной версии QuickTime имеется встроенный кодировщик фирмы QDesign ( www.qdesign.com), но «Профессиональное издание» (Professional Edition, $399) обеспечивает более высокое качество звука, чем встроенный кодировщик, при всех скоростях передачи, особенно низких, и настоятельно рекомендуется для Web-аудио.
     Хотя средства кодировки для QuickTime стоят дороже, чем для других технологий, но Apple всего за $499 предлагает свой сервер с поддержкой неограниченного количества потоков. Кроме того, Apple предоставляет независимым разработчикам исходные коды для того, чтобы они вводили новые функции и переносили программу на другие платформы. Эти усилия дают определенные результаты. Уже существует версия для Linux, а к концу года можно будет получить бесплатную версию QuickTime Stream Server практически для любой платформы. Существуют проигрыватели QuickTime для Mac и Win32. Есть также программы третьих фирм для UNIX и других ОС, которые могут воспроизводить некоторые файлы QuickTime, но ни одна из них не поддерживает потоковое видео. Дополнительную информацию можно найти по адресу: www.apple.com/quicktime.


Размытость изображений движущихся объектов



Рис. 2. Как бы ни были настроены эффекты движения, этот неподвижный первый кадр будет всегда выглядеть одинаково
Рис. 3. Без размытости за счет движения движущийся объект после рендеринга выглядит так
Рис. 4. Здесь размытость присутствует. Обратите внимание: движущийся объект выглядит нерезким и поэтому легко поддается компрессии, тогда как неподвижный фон сохраняет резкость
Рис. 5. Тот же кадр в видеозаписи с чересстрочной разверткой. Обратите внимание: строки сдвинуты по горизонтали, хотя движение происходит по диагонали

      На полосу пропускания сильнее всего влияют два фактора: сложность картинки и движение. К счастью, небольшая размытость за счет движения облегчает компрессию сложных движущихся изображений. При быстром движении объекта его изображение размывается и становится менее сложным. При этом изображение неподвижного объекта может быть вполне резким. Так как все снятое на пленку содержит много движения, размытость возникает как артефакт, воспринимаемый человеческим глазом. На самом деле, этот эффект довольно приятен и как бы кинематографичен. Видеокадры с размытыми движущимися объектами смотрятся явно лучше, чем с неподвижными.
      Размытость возникает в камере благодаря съемке с конечной выдержкой. Чем дольше затвор остается открытым, тем больший период движения охватывается кадром и тем сильнее будет размыто изображение. Если ваш источник - кинопленка, очень хорошо. Практически всегда киносъемка ведется на скорости 24 кадра/с при выдержке 1/48. Если вы снимаете видео, нет проблем. Любая хорошая видеокамера позволяет регулировать выдержку по меньшей мере до 1/60 с - я рекомендую именно эту величину. Тогда ваше видео будет иметь более "киношный" вид и меньше зернистости при слабом и умеренном освещении, а это тоже содействует хорошей компрессии. Что касается анимационных и других синтезированных изображений, то многие программные пакеты позволяют задавать время экспозиции или каким-нибудь другим способом создавать размытость движущихся объектов. Если вы комбинируете анимацию с кино- или видеоматериалами, то настройки, определяющие степень размытости, должны согласовываться между собой. В чисто анимационных проектах я предпочитаю устанавливать выдержку равной половине длительности кадра. Если я делаю рендеринг под 30 кадров/с, то экспозиция в 1/60 с, как правило, дает хорошие результаты. Это соответствует киносъемке, где отношение длительности кадра к экспозиции тоже равно 2:1, и смотрится вполне естественно.
      Некоторые программы просят пользователя указать, сколько временных точек (samples) он хочет использовать. При рендеринге каждого кадра такие программы формируют несколько кадров для разных моментов периода выдержки и затем объединяют их вместе. Если задано меньше точек, чем следует, то иногда в анимации появляются заметные полосы. Эти полосы плохо сжимаются и могут привести к потере тех плюсов, которую дает размытость изображения. Следите за тем, чтобы число точек было достаточным и полос не возникало. Чем быстрее движение, тем больше требуется точек. Если вы работаете с анимированными титрами или эффектами, то размытость движущихся объектов нужно создавать и на стадии постпроизводства. Насколько хорошо вы сможете это сделать, зависит от той программы, которой вы пользуетесь. Например, в After Effects средства управления эффектами движения очень развиты, тогда как в Premiere их вообще нет. Отметим, что в After Effects размытость за счет движения задается углом поворота затвора, а не временем экспозиции. Это физическое представление вращающегося затвора в съемочной камере. По умолчанию в AE эта величина равна 180, что согласуется с ее значением для съемочных камер и соответствует времени экспозиции, равному половине периода следования кадров.
      Эффекты движения могут сильно увеличить время, необходимое для рендеринга анимации или спецэффектов. Как правило, в процессе разработки проекта лучше всего их не использовать или использовать как можно меньше, оставляя их до этапа окончательного чистового рендеринга.
      Оцифровку видео следует выполнять с максимально высоким качеством. Я рекомендую форматы SDI, компонентный аналог или DV/1394, если это возможно. Хорошо снятое S-Video тоже может подойти. В любом случае избегайте пользоваться аппаратурой с композитным сигналом. Web-видео удивительно хорошо передает шумы композитного сигнала в процессе его компрессии. Грязь на входе - грязь на выходе.

Предобработка для Web-видео

      Хотя полоса пропускания Web - всего лишь тоненькая соломинка, вставленная в пожарный шланг вещательного видео, Web-видео является гораздо более гибкой технологией, чем вещательное видео. Эта гибкость позволяет использовать ряд творческих приемов для частичного преодоления ограничений по полосе пропускания.

Размеры и форма кадра

      Одна из замечательных особенностей Web-видео - его способность выйти за рамки принятого в телевидении аспектного отношения (соотношения сторон кадра) 4:3. Если вы готовите для вещания через Web фильм, снятый в широкоэкранном формате, то можете представить его в исходной форме. Результат будет вполне впечатляющим. Если зрительская платформа, на которую вы рассчитываете, позволяет работать с окном размером 192 x 144 пикселя, вы можете перераспределить эти пиксели и показать фильм в формате 336 x 80. Даже если ваш интерфейс имеет фиксированную ширину, как, например, в случае Web-страницы с фреймами, вы все же можете обрезать черные полосы вверху и внизу экрана и обойтись меньшим изображением. Эти пустые области, если их не убрать, съедают значительную часть полосы пропускания и процессорной мощности. Кроме того, трудно согласовать уровни черного в этих полосах и в остальной части интерфейса. Каждый пиксель должен нести информацию - уберите все те, которые ее не несут. Не обязательно ограничиваться кадрами, вытянутыми по горизонтали. Допустим, вы делаете музыкальный фильм об альпинизме или научно-популярный об истории лестниц. Тогда узкое и высокое окно изображения, возможно, будет наилучшим способом использования доступной полосы про пускания и получения уникального зрелищного эффекта.
      Но эта гибкость выбора формы кадра не безгранична. Разные видеокодеки могут требовать разного разрешения. Кодеки видеоконференций, например, стандарта H.263 обычно требуют, чтобы размер каждой стороны был кратен 16. В связи с некоторыми особенностями организации передачи информации на экран из графических плат обычно рекомендуют, какой бы кодек ни применялся, делать размер каждой стороны кратным хотя бы четырем.


RealSystem G2

     QuickTime — старейшая технология, но RealSystem — старейшая система, основанная на потоках в Интернете. Первая версия RealAudio была революционным продуктом, положившим начало рынку программ для передачи звука через Интернет. В 1997 г. появился RealPlayer 4.0 с поддержкой видео, который с тех пор постоянно совершенствовался. Сегодняшняя его версия носит название G2. Система фирмы Real содержит богатый набор аудиокодеков и очень хороший видеокодек, основанный на технологии видеоконференций ProShare компании Intel. Все это встроено в систему и ее базовые инструменты. Основные средства кодировки, серверные инструменты и проигрыватель фирмы Real являются бесплатными. Главный источник дохода компании — продажи серверов большой емкости, которые существуют в версиях для NT и для широкого круга UNIX-систем. Сам RealPlayer G2 существует в виде полных версий для Win32 и Mac. Предыдущая версия 5.0 существует в вариантах для Win3.1, OS/2 и целого ряда UNIX-систем. В RealPlayer Plus ($30) есть ряд дополнительных функций вспомогательного характера. Дополнительную информацию можно найти по адресу: www.real.com


Обрезка

      Почти всегда оцифрованное видео нужно обрезать, прежде чем выполнять его компрессию для Web. Многие модели плат ввода оставляют на левом краю кадра черную или шумовую полосу. Даже если подобных краевых эффектов нет, следует обрезать кадр по краям так, чтобы оставить только заведомо полезное изображение. Практически все коммерческие видеофильмы предназначены для воспроизведения на бытовых телевизорах. Обрезка до заведомо видимой области обычно дает лучшее соответствие исходной композиции сцены и к тому же делает предмет съемки несколько крупнее и различимее. В общем случае целесообразно обрезать 5% на каждом краю, т. е. при размерах изображения 640 x 480 нужно обрезать по 24 пикселя сверху и снизу и по 36 пикселей слева и справа.

Масштабирование

      Масштабирование - критически важная и обманчиво простая процедура. Прежде всего, следует проверить, имеет ли оцифрованное видео квадратные пиксели. Работая с неквадратным форматом 720 x 486, нужно перед собственно масштабированием сжать изображение по вертикали с коэффициентом 1,1. Некоторые программы, в том числе Adobe After Effects (www.adobe.com) и Terran Media Cleaner Pro (www.terran.com), могут делать это автоматически. Для других же могут потребоваться расчеты back-of-the-envelope.
      Исключительно важен сам алгоритм масштабирования. Стандартный бикубический скалярный алгоритм используется по умолчанию или может быть выбран из меню в большинстве программ обработки видео, включая After Effects и Premiere. Бикубический алгоритм - очень хороший, быстрый, высококачественный скалярный алгоритм, позволяющий увеличивать изображение до 200% или уменьшать его до 50% от исходного размера. Однако за этими пределами бикубическое масштабирование вносит ряд неприятных погрешностей. Эта проблема возникает в Web-видео, когда изображение размером 128 x 96 пикселей составляет всего 20% оригинала размером 640 x 480. При уменьшении до менее чем 50% бикубическое масштабирование вносит ошибки типа пропадания границ. Некоторые части исходного изображения на результирующем изображении полностью исчезают.
      Классическим примером этого является превращение четких диагональных линий в ступенчатые и пропадание горизонтальных или вертикальных линий в некоторых местах изображения. Это приносит двойной вред. Во-первых, изображение плохо смотрится. Во-вторых, возникает много паразитных деталей и межкадровых различий, затрудняющих компрессию видео. Тратить свой "битовый бюджет" на компрессию артефактов, а не изображения - полная противоположность тому, что можно называть хорошей компрессией. Единственный реальный путь решения этих проблем заключается в том, чтобы масштабировать меньше или применять лучший алгоритм масштабирования.
      Гораздо лучший алгоритм - синусный скалярный, реализованный в таких программах, как DeBabelizer и Media Cleaner Pro (называемый там "точным" масштабированием). Этот алгоритм масштабирования является общедоступным и не особенно сложен для реализации на современных процессорах, так что его следовало бы реализовать и в других программах для работы с цифровым видео (в том числе Photoshop).


Поля и кадры

Рис. 6. Этот кадр с чересстрочной разверткой размером 720 x 486 еще не готов к компрессии для Web. Пунктиром отмечена область, которую я собираюсь обрезать, чтобы убрать краевой шум и лишнее черное

Рис. 7. Я обрезал черное, убрал чересстрочную развертку, усилил контраст, перешел на квадратные пиксели и выполнил масштабирование к выходному разрешению

Рис. 8. Вот окончательный кадр во всей своей компрессированной красе. Он не кажется таким уж красивым, если забыть о том, что он рассчитан на доставку по модему на 56 K. Чтобы увидеть этот клип в движении, загляните в Reader's Corner на узле www.dv.com .

      Работа с полями - постоянный источник путаницы и проблем при подготовке видео для Web и CD-ROM. Компьютерные мониторы всегда имеют прогрессивную развертку, т. е. все изображение рисуется за один проход сверху вниз. В мониторах и телевизорах NTSC применяется чересстрочная развертка из двух полей: сначала рисуются все нечетные строки, а затем все четные. Это хитрое решение, экономящее полосу пропускания, создает новую сложную проблему, требующую еще более остроумного решения. В материале, снятом на видео, достаточно всего лишь удалить каждую вторую строку видеокадра. Эта несложная процедура (deinterlacing) реализована во многих программах обработки видео. Другое дело материалы, снятые на кинопленку. Киносъемка ведется с частотой 24 кадра/с, и эти кадры затем преобразуются в видеозапись из 60 полей с чередованием по закону 3:2, т. е. первый кадр преобразуется в три поля, второй - в два, третий - снова в три и т. д. Если взять такую видеозапись и использовать процедуру deinterlace, то получится поток с частотой 30 кадров/с, в котором каждый пятый кадр повторяется. Это приводит к очень дерганым движениям. Наилучшим решением является восстановление исходной частоты в 24 кадра/с путем обратного преобразования 3:2. Программа After Effects имеет неплохой фильтр обратного преобразования в диалоге "Interpret footage", но она может терять синхронизацию, если источник монтировался как видео. Функция Intelecine в программе Media Cleaner Pro хорошо восстанавливает материалы до 24 кадров/с даже в том случае, если они смонтированы как видео. Приятным побочным эффектом такого восстановления является то, что при этом получаются кадры с прогрессивной разверткой, как в оригинале. Если вы не уверены в происхождении своего материала (кинопленка или видео), то выяснить это нетрудно. Просмотрите фильм кадр за кадром. Если все кадры обнаруживают чересстрочную развертку, то это видео; если же наблюдается последовательность из трех кадров с чересстрочной разверткой, за которой идут два кадра с прогрессивной, то это кино.

Собираем все вместе

      В комплексе все несколько сложнее. Рассмотренные выше настройки связаны между собой, что и затрудняет дело. Наша конечная цель - сделать видеоматериал с квадратными пикселями, с допустимым разрешением и с правильным соотношением сторон кадра. Нужно подобрать такое сочетание обрезки, анаморфотного масштабирования и разрешения изображения, которое даст вашему Web-кодеку то, что ему нужно. Например, кодек MS MPEG-4 компании Microsoft требует, чтобы размеры сторон входного изображения были кратны 16, так что для него подойдет лишь ограниченное количество вариантов разрешения. Эта проблема может быть особенно серьезной для сверхшироких 2,1-дюймовых и 2,35-дюймовых пленок. Может потребоваться частично обрезать видеокадры по левой и правой сторонам, чтобы они уместились в выходном окне. Я не советую резать много сверху и снизу помимо безопасной области, ведь при этом могут пострадать головы и ноги, важные для сюжета. Можно также слегка сжать изображение по горизонтали или вертикали. Как правило, сжатие в пределах 5% не слишком заметно. Если же сжимать больше, то люди начинают выглядеть, как в кривом зеркале.

Звук

      К звуку в Web-видео часто относятся как к бедному родственнику. Но для зрительского восприятия звук так же важен, как и изображение. Более того, при современных аудиокодеках и широкополосной среде у вас есть шансы добиться такого качества музыки, что зритель скажет: "Какая отличная песня!" вместо "Что ж, для Web-аудио звучит нормально".
      Далее, если ваше видео не занимает слишком большую долю полосы пропускания, то можно добиться приличного звучания музыки и при скорости 28,8 K. В большинстве аудиокодеков для Web степень компрессии устанавливается в зависимости от частоты дискретизации и числа каналов, поэтому важно понимать смысл этих двух параметров. Частота дискретизации влияет на качество звука, особенно при воспроизведении высоких частот. Большинство плат оцифровки видеосигнала обеспечивает частоту дискретизации 44,1 кГц, что соответствует качеству CD. Как правило, даже при частоте дискретизации, равной некоторой доле от 44,1 кГц, качество воспроизведения звука платами бытового класса получается хорошим. Другие значения частот тоже допустимы, но требуют программной передискретизации, которая загружает процессор и может привести к более низкому качеству, чем при использовании аппаратных решений. Таким образом, для широкополосной музыки 44,1 кГц - как раз то, что надо. Для передачи музыки с более низкой частотой дискретизации используйте частоту 22,050 кГц или хотя бы 11,025 кГц. При более низких частотах вы получите качество хуже, чем на радио с амплитудной модуляцией. При передаче только речи частоту дискретизации можно снизить до 8 кГц для женского голоса и до 6 кГц для мужского. Если ваше звуковое сопровождение состоит в основном из речи с короткими музыкальными вставками, то обычно можно пользоваться более компактными речевыми кодеками. Зрители смотрят ваше видео не ради музыки, поэтому не ожидают слишком много от ее качества.


WindowsMedia 4.0

     Хотя компания Microsoft вышла на рынок Web-видео последней, она сразу сделала мощный рывок. Платформа Windows Media включает средства кодировки, проигрыватели и NT-серверы. В отличие от прошлых времен, когда лучший продукт любой фирмы постоянно находился в состоянии бета-версии, сегодня из трех рассматриваемых технологий только Windows Media 4.0 является общедоступной бета-программой. Эта версия содержит обновления, в основном эволюционные, и отличается улучшенными кодеками. В частности, в ней реализована улучшенная версия 3.0 видеокодека MS MPEG-4. Больше всего разговоров пока что идет об аудиокодеке Microsoft, который обещает резкое повышение качества звука и быстродействия по сравнению с кодеком MetaSound, который использовался до сих пор. Windows Media 4.0 — очень перспективная версия.
     Пакеты Windows Media существуют в вариантах для платформ Intel и Alpha Win32. Предлагаемая Microsoft версия 3.0 (бета) для Mac неустойчива и работает плохо. Фирма также обещает версию для UNIX. Дополнительную информацию можно найти по адресу: www.microsoft.com/windows/windowsmedia/ .


Собственно компрессия

      Уф! И все это нужно проделать еще до того, как мы начнем компрессию? Да. Все самое трудное при подготовке Web-видео связано с предобработкой. Сама по себе компрессия особой сложности не представляет. Хотя разные технологии работают по-своему, основные факторы и в QuickTime, и в RealSystem, и в Windows Media одни и те же (cм. соответствующие врезки).
      Каждый разработчик предлагает бесплатный или недорогой базовый кодировщик и к нему API для создания другими разработчиками инструментальных средств компрессии видео в их собственных форматах. Так как я работаю в компании, которая создает такие инструментальные средства, не стоит подробно останавливаться на их сравнительном анализе; вместо этого поговорим о том, что у них всех общего. В зависимости от того, каким инструментальным средством вы пользуетесь, вам может потребоваться прежде, чем запустить кодировщик, предварительная обработка видео в другой программе. Бесплатные кодировщики не обеспечивают качественного масштабирования, не поддерживают функции обратного телекинодатчика и ряд других. Отметим, что инструментарий Media в Microsoft Windows не поддерживает QuickTime в качестве формата исходных файлов, так что придется создавать промежуточные файлы в формате AVI. Программа RealProducer поддерживает QuickTime посредством модуля импорта DirectShow, крайне ограниченного по своим возможностям и неспособного читать большинство современных модификаций файлов QuickTime, в том числе любые файлы M-JPEG и Photo-JPEG. В среде Windows высшей по качеству изображения градацией компрессии является None (нет компрессии); можно быстро превысить 2-гигабайтный предел величины файла AVI при достаточной длительности или высоком разрешении материала. Технология Real G2 вполне уживается с довольно компактным промежуточным файловым форматом Indeo 5.10 при стопроцентном качестве. Однако цветовое пространство у кодека Microsoft MPEG-4 лучше, чем у кодека Indeo, так что и Indeo не является идеальным вариантом. Лучший промежуточный файловый формат, который мне удалось найти для Windows Media, - архивный режим программы TrueMotion 2X фирмы Duck.

Скорость передачи данных

      Правильная установка скорости передачи данных - наиболее важное из всех решений, которые вам придется принимать. Большинство программных инструментов имеет готовые настройки скорости передачи для разных скоростей доставки, и эти настройки обычно могут служить хорошими отправными точками. Заметим, что скорости передачи данных существенно ниже номинальных значений скоростей приемного устройства абонента: 20 Кбит/с или 22 Кбит/с целесообразно задавать для модемов на 28 K, а 40 Кбит/с более или менее подходит для 56 K. При этом остается запас на шум в телефонной линии, на работу почтовой программы, которая в фоновом режиме проверяет, нет ли новых сообщений, и тому подобные вещи. Чем меньше вы оставите запаса, тем более чувствительным будет ваш клип к колебаниям скорости передачи данных, и тем более вероятно, что гладкого воспроизведения зритель не получит, а увидит раздражающие сообщения о буферизации данных. Но чем ниже выбранная скорость передачи данных, тем хуже качество изображения. Выбирая скорость передачи, оставляйте достаточную полосу пропускания для звука. В общем случае, чем ниже скорость передачи данных, тем большую часть полосы пропускания нужно отводить на звук, например для клипов, рассчитанных на модемы 28,8 K, - от 25 до 40%. Не волнуйтесь, если окончательный размер полученного файла окажется больше, чем можно было ожидать, исходя из выбранной скорости передачи. Этот файл содержит информацию, которая будет использоваться сервером и пользователю передаваться не будет. Если отдельные дорожки имеют правильную величину, то все в порядке.

Частота кадров

      Как правило, частота кадров в окончательном клипе Web-видео должна быть в целое число раз меньше исходной. Если оцифровка проводилась с частотой 30 кадров/с, то выходная частота может составлять 30, 15, 10, 7,5, 6 или 5 кадров/с. Если вы работаете с кинопленки, выходная частота может составлять 24, 12, 8, 6 или 4 кадра/с. Чем ниже выбранная скорость передачи данных, тем ниже и частота кадров. Широкополосное видео часто передается с исходной частотой кадров. На хороших телефонных линиях модемное видео в лучшем случае может достигать частоты 15 или 12 кадров/с.

Частота ключевых кадров

      Количество ключевых кадров, как правило, должно быть как можно меньше. Однако ключевые кадры - единственные точки, куда возможны произвольные переходы, и именно в них происходит восстановление потока видео после потери пакетов. Я обычно предпочитаю иметь в потоке один ключевой кадр через каждые 5-10 с, так что один ключевой кадр на 75-150 обычных кадров при частоте 15 кадров/с - примерно то, что нужно.

Пропуск кадров

      Так как имеющуюся скорость передачи данных превысить невозможно, во всех форматах Web-видео происходят пропуски кадров.
      Если какому-нибудь кадру потребовалась пропускная способность больше средней, то следующий за ним кадр, возможно, придется отбросить, чтобы сохранить минимум качества. Вы должны решить, предпочитаете ли вы, чтобы изображения сложных сцен были четкими (что может привести к пропуску многих кадров), или чтобы движения были плавными (а качество изображения стало хуже). Этот выбор - дело личного вкуса и зависит от конкретного содержания клипа. Для видеоролика, рекламирующего какой-нибудь товар, вы можете решить, что изделие должно быть четко различимо, и выбрать низкую частоту кадров. В музыкальных видеоклипах, монтируемых под ритм музыки, вы, возможно, захотите сохранить частоту кадров и обеспечить синхронизацию с музыкой. Иногда попадаются видеоматериалы, так плохо поддающиеся компрессии, что получается плохое качество изображения и низкая частота кадров. В таком случае либо придется с этим мириться, либо убрать соответствующий фрагмент, либо поискать лучшие средства предобработки. При очень разнородном содержании (например, если фильм содержит много разговорных сцен и гонки автомобилей) можно выбрать высокую частоту кадров, но установить предпочтение на качество изображения, чтобы, когда это возможно, получались четкие, плавные движения, а последовательности действий передавались как слайд-шоу. Несправедливость здесь заключается в том, что тот тип видео, который больше всего заслуживает высокой частоты кадров, меньше всего может себе ее позволить.

Технологии

      Эйфория первых дней после выхода на рынок цифровых технологий закончилась. Наступил этап определенной зрелости в их развитии. Темпы обновления уже снижаются - и это хорошо, потому что при более длительных циклах смены изделий мы имеем более стабильную платформу доставки и не должны перекодировать исходные материалы каждые три месяца. Технологии Real G2, QuickTime 4.0 и Windows Media имеют ряд важных общих черт. Авторская работа и воспроизведение возможны как в Windows, так и на Macintosh. Все они поддерживают и файловую, и потоковую доставку. Все они в той или иной форме обеспечивают автоматическое обновление версий, так что можно вводить новые типы носителей, не заставляя пользователя специально загружать новые компоненты для их просмотра. Все они допускают воспроизведение с помощью программы-проигрывателя или на Web-странице. Все они имеют API, с помощью которых программы сторонних фирм могут создавать и воспроизводить потоковые материалы. Конкретные сведения по каждой из этих технологий Web-видео приводятся во врезках. Пока что Web-видео еще не может равняться с видеозаписью VHS или телевидением в диапазоне УВЧ, но оно, наконец, достигло той стадии, на которой мы можем сосредоточиться на том, чтобы сделать свой клип как можно более качественным, а не бороться за то, чтобы он просто выглядел движущимся.