TARGA3000: Эволюция плат нелинейного монтажа
Андрей Ряхин
В предыдущем номере журнала ("ЦВ", N5/2000) мы рассмотрели основные характеристики восьми плат нелинейного монтажа для профессионального видеопроизводства трех ведущих фирм-производителей: Pinnacle Systems, DPS и Matrox. Там же отмечалось, что TARGA 3000 (www.pinnaclesys.com, www.pinnacle.ru, t3k.pinnacle.ru) на голову превосходит всех конкурентов, предлагая своим настоящим и особенно будущим пользователям действительно уникальные возможности цифрового монтажа и композитинга. В этом устройстве впервые применены принципиально новые технологические решения, фактически открывающие новую страницу в истории развития подобных систем. Правда, справедливости ради следует сказать, что фирма Pinnacle Systems в бесконечной гонке технологий опередила своих конкурентов пока лишь на промежуточном этапе. В ближайшее время последуют ответные ходы от DPS и Matrox, да и сама Pinnacle, вероятно, не остановится на достигнутом - и тогда мы станем свидетелями эволюционной смены поколений плат нелинейного монтажа. Однако несмотря на очевидные различия в конкретных схемах построения плат и характеристиках используемых цифровых видеопроцессоров, все новые решения должны будут соответствовать высокому уровню, взятому TARGA 3000 (T3K). Поэтому для того чтобы разобраться в основах функционирования плат нового поколения - а уже завтра эта группа обещает стать весьма многочисленной - давайте рассмотрим особенности организации работы первого их представителя.
|
Архитектура обработки
Большинство сегодняшних цифровых систем обработки видео по сути являются всего лишь цифровой адаптацией традиционной концепции построения старых аналоговых монтажных систем. В них несколько цифровых аудио- и видеопотоков последовательно проходит через набор спецпроцессоров, обеспечивающих в реальном времени заранее заданные преобразования, предопределенные еще на стадии разработки каждого процессора. В качестве примера достаточно привести общую схему построения линейки DigiSuite фирмы Matrox. Так, в популярной плате DigiSuite LE для параллельной обработки двух видеопотоков используются соответственно два 2D-DVE-процессора Matrox Fiesta-II, для работы с дополнительным слоем графики - контроллер Matrox MGA-2064SG, а собственно микширование с переходами выполняется в Matrox Siesta-II. А вот в полной версии DigiSuite для достижения большей производительности число процессоров Fiesta-II увеличено до пяти. Аналогичный вывод справедлив и для ReelTime/NITRO фирмы Pinnacle Systems, и для DPS Reality/Velosity: для обеспечения новых эффектов и/или увеличения числа одновременно обрабатываемых слоев необходимо наращивание вычислительной мощности, т. е. добавление новых спецпроцессоров. Скажем, при преобразовании Velosity 2D в Velosity 3D путем установки дочерней платы V3DX с процессором 3D-эффектов кроме всего прочего добавляется еще один слой графики.
Однако подобная последовательно-потоковая обработка имеет свои очевидные пределы и не позволяет, например, удвоить либо утроить число слоев, поменять порядок выполнения операций или многократно осуществить один и тот же эффект. К тому же эти процессоры разработаны под "стандартное" видео (чересстрочная развертка, 25 кадров в секунду, 720 x 576) и используют цветовое представление YUV 4:2:2 при глубине квантования 8 бит на компоненту. На пороге реального внедрения телевидения высокой четкости (1250/50), когда многие программы уже снимаются и выпускаются в аспектном соотношении 16:9, а композиционная сложность современного видео требует высокоточной обработки в представлении 4:4:4:4 до 16 бит на компоненту, цифровые платы, использующие традиционную обработку видео, во многом перестают соответствовать требованиям времени. Необходим новый, более гибкий и точный подход к организации процесса обработки, позволяющий быстро перестраиваться от нужд "классического" видеопроизводства к потребностям современного телевидения. Именно такое решение и реализовано в T3K.
Теория ее построения сводится в основным к следующему:
- использование большого буфера разделяемой памяти, позволяющего одновременно размещать десятки различных кадров с произвольным доступом к любой ячейке;
- преобразование входящих потоков видео в массивы пикселей их размещение в буфере памяти с реализацией многократной записи/считывания как исходных массивов, так и результатов их обработки;
- возможность задания в широких пределах размеров исходных массивов точности и их представления;
- наконец, параллельное задействование для операций над массивами пикселей нескольких вычислительных ресурсов, работающих с быстродействием, в несколько раз превышающим реальное время, и позволяющих зацикливать процесс обработки.
Чтобы подчеркнуть принципиальное отличие данного подхода от традиционного, именуемого Stream-Centric, специалисты Pinnacle Systems придумали для него специальное название Memory-Centric. Внимательный читатель заметит, что ничего особенного в Memory-Centric нет, ведь аналогичный подход уже давно используется в компьютерах общего назначения для решения самых обычных задач. Например, функционирование процессора Pentium также немыслимо без активной работы оперативной памяти (RAM). И подобный компьютер в действительности можно использовать и для видеопреобразований. Но в этом случае придется забыть о реальном времени выполнения, поскольку задачи обработки видео столь специфичны и сложны, что требуют специальных ресурсов.
|
"Сердцем" T3K стал новый сверхмощный видеопроцессор HUB3, разработанный специалистами Pinnacle и производимый фирмой IBM по 0,25-микронной технологии (его основные характеристики приведены выше). В этом ASIC-микрочипе (Application Specific Integrated Circuit) объединены многоканальный программируемый контроллер (интерфейс) памяти, обеспечивающий суммарную пропускную способность до 1,5 Гбайт/с, пять независимо контролируемых портов ввода и вывода аудио- и видеоинформации, каждый с собственным DMA-доступом (Direct Memory Access) к интерфейсу памяти, и два специализированных вычислительных блока с производительностью 100 мегапикселей в секунду. Первый из этих блоков, RCL (Resizer-Color-Converter-LookUpTable), выполняет двумерное геометрическое преобразование входного кадра (выделение фрагмента с обрезанием кадра, задание его новых размеров и положения и т. д.), его матричное (3x3) цветовое преобразование в представлении YUV или RGB и линейную цветокоррекцию через LUT-таблицу из 1024 значений. Второй вычислительный блок, 4-Layer Compositor, принимая четыре исходных изображения (кадра), сначала производит независимые геометрические преобразования первых трех (относительное смещение и обрезание, но не масштабирование), а затем - их послойное микширование (наложение друг на друга с учетом задаваемой прозрачности). При необходимости этот блок также выполняет на аппаратном уровне хромакеинг, широко используемый для построения виртуальных сцен.
Основные характеристики видеопроцесора HUB3 |
Обмен данными |
Объем буфера памяти | 128 Мбайт |
Интерфейс передачи данных в память | 128 бит, 100 МГц |
Максимальная скорость передачи | 1500 Мбайт/с |
Тип памяти | SDRAM |
Формат представления видеоданных | YUVK и/или RGBK, 4:2:2:4 и/или 4:4:4:4 |
Глубина квантования | 8, 10 или 16 бит |
Допустимый размер кадра | до 2048 x 2048 |
Число портов ввода/вывода аудио/видео | 5 вх., 5 вых. |
Частота дискретизации | до 108 МГц |
Аспектное отношение | программируемое: 4:3, 16:9 и др. |
Поддерживаемые типы развертки видео | программируемое: 525, 625 и др; чересстрочный/прогрессивный |
Число аудиоканалов | до 8 на видеопорт |
Частота дискретизации аудио | 48 кГц, 16 бит или 20 бит на отсчет |
Число поддерживаемых кодеков видео | до 4 |
Поток компрессированных данных | до 200 Мбайт/с |
Тип локальной шины передачи данных | PCI 32 или 64 бит, 33 МГц |
Максимальный поток данных по шине | 200 Мбайт/с |
Встроенные вычислительные ресурсы |
Число вычислительных блоков | 2 (RCL и Compositor) |
Производительность блоков | 100 мегапикселей в секунду |
Глубина микширования (композитинга) | 4 слоя |
Масштабирование | двумерное, субпиксельная точность (14 бит) |
Цветокоррекция/конвертация | 3х3, RGB или YUV |
Таблицы цветового преобразования | 4, RGBK или YUVK, с интерполяцией (14 бит) |
Прозрачность (кеинг) | Chroma и Luma |
Попробуем оценить реальное быстродействие HUB3. Согласно стандарту ITU-R 601 телевизионный кадр - это 415 тысяч пикселей (720 х 576), что при глубине цветового представления 2 байта на пиксель (4:2:2) соответствует 810 Кбайт. Ну а поскольку кадровая частота равна 25 Гц, то цифровой поток некомпрессированного видео составляет 10,4 млн. пикселей, или 20 Мбайт/с. Таким образом, за 1/25 секунды ("время жизни" процессов real-time) стандартный кадр можно успеть записать/считать в буфер памяти 75 раз, или, другими словами, пропускная способность контроллера памяти HUB3 составляет 75 потоков видео! В то же время каждый вычислительный блок за 1/25 секунды позволяет выполнить до восьми циклов соответствующей обработки потоков (теоретический предел 100/10,4 равен девяти, но часть времени теряется на служебные установки, переключение режимов и т. д.) и может, например, произвести в реальном времени 32-слойный композитинг и цветокоррекцию восьми потоков!
Таблица 1. Типы сигналов и число разъемов, требуемые для профессиональной платы монтажа |
Тип сигнала |
Вид разъема |
Вход/выход |
Composite Video |
BNC (RCA) |
1/1 |
S-Video (Y/C) |
4-pin Y/C |
1/1 |
Component Video |
3 x BNC |
1/1 |
DV |
4-pin (6-pin) IEEE-1394 |
1 |
SDI Digital Video |
BNC |
1/1 |
Unbalanced Audio |
2 x RCA |
1/1 |
Balanced Audio |
2 x XLR |
2+/2+ |
S/P DIF Digital Audio |
RCA |
1/1 |
AES/EBU Balanced Audio |
XLR |
2+/2+ |
AES/EBU Unbalanced Audio |
BNC |
1/1 |
TDI/F Digital Audio |
DB-25 |
1 |
HUB3 включает в себя также собственный 64-битный контроллер PCI-шины, работающий на частоте 33 МГц и обеспечивающий скорость обмена данными между буфером памяти T3K, оперативной памятью компьютера и накопителями информации на жестких дисках до 200 Мбайт/с. Поэтому теоретически T3K может оперировать десятью потоками! К сожалению, здесь весьма серьезным ограничением становятся возможности собственно дисковой подсистемы компьютера, вынужденной при чтении переключаться между записями различных потоков. Считая среднее время поиска/переключения на диске равным 5 мс, а размер кэша чтения - 1 Мбайт, легко вычислить, что уже при пяти потоках половина времени будет теряться именно на поиск требуемых записей (5 потоков x 20 раз x 5 мс), так что эффективная скорость передачи данных упадет вдвое. Для многопотоковых систем монтажа это очень серьезная проблема, над разрешением которой в настоящее время работают во многих фирмах, например, в корпорации Medea (www.medeacorp.com). Один из очевидных выходов - уменьшение требуемой пропускной способности за счет сжатия видео. На T3K установлены два кодека DVxpress фирмы C-Cube, которые обеспечивают два параллельных канала компрессии и четыре канала декомпрессии, поддерживающих стандарты сжатия MPEG-2 и DV25 (возможно обновление программы до DV50). Таким образом, в принципе T3K уже сегодня могла бы работать по крайней мере с пятью потоками, и при испытаниях платы специалистам Pinnacle Systems этого действительно удавалось добиться. Но в настоящей версии ПО Т3К для надежной работы и снижения требований к базовой компьютерной системе пока наложено ограничение: три потока некомпрессированного видео и два - компрессированного (и дополнительно до пяти или шести слоев графики соответственно).
Как уже отмечалось, HUB3 имеет пять независимых портов ввода/вывода информации. Первые два соединены с кодеками DVxpress, один порт зарезервирован для встроенного разъема расширения AVIO, предназначенного для подключения к T3K будущих дочерних плат (например, платы 3D-эффектов Infinite 3D), а оставшиеся два порта используются для связи с внешними блоками (BOB - Break-Out-Box) разъемов, через которые собственно и происходит передача входной и выходной информации. Таким образом, плата T3K в состоянии осуществлять одновременную запись и воспроизведение различных потоков, многоканальное независимое проигрывание цифровых файлов, микширование в реальном времени "живого" видео и цифровых файлов и т. д. К сожалению, настоящая версия программного обеспечения (Adobe Premiere или Speed Razor) не позволяет воспользоваться этими возможностями, оставляя их реализацию для более совершенных приложений. Поэтому в T3K пока задействован только один из двух портов связи с BOB.
С запасом на будущее в данной архитектуре заложена также возможность программного изменения кадрового разрешения (для ТВЧ), частоты и порядка развертки, аспектного отношения, структуры и глубины представления данных. Это превращает T3K в идеальную рабочую лошадку для решения самых разнообразных задач завтрашнего дня, от подготовки программ телевидения высокой точности до Web-вещания.
Таблица 2. Сигналы, поддерживаемые BOB платы TARGA 3000 |
Тип сигнала |
Вход/выход |
Pro Analog |
Pro Digital |
Pro D & A |
Composite Video |
1/1 |
— |
1/1 |
S-Video (Y/C) |
1/1 |
— |
1/1 |
Component Video |
1/1 |
— |
1/1 |
SDI/SDTI Video |
— |
1/1 |
1/1 |
Balanced Audio |
1/1 (стерео) |
— |
2 /3 (стерео) |
Unbalanced Audio |
1/1 (стерео) |
— |
1/1 (стерео) |
Embedded Audio |
— |
8/8 |
8/8 |
S/P DIF Audio |
— |
— |
2/2 |
AES/EBU Audio |
— |
— |
4/4 |
TDI/F Audio |
— |
— |
8/8 |
Блок внешних соединений
Проблема качественного соединения встроенной платы компьютера с внешними устройствами остро стоит перед производителями уже много лет. Спецификация PC-совместимых компьютеров оставляет на внешней планке платы для размещения всех соединений очень небольшое пространство. В то же время современные профессиональные устройства обязаны поддерживать самые разнообразные типы сигналов как видео (Composite, S-Video, YUV, RGB, DV, SDI), так и аудио (несимметричный, симметричный, AES/EBU, S/PDIF, TDIF) - всего более 30 соединений, причем с развитием новых видов вещания их число будет увеличиваться. Сложность проблемы заключается не только в высокой (и все возрастающей) плотности вывода контактов на задней планке и не только в исключении их взаимного влияния (наводок), но также в размещении на самой плате нужных микросхем приема и обработки (оцифровки, кодирования) соответствующих сигналов и, в конце концов, в обеспечении последующей надежной работы. Ведь известно, что наиболее часто возникающая при эксплуатации неисправность - "сгоревшие" входы-выходы (не менее 50% из них - композитные).
Известны различные подходы к решению задачи соединений. Наиболее прямой и дешевый - встраивание в заднюю планку специального разъема высокой плотности (до 40 контактов) и комплектация платы соответствующим "хвостом" кабелей. Недостатки этого подхода общеизвестны: частичное отражение принимаемых электрических сигналов из-за невозможности полного согласования входных импедансов, неизбежные наводки по общей "земле", неудобство эксплуатации тяжелого и негибкого "хвоста" (при частых соединениях возникает опасность механического повреждения разъема на плате или проводки в одном из кабелей), дороговизна изготовления такого "хвоста" (как правило, требующего ручной пайки). В развитие данного метода можно использовать различные BOB, где собственно и размещаются все необходимые разъемы. Такой BOB является своеобразным пассивным удлинителем, делающим более удобным и безопасным соединение платы с внешней аудио- и видеоаппаратурой. Однако с точки зрения качества передачи сигналов для него характерны те же проблемы.
Существенно более прогрессивным является применение активного BOB, в который вынесена часть необходимых операций обработки входных и выходных сигналов: их прием, аналого-цифровые преобразования, фильтрация и декодирование. В этом случае передача информации между BOB и платой вне зависимости от конкретного типа внешнего сигнала осуществляется уже в едином цифровом виде (например, компонентный для видео и симметричный для аудио). Размеры BOB позволяют развести цепи обработки аналоговых сигналов и обеспечить хорошее качество их приема и преобразования. Вследствие такого подхода плата освобождается от рутинных операций оцифровки и приобретает пространство для размещения дополнительных специализированных микросхем - вычислительных блоков эффектов. Привлекает и унификация устройств: один и тот же BOB в дальнейшем можно использовать для "подготовки" сигналов для других плат или, наоборот, для расширения списка поддерживаемых сигналов (внешних устройств). Чтобы повысить точность их преобразования, достаточно к имеющейся плате подсоединить новый BOB. Следующим шагом в этом направлении становится возможность принимать в одном BOB как аналоговые, так и цифровые сигналы. Наряду с удобством соединения это позволит осуществлять в рамках BOB преобразования типов сигналов, например, из сигналов SDI получать аналоговое компонентное видео, из S-Video - SDI и т. д.
Именно такая концепция активных BOB и реализована в семействе T3K, причем в настоящее время разработано три различных устройства - Pro Analog BOB, Pro Digital BOB и Pro Digital & Analog BOB, производящие ввод-вывод только аналоговых, только цифровых и обоих типов сигналов соответственно. Здесь особенно важен интерфейс передачи цифровых данных между BOB и T3K. На первый взгляд согласно стандарту SMPTE 259M достаточно обеспечить последовательный цифровой интерфейс SDI с пропускной способностью 270 Мбит/с. Однако в будущем телевидение высокой четкости (SMPTE 292M) потребует уже 1,485 Гбит/с. Именно это значение, причем в обе стороны, специалисты Pinnacle Systems и заложили в новом типе цифрового интерфейса, названного Digital Tether (цифровая перевязь). Он может функционировать в двухканальном режиме на стандартной частоте 27 МГц или в одноканальном, но уже на 74,25 МГц (необходимой для ТВЧ). При этом каждый канал видео имеет информационную глубину квантования 10 бит и дополнительно несет до 16 каналов аудио (16, 20 или 24 бит) и один канал с данными о тайм-коде (VITC) и служебной информацией.
Как уже отмечалось, в T3K пока задействован только один порт связи с Digital Tether, зато в двухканальном режиме. А вот ее "сестрица" TARGA Cine (CineWave), разработанная для Mac G4, уже поддерживает два порта, каждый из которых обеспечивает и двухканальную, и одноканальную (ТВЧ) связь. Впрочем, описание возможностей действительно интересной платы TARGA Cine уже выходит за рамки настоящей статьи. В заключение лишь еще раз подчеркнем, что как видеопроцессор HUB3, так и интерфейс Digital Tether разработаны с большим запасом на будущее, с учетом появления в скором времени новых, еще более мощных и совершенных устройств.
|