Новости


	Магазин


	Форум


	Журнал


	О компании


	Наши сайты


	Координаты

TBS - Журнал Цифровое Видео

Разделы форума

Поиск по архиву

Избранное

Архив журнала
Цифровое Видео

2003 год	#4	#5	#6
	#1	#2	#3

2002 год	#4	#5	#6
	#1	#2	#3

2001 год	#4	#5	#6
	#1	#2	#3

2000 год	#4	#5	#6
	#1	#2	#3

1999 год	#4	#5	#6
	#1	#2	#3

TARGA3000:
Эволюция плат нелинейного монтажа

Андрей Ряхин

В предыдущем номере журнала ("ЦВ", N5/2000) мы рассмотрели основные характеристики восьми плат нелинейного монтажа для профессионального видеопроизводства трех ведущих фирм-производителей: Pinnacle Systems, DPS и Matrox. Там же отмечалось, что TARGA 3000 (www.pinnaclesys.com, www.pinnacle.ru, t3k.pinnacle.ru) на голову превосходит всех конкурентов, предлагая своим настоящим и особенно будущим пользователям действительно уникальные возможности цифрового монтажа и композитинга. В этом устройстве впервые применены принципиально новые технологические решения, фактически открывающие новую страницу в истории развития подобных систем. Правда, справедливости ради следует сказать, что фирма Pinnacle Systems в бесконечной гонке технологий опередила своих конкурентов пока лишь на промежуточном этапе. В ближайшее время последуют ответные ходы от DPS и Matrox, да и сама Pinnacle, вероятно, не остановится на достигнутом - и тогда мы станем свидетелями эволюционной смены поколений плат нелинейного монтажа. Однако несмотря на очевидные различия в конкретных схемах построения плат и характеристиках используемых цифровых видеопроцессоров, все новые решения должны будут соответствовать высокому уровню, взятому TARGA 3000 (T3K). Поэтому для того чтобы разобраться в основах функционирования плат нового поколения - а уже завтра эта группа обещает стать весьма многочисленной - давайте рассмотрим особенности организации работы первого их представителя.

Архитектура обработки

      Большинство сегодняшних цифровых систем обработки видео по сути являются всего лишь цифровой адаптацией традиционной концепции построения старых аналоговых монтажных систем. В них несколько цифровых аудио- и видеопотоков последовательно проходит через набор спецпроцессоров, обеспечивающих в реальном времени заранее заданные преобразования, предопределенные еще на стадии разработки каждого процессора. В качестве примера достаточно привести общую схему построения линейки DigiSuite фирмы Matrox. Так, в популярной плате DigiSuite LE для параллельной обработки двух видеопотоков используются соответственно два 2D-DVE-процессора Matrox Fiesta-II, для работы с дополнительным слоем графики - контроллер Matrox MGA-2064SG, а собственно микширование с переходами выполняется в Matrox Siesta-II. А вот в полной версии DigiSuite для достижения большей производительности число процессоров Fiesta-II увеличено до пяти. Аналогичный вывод справедлив и для ReelTime/NITRO фирмы Pinnacle Systems, и для DPS Reality/Velosity: для обеспечения новых эффектов и/или увеличения числа одновременно обрабатываемых слоев необходимо наращивание вычислительной мощности, т. е. добавление новых спецпроцессоров. Скажем, при преобразовании Velosity 2D в Velosity 3D путем установки дочерней платы V3DX с процессором 3D-эффектов кроме всего прочего добавляется еще один слой графики.
      Однако подобная последовательно-потоковая обработка имеет свои очевидные пределы и не позволяет, например, удвоить либо утроить число слоев, поменять порядок выполнения операций или многократно осуществить один и тот же эффект. К тому же эти процессоры разработаны под "стандартное" видео (чересстрочная развертка, 25 кадров в секунду, 720 x 576) и используют цветовое представление YUV 4:2:2 при глубине квантования 8 бит на компоненту. На пороге реального внедрения телевидения высокой четкости (1250/50), когда многие программы уже снимаются и выпускаются в аспектном соотношении 16:9, а композиционная сложность современного видео требует высокоточной обработки в представлении 4:4:4:4 до 16 бит на компоненту, цифровые платы, использующие традиционную обработку видео, во многом перестают соответствовать требованиям времени. Необходим новый, более гибкий и точный подход к организации процесса обработки, позволяющий быстро перестраиваться от нужд "классического" видеопроизводства к потребностям современного телевидения. Именно такое решение и реализовано в T3K.
      Теория ее построения сводится в основным к следующему:
      - использование большого буфера разделяемой памяти, позволяющего одновременно размещать десятки различных кадров с произвольным доступом к любой ячейке;
      - преобразование входящих потоков видео в массивы пикселей их размещение в буфере памяти с реализацией многократной записи/считывания как исходных массивов, так и результатов их обработки;
      - возможность задания в широких пределах размеров исходных массивов точности и их представления;
      - наконец, параллельное задействование для операций над массивами пикселей нескольких вычислительных ресурсов, работающих с быстродействием, в несколько раз превышающим реальное время, и позволяющих зацикливать процесс обработки.
      Чтобы подчеркнуть принципиальное отличие данного подхода от традиционного, именуемого Stream-Centric, специалисты Pinnacle Systems придумали для него специальное название Memory-Centric. Внимательный читатель заметит, что ничего особенного в Memory-Centric нет, ведь аналогичный подход уже давно используется в компьютерах общего назначения для решения самых обычных задач. Например, функционирование процессора Pentium также немыслимо без активной работы оперативной памяти (RAM). И подобный компьютер в действительности можно использовать и для видеопреобразований. Но в этом случае придется забыть о реальном времени выполнения, поскольку задачи обработки видео столь специфичны и сложны, что требуют специальных ресурсов.

"Сердцем" T3K стал новый сверхмощный видеопроцессор HUB3, разработанный специалистами Pinnacle и производимый фирмой IBM по 0,25-микронной технологии (его основные характеристики приведены выше). В этом ASIC-микрочипе (Application Specific Integrated Circuit) объединены многоканальный программируемый контроллер (интерфейс) памяти, обеспечивающий суммарную пропускную способность до 1,5 Гбайт/с, пять независимо контролируемых портов ввода и вывода аудио- и видеоинформации, каждый с собственным DMA-доступом (Direct Memory Access) к интерфейсу памяти, и два специализированных вычислительных блока с производительностью 100 мегапикселей в секунду. Первый из этих блоков, RCL (Resizer-Color-Converter-LookUpTable), выполняет двумерное геометрическое преобразование входного кадра (выделение фрагмента с обрезанием кадра, задание его новых размеров и положения и т. д.), его матричное (3x3) цветовое преобразование в представлении YUV или RGB и линейную цветокоррекцию через LUT-таблицу из 1024 значений. Второй вычислительный блок, 4-Layer Compositor, принимая четыре исходных изображения (кадра), сначала производит независимые геометрические преобразования первых трех (относительное смещение и обрезание, но не масштабирование), а затем - их послойное микширование (наложение друг на друга с учетом задаваемой прозрачности). При необходимости этот блок также выполняет на аппаратном уровне хромакеинг, широко используемый для построения виртуальных сцен.

Основные характеристики видеопроцесора HUB3
Обмен данными
Объем буфера памяти	128 Мбайт
Интерфейс передачи данных в память	128 бит, 100 МГц
Максимальная скорость передачи	1500 Мбайт/с
Тип памяти	SDRAM
Формат представления видеоданных	YUVK и/или RGBK, 4:2:2:4 и/или 4:4:4:4
Глубина квантования	8, 10 или 16 бит
Допустимый размер кадра	до 2048 x 2048
Число портов ввода/вывода аудио/видео	5 вх., 5 вых.
Частота дискретизации	до 108 МГц
Аспектное отношение	программируемое: 4:3, 16:9 и др.
Поддерживаемые типы развертки видео	программируемое: 525, 625 и др; чересстрочный/прогрессивный
Число аудиоканалов	до 8 на видеопорт
Частота дискретизации аудио	48 кГц, 16 бит или 20 бит на отсчет
Число поддерживаемых кодеков видео	до 4
Поток компрессированных данных	до 200 Мбайт/с
Тип локальной шины передачи данных	PCI 32 или 64 бит, 33 МГц
Максимальный поток данных по шине	200 Мбайт/с
Встроенные вычислительные ресурсы
Число вычислительных блоков	2 (RCL и Compositor)
Производительность блоков	100 мегапикселей в секунду
Глубина микширования (композитинга)	4 слоя
Масштабирование	двумерное, субпиксельная точность (14 бит)
Цветокоррекция/конвертация	3х3, RGB или YUV
Таблицы цветового преобразования	4, RGBK или YUVK, с интерполяцией (14 бит)
Прозрачность (кеинг)	Chroma и Luma

Попробуем оценить реальное быстродействие HUB3. Согласно стандарту ITU-R 601 телевизионный кадр - это 415 тысяч пикселей (720 х 576), что при глубине цветового представления 2 байта на пиксель (4:2:2) соответствует 810 Кбайт. Ну а поскольку кадровая частота равна 25 Гц, то цифровой поток некомпрессированного видео составляет 10,4 млн. пикселей, или 20 Мбайт/с. Таким образом, за 1/25 секунды ("время жизни" процессов real-time) стандартный кадр можно успеть записать/считать в буфер памяти 75 раз, или, другими словами, пропускная способность контроллера памяти HUB3 составляет 75 потоков видео! В то же время каждый вычислительный блок за 1/25 секунды позволяет выполнить до восьми циклов соответствующей обработки потоков (теоретический предел 100/10,4 равен девяти, но часть времени теряется на служебные установки, переключение режимов и т. д.) и может, например, произвести в реальном времени 32-слойный композитинг и цветокоррекцию восьми потоков!

Таблица 1. Типы сигналов и число разъемов, требуемые для профессиональной платы монтажа
Тип сигнала	Вид разъема	Вход/выход
Composite Video	BNC (RCA)	1/1
S-Video (Y/C)	4-pin Y/C	1/1
Component Video	3 x BNC	1/1
DV	4-pin (6-pin) IEEE-1394	1
SDI Digital Video	BNC	1/1
Unbalanced Audio	2 x RCA	1/1
Balanced Audio	2 x XLR	2+/2+
S/P DIF Digital Audio	RCA	1/1
AES/EBU Balanced Audio	XLR	2+/2+
AES/EBU Unbalanced Audio	BNC	1/1
TDI/F Digital Audio	DB-25	1

      HUB3 включает в себя также собственный 64-битный контроллер PCI-шины, работающий на частоте 33 МГц и обеспечивающий скорость обмена данными между буфером памяти T3K, оперативной памятью компьютера и накопителями информации на жестких дисках до 200 Мбайт/с. Поэтому теоретически T3K может оперировать десятью потоками! К сожалению, здесь весьма серьезным ограничением становятся возможности собственно дисковой подсистемы компьютера, вынужденной при чтении переключаться между записями различных потоков. Считая среднее время поиска/переключения на диске равным 5 мс, а размер кэша чтения - 1 Мбайт, легко вычислить, что уже при пяти потоках половина времени будет теряться именно на поиск требуемых записей (5 потоков x 20 раз x 5 мс), так что эффективная скорость передачи данных упадет вдвое. Для многопотоковых систем монтажа это очень серьезная проблема, над разрешением которой в настоящее время работают во многих фирмах, например, в корпорации Medea (www.medeacorp.com). Один из очевидных выходов - уменьшение требуемой пропускной способности за счет сжатия видео. На T3K установлены два кодека DVxpress фирмы C-Cube, которые обеспечивают два параллельных канала компрессии и четыре канала декомпрессии, поддерживающих стандарты сжатия MPEG-2 и DV25 (возможно обновление программы до DV50). Таким образом, в принципе T3K уже сегодня могла бы работать по крайней мере с пятью потоками, и при испытаниях платы специалистам Pinnacle Systems этого действительно удавалось добиться. Но в настоящей версии ПО Т3К для надежной работы и снижения требований к базовой компьютерной системе пока наложено ограничение: три потока некомпрессированного видео и два - компрессированного (и дополнительно до пяти или шести слоев графики соответственно).
      Как уже отмечалось, HUB3 имеет пять независимых портов ввода/вывода информации. Первые два соединены с кодеками DVxpress, один порт зарезервирован для встроенного разъема расширения AVIO, предназначенного для подключения к T3K будущих дочерних плат (например, платы 3D-эффектов Infinite 3D), а оставшиеся два порта используются для связи с внешними блоками (BOB - Break-Out-Box) разъемов, через которые собственно и происходит передача входной и выходной информации. Таким образом, плата T3K в состоянии осуществлять одновременную запись и воспроизведение различных потоков, многоканальное независимое проигрывание цифровых файлов, микширование в реальном времени "живого" видео и цифровых файлов и т. д. К сожалению, настоящая версия программного обеспечения (Adobe Premiere или Speed Razor) не позволяет воспользоваться этими возможностями, оставляя их реализацию для более совершенных приложений. Поэтому в T3K пока задействован только один из двух портов связи с BOB.
      С запасом на будущее в данной архитектуре заложена также возможность программного изменения кадрового разрешения (для ТВЧ), частоты и порядка развертки, аспектного отношения, структуры и глубины представления данных. Это превращает T3K в идеальную рабочую лошадку для решения самых разнообразных задач завтрашнего дня, от подготовки программ телевидения высокой точности до Web-вещания.

Таблица 2. Сигналы, поддерживаемые BOB платы TARGA 3000
Тип сигнала	Вход/выход
Тип сигнала	Pro Analog	Pro Digital	Pro D & A
Composite Video	1/1	—	1/1
S-Video (Y/C)	1/1	—	1/1
Component Video	1/1	—	1/1
SDI/SDTI Video	—	1/1	1/1
Balanced Audio	1/1 (стерео)	—	2 /3 (стерео)
Unbalanced Audio	1/1 (стерео)	—	1/1 (стерео)
Embedded Audio	—	8/8	8/8
S/P DIF Audio	—	—	2/2
AES/EBU Audio	—	—	4/4
TDI/F Audio	—	—	8/8

Блок внешних соединений

      Проблема качественного соединения встроенной платы компьютера с внешними устройствами остро стоит перед производителями уже много лет. Спецификация PC-совместимых компьютеров оставляет на внешней планке платы для размещения всех соединений очень небольшое пространство. В то же время современные профессиональные устройства обязаны поддерживать самые разнообразные типы сигналов как видео (Composite, S-Video, YUV, RGB, DV, SDI), так и аудио (несимметричный, симметричный, AES/EBU, S/PDIF, TDIF) - всего более 30 соединений, причем с развитием новых видов вещания их число будет увеличиваться. Сложность проблемы заключается не только в высокой (и все возрастающей) плотности вывода контактов на задней планке и не только в исключении их взаимного влияния (наводок), но также в размещении на самой плате нужных микросхем приема и обработки (оцифровки, кодирования) соответствующих сигналов и, в конце концов, в обеспечении последующей надежной работы. Ведь известно, что наиболее часто возникающая при эксплуатации неисправность - "сгоревшие" входы-выходы (не менее 50% из них - композитные).
      Известны различные подходы к решению задачи соединений. Наиболее прямой и дешевый - встраивание в заднюю планку специального разъема высокой плотности (до 40 контактов) и комплектация платы соответствующим "хвостом" кабелей. Недостатки этого подхода общеизвестны: частичное отражение принимаемых электрических сигналов из-за невозможности полного согласования входных импедансов, неизбежные наводки по общей "земле", неудобство эксплуатации тяжелого и негибкого "хвоста" (при частых соединениях возникает опасность механического повреждения разъема на плате или проводки в одном из кабелей), дороговизна изготовления такого "хвоста" (как правило, требующего ручной пайки). В развитие данного метода можно использовать различные BOB, где собственно и размещаются все необходимые разъемы. Такой BOB является своеобразным пассивным удлинителем, делающим более удобным и безопасным соединение платы с внешней аудио- и видеоаппаратурой. Однако с точки зрения качества передачи сигналов для него характерны те же проблемы.
      Существенно более прогрессивным является применение активного BOB, в который вынесена часть необходимых операций обработки входных и выходных сигналов: их прием, аналого-цифровые преобразования, фильтрация и декодирование. В этом случае передача информации между BOB и платой вне зависимости от конкретного типа внешнего сигнала осуществляется уже в едином цифровом виде (например, компонентный для видео и симметричный для аудио). Размеры BOB позволяют развести цепи обработки аналоговых сигналов и обеспечить хорошее качество их приема и преобразования. Вследствие такого подхода плата освобождается от рутинных операций оцифровки и приобретает пространство для размещения дополнительных специализированных микросхем - вычислительных блоков эффектов. Привлекает и унификация устройств: один и тот же BOB в дальнейшем можно использовать для "подготовки" сигналов для других плат или, наоборот, для расширения списка поддерживаемых сигналов (внешних устройств). Чтобы повысить точность их преобразования, достаточно к имеющейся плате подсоединить новый BOB. Следующим шагом в этом направлении становится возможность принимать в одном BOB как аналоговые, так и цифровые сигналы. Наряду с удобством соединения это позволит осуществлять в рамках BOB преобразования типов сигналов, например, из сигналов SDI получать аналоговое компонентное видео, из     S-Video - SDI и т. д.
      Именно такая концепция активных BOB и реализована в семействе T3K, причем в настоящее время разработано три различных устройства - Pro Analog BOB, Pro Digital BOB и Pro Digital & Analog BOB, производящие ввод-вывод только аналоговых, только цифровых и обоих типов сигналов соответственно. Здесь особенно важен интерфейс передачи цифровых данных между BOB и T3K. На первый взгляд согласно стандарту SMPTE 259M достаточно обеспечить последовательный цифровой интерфейс SDI с пропускной способностью 270 Мбит/с. Однако в будущем телевидение высокой четкости (SMPTE 292M) потребует уже 1,485 Гбит/с. Именно это значение, причем в обе стороны, специалисты Pinnacle Systems и заложили в новом типе цифрового интерфейса, названного Digital Tether (цифровая перевязь). Он может функционировать в двухканальном режиме на стандартной частоте 27 МГц или в одноканальном, но уже на 74,25 МГц (необходимой для ТВЧ). При этом каждый канал видео имеет информационную глубину квантования 10 бит и дополнительно несет до 16 каналов аудио (16, 20 или 24 бит) и один канал с данными о тайм-коде (VITC) и служебной информацией.
      Как уже отмечалось, в T3K пока задействован только один порт связи с Digital Tether, зато в двухканальном режиме. А вот ее "сестрица" TARGA Cine (CineWave), разработанная для Mac G4, уже поддерживает два порта, каждый из которых обеспечивает и двухканальную, и одноканальную (ТВЧ) связь. Впрочем, описание возможностей действительно интересной платы TARGA Cine уже выходит за рамки настоящей статьи. В заключение лишь еще раз подчеркнем, что как видеопроцессор HUB3, так и интерфейс Digital Tether разработаны с большим запасом на будущее, с учетом появления в скором времени новых, еще более мощных и совершенных устройств.



	TBS Copyright ©2003 (095) 737-7440 (многоканальный) (10:00 - 18:00)

TARGA3000:Эволюция плат нелинейного монтажа

Архитектура обработки

Блок внешних соединений

TARGA3000:
Эволюция плат нелинейного монтажа