stat
 
 
 
 
 
 
 
  TBS - Журнал Цифровое Видео    
Скидки
Разделы форума
Системы нелинейного
монтажа
Общие вопросы
Видеооборудование
Аудиооборудование
Светофильтры
Осветительное
оборудование
Барахолка
Поиск по архиву

Режим: "и" "или"
Избранное
Архив журнала
Цифровое Видео
#4 #5 #6
  #1 #2 #3
#4 #5 #6
  #1 #2 #3
#4 #5 #6
  #1 #2 #3
#4 #5 #6
  #1 #2 #3
#4 #5 #6
  #1 #2 #3

Процессоры нового тысячелетия

Джим Фили

Процессоры становятся мощнее, быстрее, умнее

      Новое поколение микропроцессоров знаменует эпоху новых возможностей для рабочих станций. У этих новых процессоров есть общие черты, например высокая тактовая частота. Но более интересно, что в большинстве из них на одном чипе с процессором устанавливается весьма большой кэш второго уровня. У многих вместо обычных 32-битных трактов данных используются 64-битные. Кроме того, многие процессоры содержат специализированные наборы команд для параллельной обработки видео, трехмерных объектов и звука, т. е. тех данных, с которыми в основном работают профессионалы цифрового видео.
      Хотя традиционный источник скорости - высокая тактовая частота - не забыт, новые рубежи для процессоров лежат в сфере параллельной обработки. K7/Athlon фирмы AMD, G4 фирмы Motorola и Pentium III фирмы Intel позволяют связывать вместе несколько процессоров в многопроцессорных компьютерах с параллельной обработкой. Однако главное нововведение новых чипов - богатые наборы инструкций обработки мультимедиа, которые одновременно применяют одни и те же операции ко многим битам данных.
      К сожалению, многие ведущие разработчики программ цифрового видео подписали соглашения с разработчиками процессоров, пообещав не обсуждать вопрос о том, как эти новые чипы повлияют на производительность программ. Но мы располагаем сведениями от производителей чипов.

AMD K7/Athlon

      Фирма Advanced Micro Devices (www.amd.com) долгое время концентрировалась на компьютерах нижнего ценового сектора потребительского рынка, однако ее новый процессор Athlon (прежнее условное название - K7) соответствует потребностям профессионалов видео. Планируя начать поставки процессоров со скоростями более 500 МГц этим летом1, фирма AMD заявляет, что ее чипы, выпускаемые по 0,25-микронной технологии, будут обеспечивать производительность примерно на 40% выше, чем процессоры Pentium III с равной тактовой частотой.
      Athlon использует 128-килобайтный встроенный кэш первого уровня, блок конвейерной обработки чисел с плавающей точкой и усовершенствованный интерфейс кэша второго уровня. Athlon поддерживает также многопроцессорную обработку. Он использует специальный набор команд 3DNow, предназначенный для ускорения обработки цифровых мультимедийных данных.
      3DNow впервые был применен в чипах K6-2 фирмы AMD. В процессоре Athlon к ранее реализованной 21 команде AMD добавила 19 инструкций типа SIMD (одна команда - много данных) работы с целочисленными данными и пять новых функций управления цифровой обработкой сигналов. AMD заявляет, что реализация операций с плавающей запятой даже превосходит реализацию потоковых расширений SIMD (SSE) в процессорах Pentium III.
      AMD утверждает, что Athlon 550 МГц обеспечивает производительность при обработке мультимедиа на 100-150% быстрее, чем процессор Xeon 550 МГц. Однако, чтобы воспользоваться этой скоростью, разработчики должны модифицировать свои программы, включив в них команды AMD. Если же просто использовать программы, усовершенствованные для команд SSE Pentium III фирмы Intel, никакого ускорения от 3DNow обнаружить не удастся.
      Более того, системная шина Athlon физически несовместима с линией продуктов Intel. Athlon подключается к материнским платам через интерфейс шины EV-6 Alpha 200 МГц. EV-6 несовместим с Slot 1, однако шина EV-6 используется процессором Alpha 21264, разработанным подразделением Digital фирмы Compaq. Это означает, что Athlon нельзя установить на материнскую плату, предназначенную для Pentium, однако разработчики материнских плат уже представили на рынок модели, которые позволят выбирать между установкой дочерних плат с процессорами Athlon или Alpha 21264. В 2000 г. AMD планирует перейти к 0,18-микронной технологии, которая позволит Athlon достичь тактовых частот более 1 ГГц.

PowerPC G4

      Как и выпускаемые фирмой Motorola PowerPC G3, PowerPC G4 - 32-битные процессоры, однако в них используется 128-битная шина данных - вдвое шире 64-битной внутренней шины G3. Поэтому G4 может передавать 1,6 Гбайт данных через 100-мегагерцевую системную шину. G4 поддерживает кэш второго уровня размером до 2 Мбайт. Эти чипы полностью поддерживают симметричную мультипроцессорную обработку, а это значит, что мы, возможно, увидим возвращение многопроцессорных компьютеров Mac OS.
      Кроме блоков вычислений с плавающей запятой и целочисленных вычислений G4 содержит блок вычислений AltiVec (см. рис. 1). Команды AltiVec, разработанные фирмой Motorola, предназначены для увеличения производительности программ, которые могут обрабатывать данные в параллельном режиме. Среди них - программы работы с видео, пространственными объектами и звуком.
      Вместо того чтобы обрабатывать пиксели один за другим, процессоры AltiVec G4 могут выполнять определенные операции над 16 пикселями сразу. Motorola утверждает, что критические для цифрового видео вычисления на AltiVec выполняются гораздо быстрее, чем на G3, работающем с той же тактовой частотой.
      Например, Motorola заявляет, что преобразование RGB->YCbCr (ITU-R.BT 601) на AltiVec выполняется в 9,6 раза быстрее, чем на процессоре PowerPC G3. Аналогично вычисления DCT, используемые при кодировании и декодировании JPEG и MPEG, совершаются в 4-11 раз быстрее. Фирма заявляет, что по производительности AltiVec превосходит многие специализированные чипы цифровой обработки сигналов. Motorola утверждает, что AltiVec ускорит обработку OpenGL, кодирование JPEG и MPEG, применение видео- и аудиофильтров и другие подобные вычисления.
      Чтобы полностью задействовать преимущества AltiVec, коды программ надо переписать или хотя бы перекомпилировать. Однако Apple оптимизирует под AltiVec QuickDraw и QuickTime, так что многие существующие программы, основанные на этих технологиях, ускорят работу с появлением AltiVec Mac без каких-либо изменений кода.
      Некоторые разработчики Macintosh, с которыми мы говорили, отказались сообщить, насколько AltiVec ускорит работу их программ, видимо, по соображениям сохранения коммерческой тайны. Однако информация, публикуемая Apple, свидетельствует о том, что применение AltiVec оправдает дополнительные усилия разработчиков.
      Apple утверждает, что AltiVec обеспечит большую производительность и по сравнению с MMX, и по сравнению с Katmai. Что касается реальных оценок, Apple заявляет, что Adobe Photoshop на G4 будет работать в полтора раза быстрее, чем на G3 с той же тактовой частотой.
      Хотя фирма IBM в настоящее время предлагает 32-битные чипы PowerPC с тактовой частотой 580 МГц, неясно, собирается ли Apple их использовать. В ближайшем будущем IBM не планирует заниматься расширениями PowerPC типа AltiVec, а сосредоточится на повышении тактовой частоты процессоров PowerPC. Фирма считает, что процессоры будут работать быстрее без расширения их архитектуры, а чипы PowerPC с переходом с алюминия на медь смогут работать со скоростью до 1,1 ГГц.
      Фирмы IBM и Motorola недавно согласовали общую архитектуру для будущих чипов PowerPC, допускающую 64-битную обработку и программно-специфические расширения стандартного набора команд PowerPC. Это соглашение под названием Book E позволяет каждому производителю расширять стандартный чип PowerPC, чтобы улучшать определенные его возможности, в случае AltiVec - обработку мультимедиа-данных и цифровую обработку сигналов.
      Motorola, в соответствии с положениями Book E, реализует AltiVec как дополнительный компонент процессора PowerPC. Многие заказчики IBM хотели бы, чтобы фирма разработала свой вариант технологии AltiVec.
      Что касается дальнейших планов, в 2000 г. ожидается появление процессоров G4 с тактовой частотой более 600 МГц, интегрированным кэшем второго уровня и поддержкой кэшей третьего уровня. Далее, ходят слухи о 800-мегагерцевых чипах, планируемых на 2001 г. Хотя Book E определяет 64-битную реализацию архитектуры PowerPC, ни IBM, ни Motorola пока не обнародовали никаких планов выпуска подобных процессоров PowerPC. Дополнительную информацию о PowerPC, AltiVec и Book E можно найти на сайтах http://motorola.com/PowerPC; www.chips.ibm.com/products/powerpc; http:/developer.apple.com/hardware/altivec/index.html.

Что такое SIMD?

      И Katmai фирмы Intel, и AltiVec фирмы Motorola, и 3DNow фирмы AMD, и VIS фирмы Sun - это наборы команд типа SIMD. SIMD (Single-instruction stream, multiple-data stream - один поток команд, много потоков данных) - один из четырех типов, введенных для классификации архитектуры компьютеров Майклом Флинном в 1966 г. Остальные типы - SISD, MISD и MIMD.
      Поток команд, по Флинну, - это последовательность операций, которые выполняет компьютер. Поток данных - это последовательность элементов, к которым применяются эти команды. Большинство процессоров рабочих станций обрабатывают данные последовательно, некоторые в ограниченных пределах используют параллелизм. Архитектура SIMD предназначена для одновременной обработки большого числа элементов. Коротко говоря, когда вам надо применить одинаковые вычисления к большому массиву данных, архитектура SIMD позволяет одному процессору вести операции параллельно.
      Видео, трехмерная графика и звук содержат большие массивы данных, которые часто требуют одинаковой обработки. Например, при сжатии видео и преобразовании его в формат MPEG, или при эквалайзинге звуковой дорожки один и тот же алгоритм применяется к тысячам битов данных. Процессоры с командами SIMD обеспечивают при этом ускорение, подобное тому, которое раньше достигалось применением специализированных сопроцессоров цифровой обработки сигналов. Когда на многих компьютерах стало использоваться цифровое видео, разработчики процессоров сочли, что ускорение его обработки заслуживает затраченных усилий.

Intel Pentium III

      Новый процессор Pentium III фирмы Intel (www.intel.com) по существу - процессор Pentium II с тем же 512-килобайтным кэшем второго уровня и 100-мегагерцевой системной шиной. Однако в PIII добавлены 70 новых команд с плавающей запятой - набор SSE, который и отличает PIII от его предшественников. Эти команды типа SIMD могут обрабатывать несколько элементов данных одновременно, что означает существенное ускорение работы с пространственными объектами, изображениями и звуком.
      Однако, чтобы полностью использовать возможности команд SSE, программы придется оптимизировать. Неоптимизированные программы не будут работать на системах PIII быстрее, чем на PII. Чтобы избежать дефицита оптимизированных компиляторов, что в свое время замедлило признание MMX, фирмы Intel и Microsoft предлагают низкоуровневые компиляторные средства, оптимизирующие код под новый набор команд. Фирма Intel сообщает, что она стремится к тому, чтобы выпускаемый разработчиками код в полной мере использовал преимущества новых команд SIMD.
      Intel планирует и далее развивать линию процессоров PIII. Следующие чипы Coppermine PIII будут функционировать с частотой 600 и 533 МГц. На конференции разработчиков в феврале Intel продемонстрировала чип PIII, разогнанный до 1 ГГц. В 2000 г. ожидается выпуск процессоров PIII Foster с частотой 1 ГГц и большими интегрированными кэшами первого и второго уровней.

Intel IA-64

      Кроме линии 32-битных процессоров Pentium III, к моменту, когда вы будете читать эту статью, вероятно, фирма Intel представит долгожданную архитектуру IA-64 (т. е. Intel Architecture-64 bit). Первый чип IA-64 под условным названием Merced будет иметь трехуровневую кэш-память. У исполняющего ядра предусматривается свой кэш нулевого уровня. Кэш первого уровня - интегрированный; на том же картридже, что и процессор, устанавливается отдельный чип с многомегабайтным кэшем второго уровня. Эти чипы будут также использовать новую архитектуру EPIC (Explicitly Parallel Instruction Computing - вычисления с явным заданием параллельных команд), которая, как заявляет Intel, повышает производительность при той же тактовой частоте.
      EPIC для ускорения параллельной обработки применяет не только аппаратные средства, но и особый режим компиляции программ (см. рис. 2). Большинство современных процессоров выявляют возможность параллельного выполнения аппаратно. Однако Intel заявляет, что процессор часто не может определить такую возможность, поскольку ресурсы чипа, которые могли бы использоваться для выполнения команд, приходится расходовать на сортировку возможностей параллельной обработки. Для систем IA-64 компилятор программ явно задает параллелизм в программе при ее компиляции. Intel утверждает, что при этом создается код, полностью реализующий преимущества параллелизма на уровне команд и позволяющий не тратить лишние циклы процессора при выполнении. Intel должна будет тщательно отладить и широко распространить такую технологию компиляции.
      Скорость работы памяти существенно ниже, чем скорость процессора, поэтому, чтобы данные загружались из памяти как можно раньше, IA-64 применяет технику прогнозирования, которая позволяет выбирать данные из памяти предварительно - до того, как они понадобятся процессору. Чип содержит также несколько блоков вычислений с плавающей точкой и поддерживает SIMD. Благодаря сочетанию возможностей компиляторов IA-64 и Merced, последний сможет достичь на задачах работы с пространственными объектами производительности, в несколько раз превышающей производительность PIII.
      После Merced в 2001 г. намечается выпуск процессора McKinley с частотой более 1 ГГц и производительностью вдвое большей, чем у Merced. В 2002 г. Intel планирует переход на 0,13-микронную технологию, по которой будет выпускать процессор Madison.

Sun UltraSPARC

      Процессоры линии UltraSPARC RISC фирмы Sun Microsystems (www.sun.com) используются во многих мощных серверах Internet. Однако Sun хотела бы продвинуть свои процессоры и рабочие станции и в системы цифрового видео.
      Sun производит три различные линии процессоров UltraSPARC. Масштабируемые процессоры серии S предназначены для рабочих станций и серверов; в 1999 г. Sun выпустит процессоры UltraSPARC IIs 480 МГц и UltraSPARC III с частотой от 600 до 750 МГц.
      Интегрированные процессоры серии I предназначены для недорогих однопроцессорных систем. В этом году ожидается выпуск чипов UltraSPARC IIi 400, 440 и 480 МГц.
      В 1996 г. фирма Sun ввела для UltraSPARC SIMD-расширения VIS (Visual Instruction Set). VIS ускоряет работу с видео, трехмерной графикой, сжатие видео и звука и повышает производительность Java без необходимости переписывать или перекомпилировать программы.
      Благодаря VIS UltraSPARC может работать с MPEG-2 или с видео в другом цифровом формате без дополнительных аппаратных ускорителей. VIS способен ускорять некоторые алгоритмы работы с мультимедиа в семь раз и на процессоре с частотой 200 МГц выполняет до 2 млрд операций в секунду.
      Программы, использующие OpenGL, получают выгоду от VIS автоматически, поскольку Sun оптимизировала свои базовые библиотеки. Компоненты операционной системы Solaris также оптимизированы для VIS, поэтому от применения VIS в некоторой степени выиграют все программы и все пользователи UltraSPARC.
      После 1999 г. Sun планирует ввести 0,07-микронную технологию, которая позволит производить чипы с частотами более 1 ГГц. Процессоры UltraSPARC IV с частотой 1 ГГц планируется выпустить в 2000 г., а UltraSPARC V 1,5 ГГц - в начале 2002 г.

MIPS

      Хотя компания SGI (www.sgi.com) собирается использовать в своих продуктах линий NT и IRIX процессоры Intel IA-32 и IA-64, она не оставила и планов построения новых компьютеров на основе архитектуры MIPS. За недавно объявленными системами Octane на основе процессоров R12000 должны последовать два новых поколения процессоров MIPS. SGI пока считает жизнеспособными свои IRIX OS и архитектуру систем. SGI планирует выпускать параллельно и системы на перспективных процессорах MIPS, и системы на основе процессоров IA-64.
      В конце 1999 г. SGI рассчитывает предложить рабочие станции с процессорами MIPS R12000, работающими на частоте 390 МГц. В 2000 г. системы на базе процессоров R14000 достигнут частоты 450 МГц. R14000 будет поддерживать кэши SRAM с удвоенной скоростью передачи данных, а внешняя шина работать на частоте 200 МГц - вдвое быстрее сегодняшней шины R12000.
      Процессор R16000, выпуск которого намечается на 2001 г., будет работать на частоте от 600 до 800 МГц, содержать 64-килобайтные кэши первого уровня для команд и для данных и поддерживать внешние кэши второго уровня объемом от 4 до 8 Мбайт. Представители компании говорят также о последующем выпуске процессора R18000.

Alpha

      Подразделение Digital (www.digital.com) фирмы Compaq недавно представило свой процессор 21264 Alpha. Начальные версии этого 64-битного процессора работают со скоростью более 500 МГц; в конечном счете планируется достичь скоростей более 800 МГц. Как мы уже говорили, процессор 21264 соединяется с материнской платой через разработанную Digital шину EV-6, которую использует также процессор Athlon фирмы AMD. Это создает интересную возможность производства недорогих рабочих станций на основе процессора Athlon, который при апгрейде можно будет заменить на Alpha. На 2000 г. Digital намечает выпуск процессора нового поколения 21364 (другое название - EV-7), в первую очередь рассчитанного на серверы.
      Первые процессоры 21364 будут работать на частоте 750 МГц, в конечном счете с переходом на 0,18-микронную технологию планируется достичь частоты 1,2 ГГц. В новых процессорах Alpha будут применены методы прогнозирования, подобные реализованным в процессорах IA-64 фирмы Intel. В 21364 предусматриваются четыре блока целых вычислений и два блока вычислений с плавающей точкой.
      Процессор 21364 будет содержать интегрированный кэш второго уровня, контроллер памяти и блок ввода/вывода. Такие особенности обычны для некоторых недорогих чипов, но, если в них объем кэша составляет около 100 Кбайт, интегрированная память 21364 составит 1,5 Мбайт. Интегрированный контроллер памяти и сетевой интерфейс позволят устанавливать в один сервер до 256 процессоров 21364. Digital рассчитывает, что 21364 обеспечит производительность до 70 SPECint95 и 120 SPECfp95 при частоте более 1 ГГц.
      В 2001 г. Digital планирует выпуск чипа EV-8 по 0,13-микронной технологии.

Больше скорость, больше производительность

      Все эти достижения означают, что рабочие станции цифрового видео будут работать еще быстрее. Однако значит ли это, что мы сможем быстрее разрабатывать, монтировать и выводить свои проекты? Вовсе не обязательно. Подобно тому, как с ростом доходов растут и расходы, сложность разработки и проектирования возрастут с увеличением доступных ресурсов.
      Новые процессоры будут применяться в телевидении высокой четкости, работе с большим числом слоев, большим количеством полигонов для создания более реалистичного изображения. Профессионалы цифрового видео сумеют загрузить новые процессоры на полную мощность.
      Один инженер рассказал о своих исследованиях истории компьютерной анимации. Когда-то художники задавали небольшое количество полигонов, чтобы рендеринг одного кадра занимал около девяти минут - больше у них не было терпения ждать. С развитием вычислительной мощности художники наращивали число полигонов, улучшали блюр по движению и т. п. Но и с появлением новых средств художника ограничивает вовсе не воображение, а терпение. Как сказал этот инженер, рендеринг кадра современной анимации по-прежнему занимает девять минут

"Русский след" на дороге в новое тысячелетие

Виктор Бабурин

      Анализ состояния дел на процессорном рынке, особенно на страницах немикропроцессорного издания, рискует завести читателя в области, далекие от его интересов. Однако с учетом роста популярности новых технологий и в особенности с ростом зависимости кино- и видеопроизводства от этих технологий обзор Джима Фили можно считать лучом света в царстве компрессии и декомпрессии.
      Нижеследующий комментарий можно назвать "русским ответом нашим западным коллегам", условно разделенным на пролог, интригу и послесловие.

Пролог

      Технология SIMD (младшая сестра EPIC), совершающая победное шествие на Западе примерно с 1992-93 гг., была разработана в СССР, в Институте точной механики и вычислительной техники им. С.А.Лебедева в 1978 г. Этот проект назывался "Эльбрус-1", руководил им Борис Бабаян.

Интрига

      Пункт 1. Одним из сотрудников Бориса Бабаяна с 1978 по 1991 г. был Владимир Пентковский. Помнится, как была удивлена компьютерная общественность, когда фирма Intel в 1994 г. сменила привычный ряд 86-186-...-486 на Pentium. Мотив - революционное изменение архитектуры CPU. Мы поверили Intel. Жаль, что микропроцессорный гигант не сообщил нам, кто разработал этот революционный процессор. Справедливости ради надо отметить, что фамилия Пентковского все-таки появилась в Intel Technology Journal Q2 в 1999 г., но уже как автора Pentium III.
      Пункт 2. В период с 1989 по 1991 г. институт Б.А. Бабаяна вел активные переговоры о сотрудничестве с Hewlett-Packard и Sun. Обе американские фирмы получили исчерпывающую информацию о проекте "Эльбрус-3", над которым тогда работали советские математики. Выбор был сделан в пользу Sun, что, кстати, привело к появлению в линейке последней процессоров серии UltraSPARC. Однако с 1992 г. Hewlett-Packard начала вести переговоры с Intel. Цель - найти достойное применение материалам проекта "Эльбрус-3". Результат - процессор Merced (IA-64) - совместная разработка HP+Intel.

Послесловие

      Значительно переработанный "проект Эльбрус" (ныне известный как "Эльбрус-2000", или Е2К) сейчас (с апреля 1999 г.) финансируется г-ном Ю.М. Лужковым. Если ничего сверхпечального не произойдет, в 2001 г. выйдут в свет первые экземпляры Е2К, который при делении на восемь дает Pentium, а при делении на три - Merced. Можно добавить, что полный объем преимуществ Е2К больше, чем эти простые сравнения. Все пикантные подробности на www.elbrus.ru.