Leadtek WinFast PxVC1100 | Введение
Sony, Toshiba и IBM вряд ли серьёзно думали о том, чтобы использовать микропроцессор Cell в ПК на основе Windows. Если вы не знакомы с архитектурой Cell Broadband Engine Architecture, то вам наверняка будет интересно узнать, что она широко распространена на потребительском рынке, будучи платформой CPU в игровой приставе PlayStation 3. По своей сути процессор Cell является очень мощным компонентом, и каждая Sony PS3 имеет производительность около 240 GFLOPS (числа с плавающей запятой одинарной сложности).
Конечно, гигафлоп, то есть один миллиард операций с числами с плавающей запятой в секунду, это не идеальное средство измерения, поскольку у разных процессоров есть свои сильные и слабые стороны. Впрочем, число гигафлопов всё равно даёт базовую идею о вычислительных возможностях Cell. Когда мы писали эту статью, то второй по производительности суперкомпьютер в мире, а именно IBM Roadrunner, использовал комбинацию 12 960 процессоров Cell и 6912 процессоров Opteron.
Тройка Sony, Toshiba и IBM совместно разработала архитектуру Cell Broadband Engine Architecture. Но Toshiba смогла модифицировать процессор Cell в чип, который более подходит для мультимедийной обработки, сохранив половину из восьми синергетических процессорных элементов Cell SPE (synergistic processor element) и добавив аппаратные блоки кодирования и декодирования видео. В результате получился процессор SpursEngine.
Потребляя всего 10-20 Вт, процессор SpursEngine прекрасно подходит для роли сопроцессора для обработки видео и 3D. Благодаря четырём процессорным элементам SPE, работающим на 1,5 ГГц, движок SpursEngine имеет производительность около 50 GFLOPS и при этом он поддерживает вычисления с 8/16/32-битными целыми числами и числами с плавающей запятой одинарной и двойной точности. Процессор оснащён одним мегабайтом локальной памяти, 256 кбайт которой выделены на каждый из четырёх SPE.
Знаем, знаем: вы наверняка думаете о том, что звучит это хорошо, но зачем этот процессор нужен вам лично? Что ж, компания Leadtek задалась тем же вопросом и разместила процессор SpursEngine на карте перекодирования видео под названием WinFast PxVC1100.
Мы протестировали эту карту с процессором SpursEngine, чтобы проверить её возможности. В данной статье мы сравним её производительность с разными CPU из разных ценовых сегментов. И попытаемся ответить на вопрос, во что лучше вложить заработанные тяжким трудом деньги: в карту WinFast PxVC1100 или в апгрейд центрального процессора?
Leadtek WinFast PxVC1100 | Внешний вид и комплект поставки
WinFast PxVC1100 имеет длинное название, но сама карта довольно короткая. Действительно, длина составляет меньше 18 см, при этом профиль у карты половинный, то есть она легко уместится в низких корпусах (в комплект поставки входит соответствующая слотовая заглушка). Обратите внимание на компактный интерфейс PCI Express (PCIe) x1, который наглядно говорит о том, что карте не требуется существенная пропускная способность для выполнения всех функций.
Благодаря небольшому кулеру и четырёхконтактному разъёму дополнительного питания WinFast PxVC1100 можно легко спутать с видеокартой начального уровня – по крайней мере, до тех пор, пока вы не увидите пустую слотовую заглушку.
На web-сайте Leadtek указаны три версии WinFast PxVC1100. Первая не имеет программного обеспечения в комплекте поставки, если не считать плагина Adobe Premiere (впрочем, мы не обнаружили эту версию в продаже на международном рынке). Вторая карта содержит довольно обширный комплект поставки, включающий Ulead VideoStudio 11 Plus, DVD MovieFactory 5 и WinDVD 8, в магазине Newegg она продаётся по цене $185. Третья карта поставляется с программой Pegasys TMPGEnc 4.0 XPress по цене $290 на Newegg.
Полученный нам образец относился к третьему виду, то есть в комплекте поставки мы обнаружили программу TMPGEnc 4.0 XPress. Кроме CD с драйвером и программным обеспечением, вместе с картой поставляется руководство пользователя, слотовая заглушка половинной высоты, а также переходник питания Molex.
Leadtek WinFast PxVC1100 | Установка и работа с картой
Установка не представляет каких-либо проблем. Достаточно установить карту в свободный слот PCIe x1, после чего подключить к ней четырёхконтактный разъём питания. Конечно, в жизни ничего не бывает просто, и после установки карты на разные платформы у нас появилось несколько нареканий.
Что касается платформ на процессорах AMD, то сообщить особо не о чем. Нас предупредили, что новые чипсеты Intel (конкретно X58) не будут работать с картой на основе SpursEngine, если только вы не найдёте слот PCIe, который не подключён к соединению QuickPath (QPI). Другими словами, карту нужно устанавливать в слот, подключённый к южному мосту ICH. Представитель Pegasys сообщил нам следующую информацию, касающуюся проблемы, описанной Leadtek.
“PxVC1100 не будет работать с северным мостом X58 (от которого обычно выводятся слоты PCIe x16), но будет работать с южным мостом (ICH10, который обычно отвечает за слоты x4 или x1). Причина кроется в проблеме протокола PCIe, и у Toshiba на данный момент нет готового исправления.”
Это означает, что вам потребуется материнская плата, которая использует чипсет ICH10 (или PCH, подобный P55 или H55/57) для подведения, по крайней мере, одного слота PCIe. В наших тестах мы использовали карту WinFast на материнской плате Gigabyte P55-UD4P, но не смогли запустить карту на материнской плате ASRock X58 SuperComputer без краха, поскольку на ней нет слотов PCIe 1x или 4x. Следовательно, мы не смогли провести тестов кодирования с аппаратным ускорением на нашем процессоре Core i7-920 (в нашем распоряжении не было другой свободной материнской платы на X58).
Если вы не столкнётесь с такими же проблемами X58, как в нашей системе, то всё остальное пройдёт гладко и без запинок. Драйверы, плагин SpursEngine и программное обеспечение успешно установились с CD в комплекте поставки.
Как мы уже упоминали выше, наш тестовый образец поставлялся вместе с известной программой Pegasys TMPGEnc 4.0 XPress. Мы хорошо знакомы с этой утилитой, поскольку наша тестовая лаборатория использует её многие годы в тестах.
Впрочем, для аппаратного ускорения кодирования через карту WinFast утилита TMPGEnc использует несколько другие настройки по сравнению с обычным кодированием. Вместо выбора финального формата вывода для аппаратного ускорения требуется выбрать опцию вывода SpursEngine. Затем внутри можно выбирать настройки кодека, который нам требуется, хотя выбор органичен возможностями экспорта в форматы MPEG-2 и MPEG-4. Это даёт свободу выбора всех важных форматов, включая DVD и Blu-ray, так что в этом отношении жаловаться не на что.
Кроме прироста скорости от аппаратного ускорения, у SpursEngine есть ещё один “козырь в рукаве”: алгоритм супер-разрешения Toshiba. Компания Toshiba заявляет, что эта технология может эффективно масштабировать картинки и видео стандартного разрешения в HD с намного большей чёткостью, чем традиционные технологии масштабирования. Что ж, мы протестируем и эту возможность.
Единственное разочарование по поводу супер-разрешения касается того, что эта возможность очень сильно ограничена только штатными настройками кодирования – доступно только четыре настройки вывода Blu-Ray и MPEG. Например, если изменить частоту кадров выходного файла из значения по умолчанию, то опция супер-разрешения станет уже недоступной. Это значительно ограничивает пользу от супер-разрешения.
Leadtek WinFast PxVC1100 | Тестовая конфигурация
Для сравнения мы выбрали несколько CPU, от двуядерных моделей дешевле $100 до топовых процессоров Intel Core i7. Мы протестировали эти процессоры как с картой WinFast PxVC1100, так и без неё, чтобы найти оптимальный вариант по соотношению цена/производительность. Мы хотели узнать, стоит или нет карта WinFast тех денег, которые за неё просят. Кроме того, нам было интересно, нужен ли карте SpursEngine определённый уровень производительности CPU, чтобы показать себя в лучшем свете.
Обратите внимание, что мы проводили тесты системы с установленной видеокартой GeForce GTX 260. Дело в том, что изначально мы планировали сравнить возможности вычислений на GPU GeForce CUDA с кодированием через CPU и карту PxVC1100. К сожалению, мы узнали о том, что улучшения CUDA в TMPGEnc. 4.0 Xpress ограничены только фильтрами видео, поэтому их не получится использовать для ускорения перекодирования видео из одного формата в другой. По этой причине мы не стали включать ускорение фильтров через CUDA в нашу статью, поскольку нас больше интересовала польза от аппаратного ускорения перекодирования разных форматов.
Как мы упоминали выше, мы не смогли заставить работать карту WinFast с нашей материнской платой ASRock на основе Intel X58. Впрочем, процессор Core i7-920 всё равно представляет наш топовый вариант по производительности, поэтому наши тесты покажут, сможет ли этот мощный процессор конкурировать с дешёвым CPU, усиленным аппаратным ускорением SpursEngine.
Тестовая система AMD | Тестовая система Intel (A) | Тестовая система Intel (B) | |
CPU | Athlon II X2 250, (3,0 ГГц, без кэша L3) Athlon II X4 620, (2,6 ГГц, без кэша L3) Phenom II X4 965, (3,4 ГГц, кэш L3 6 Мбайт) |
Intel Core i5-750 2,66 ГГц, четыре ядра, кэш L3 8 Мбайт | Intel Core i7-920 2,66 ГГц, четыре ядра, 4,2 GT/s QPI, кэш L3 8 Мбайт |
Материнская плата | Asus M4A785TD-M EVO, AMD 785G, BIOS 0910 | Gigabyte P55-UD4P LGA-1156, Intel P55-Express, BIOS F5 | ASRock X58 SuperComputer, Intel X58, BIOS P1.90 |
Память | Mushkin PC3-10700, 2x 2 Гбайт (4 Гбайт в сумме), CL 9-9-9-24 | 2 x A-Data 2,0 Гбайт DDR3-1333, 2 x 2 Гбайт (4 Гбайт в сумме), CL 9-9-9-24 | Kingston PC3-10700, 3 x 1 Гбайт (3 Гбайт в сумме), CL 9-9-9-22 |
Видеокарты | GeForce GTX 260, Asus ENGTX260, 796 Мбайт DDR3 PCIe |
||
Жёсткий диск | Western Digital Caviar Black 640 Гбайт, 7200 об/мин, кэш 32 Мбайт SATA 3,0 Гбит/с |
||
Блок питания | ePower EP-1200P10-T2, 1200 Вт, ATX 12V, EPS 12v |
||
Программное обеспечение и драйверы | |||
Операционная система | Microsoft Windows 7 Ultimate 64-bit |
Microsoft Windows Vista Ultimate 64-bit 6.0.6001, SP1 | |
Версия DirectX | DirectX 11 |
||
Графический драйвер | ForceWare 195.62 |
||
Утилита кодирования | TMPGEnc. 4.0 Xpress Version 4.7.3.292 |
||
Драйвер SpursEngine | 1.5.2.5 |
Leadtek WinFast PxVC1100 | Тесты и настройки
Конфигурация тестов |
|
Стандартное кодирование | MPEG 4 AVC, 720×480 Resolution, 23.976 FPS, Aspect ratio: 4:3, MPEG4 AAC Low Complexity 160 Kb/s Audio, GOP: 18 frames, Video Entropy Setting: CAVLC, Bitrate: 505.654 Kb/s |
Кодирование HD Upscale | MPEG 4 AVC, 1920×1080 Resolution, 29.97 FPS, Aspect ratio: 16:9, Dolby Digital 256 Kb/s Audio, GOP: 18 frames, Bitrate: 32,000 Kb/s |
Leadtek WinFast PxVC1100 | Результаты тестов
Leadtek WinFast PxVC1100 | Производительность кодирования
Мы начнём с тестов, которые, на наш взгляд, оценивают наиболее важную характеристику: скорость кодирования. Мы использовали пять CPU с помощью карты WinFast PxVC1100 и без неё, после чего получили следующий результат.
Синие полоски – программное кодирование на CPU. Бирюзовые полоски – с аппаратным ускорением WinFast PxVC1100.
Здесь можно сразу же сделать два вывода. Во-первых, утилита TMPGEnc 4.0 XPress умеет очень хорошо использовать преимущества многопоточности. Посмотрите, как низка производительность Athlon II X2 250, несмотря на высокую скорость 2,9 ГГц. Во-вторых, обратите внимание, насколько быстро WinFast PxVC1100 кодирует видео даже в паре с процессором Athlon II X2.
Вывод здесь следующий: если вы планируете собирать ПК, чья основная цель будет заключаться в кодировании видео, то преимущество по производительности карты WinFast PxVC1100 весьма сложно игнорировать независимо от CPU, который вы выберите для установки в компьютер. Даже самый медленный Athlon II X2 250 смог кодировать видео за семь с половиной минут с помощью аппаратного ускорения карты WinFast – по сравнению с пятью с половиной минутами у комбинации Core i5-750/WinFast PxVC1100. Для сравнения, Core i7-920 справился самостоятельно с тем же заданием за время чуть большее 11 минут – без помощи движка SpursEngine.
Мы посмотрим на соотношение цена/производительность чуть ниже, а пока что давайте оценим производительность масштабирования видео (upscaling), которая достигается на процессоре SpursEngine. Мы преобразовывали короткий ролик 720×480 в разрешение HD 1920×1080 при помощи CPU, карты WinFast, а затем с помощью карты WinFast, но уже с активной опцией супер-разрешения.
Активация супер-разрешения увеличила время кодирование более чем в два раза, что даже чуть превысило время кодирования только на CPU. Это вполне приемлемо, если итоговый результат приятно порадует, но если мы не получим заметного увеличения в качестве, то такой режим вряд ли можно назвать полезным.
Что ж, давайте посмотрим, какое качество мы получаем при кодировании программным способом по сравнению с аппаратным кодированием.
Leadtek WinFast PxVC1100 | Сравнение качества картинки
Сначала давайте рассмотрим результаты кодирования в стандартном разрешении программным способом по сравнению с аппаратным ускорением WinFast PxVC1100. Помните, что финальный результат, полученный двумя этими способами копирования, не является побитово идентичным. Конечно, мы можем контролировать скорость потока и некоторые другие характеристики, чтобы результат можно было сравнивать более менее достоверно, но в итоге файлы всё равно будут различаться. В любом случае, сравнение очень важное, поскольку если пострадает качество, то преимущество карты WinFast по скорости быстро потеряет всякий смысл.
Внимательно изучив кадры, мы обнаружили крайне малую разницу конечного результата. Если вы тщательно исследуете цвета однородных областей, то обнаружите разницу в сглаживании градиентов. Подобную слабую разницу практически невозможно заметить во время воспроизведения видео. Впрочем, хотя разница мала, на скриншотах её можно заметить.
Теперь давайте посмотрим на разницу между результатами при масштабировании видео (upscale) при использовании стандартного алгоритма и после активации опции супер-разрешения.
Здесь мы наблюдаем более ощутимую разницу, на консольном дисплее можно заметить некоторые артефакты повышения чёткости в версии, созданной с помощью супер-разрешения. На втором примере можно видеть, что некоторые детали проявляют себя чуть лучше, с более резкими кроями, подобно значку на униформе. У большинства объектов действительно резкие края.
Хотя стандартный способ кажется более сглаженным на статических скриншотах, версия с супер-разрешением оказалась более резкой и чёткой во время непосредственно воспроизведения видео. Опять же, версия с супер-разрешением иногда страдала из-за артефактов повышения чёткости во время воспроизведения видео, особенно на областях с мягкими кромками, таких как блики в объективе. В конечном счёте, всё это – дело вкуса. Но, в любом случае, приятно иметь опции, из которых можно выбирать подходящую лично для вас.
Кроме того, хотелось бы добавить, что производитель рекомендует опцию супер-разрешения для обработки любительской съёмки, где положительный эффект от неё будет более заметным.
Leadtek WinFast PxVC1100 | Тесты нагрузки на CPU и энергопотребления
Тесты нагрузки на CPU позволяют нам узнать, насколько сильно SpursEngine нагружает CPU.
Только двуядерный Athlon II X2 нагружает больше 60% своих ресурсов при использовании карты WinFast PxVC1100 для кодирования, а у всех четырёхъядерных процессоров явно есть свободный потенциал. Сравните это с кодированием исключительно на CPU, когда только процессору Core i7-920 удаётся использовать меньше 90% доступной вычислительной мощности.
Результаты впечатляют, то есть ПК с картой SpursEngine можно вполне комфортно использовать и для других задач во время кодирования. Решения, которые зависят только от CPU во время кодирования, вряд ли обеспечат подобное удобство. В этом, вне сомнения, кроется реальное преимущество WinFast PxVC1100.
Мы действительно смогли получить значительное уменьшение нагрузки на CPU во время кодирования, но как насчёт энергопотребления карты WinFast?
Карта WinFast крайне незначительно увеличивает энергопотребление системы. Хотя карта SpursEngine потребляет, по крайней мере, 10 Вт под нагрузкой (если судить по спецификациям), следует помнить, что CPU потребляет намного меньше энергии, когда дискретная карта берёт на себя часть нагрузки. В итоге мы получаем примерно такой же уровень энергопотребления, несмотря на существенный прирост производительности.
Leadtek WinFast PxVC1100 | Заключение
Производительность и энергопотребление впечатляют, но стоит ли WinFast PxVC1100 того, чтобы потратить на неё доступный бюджет? Или лучше взять более мощный CPU?
Чтобы дать осмысленную рекомендацию, позвольте рассмотреть реалистичный сценарий. Первое: мы должны считать, что кодирование видео является основной причиной для сборки вашего нового ПК. Если кодирование занимает небольшую часть среди ваших компьютерных задач, то вряд ли “железо”, подходящее исключительно для кодирования видео (то есть карта WinFast PxVC1100), должно устанавливаться в вашу систему. Впрочем, это вполне логично, и если вы читаете эту статью, то велики шансы, что вы занимаетесь кодированием видео.
Второе: мы должны признать, что утилита кодирования TMPGEnc 4.0 XPress – именно та, которую вы используете, и вы собираетесь купить её всё равно. Если учитывать цену $100 утилиты TMPGEnc, то цена карты WinFast PxVC1100 составит около $190. Если TMPGEnc не является вашим выбором, то лучше брать версию с другим комплектом ПО за $185. В любом случае, карта окажется одинаковой нагрузкой на ваш бюджет около $190.
Учитывая два указанных фактора, мы рассчитали примерное соотношение производительность/цена. Синие полоски означают соотношение производительность/цена только для CPU. А бирюзовые полоски – такое же отношение с учётом использования карты WinFast PxVC1100.
Результаты нас немало удивили: карта WinFast PxVC1100 довольно легко оправдывает свою цену. Это противоречит почти универсальному наблюдению: любители хорошего соотношения производительность/цена обычно не выигрывают при покупке дорогого специализированного оборудования. Синие полоски, которые отражают производительность только CPU, хорошо демонстрируют типичное соотношение высокая цена/низкая производительность. Видите, как падает производительность в расчёте на цену, когда CPU становится быстрее (и дороже)? Рост цены перевешивает увеличение производительности. Именно это мы и видим.
Но стоит добавить карту WinFast PxVC1100 для кодирования видео, как мы видим улучшение соотношения производительность/цена по сравнению с одним CPU. Добавление PxVC1100 к процессору Athlon II X4 620 даёт лучшее соотношение производительность/цена, чем в случае одного Athlon II X2 250. Самая эффективная по цене и производительности система в данном случае – это система на одном процессоре Athlon II X4 620 и карты SpursEngine. Конечно, одиночный Athlon II X4 620 даёт наилучшее соотношение производительность/цена, но оно снижается очень незначительно (а время кодирования уменьшается стремительно), когда к этому CPU добавляется карта WinFast PxVC1100.
Конечно, всё это касается нашего сценария и приложения, но результаты наглядно говорят о мощности процессора SpursEngine при выполнении задачи кодирования видео. Впрочем, если вы не выполняете кодирование регулярно, то всё же лучше потратить деньги на самый мощный CPU, который вы можете себе позволить (или, если вы геймер, то на более мощную видеокарту).
С учётом всего сказанного, если основная цель вашего ПК заключается в кодировании видео, то картаWinFast PxVC1100 будет полезной покупкой, она сэкономит время и снизит нагрузку на CPU, так что вы сможете использовать его ресурсы даже во время выполнения “тяжёлой” задачи кодирования. Если вы выполняете кодирование больших объёмов данных и у вас всего один ПК, уже одно это может стать весомым поводом для покупки карты, даже если не принимать во внимание прирост производительности.