Обзор Netstor TurboBox NA255A | Пространство для четырёх внешних GPU
Несмотря на то, что сегодня всё больше массовых приложений оптимизируются под стандарт OpenCL, позволяющий графическим процессорам обрабатывать общие задачи, всё же программы, оперирующие с GPU-ускорением, наиболее характерны для сегмента серверов и рабочих станций. Многие из них оптимизированы только под ядра CUDA, что ограничивает их работу графическими процессорами Nvidia. Однако OpenCL набирает обороты в сфере видеоредактирования, сжатия, работы с изображениями и bitcoin mining.
Когда в приоритете стоит максимальная вычислительная мощь, повысить производительность в таких приложения можно за счёт подключения нескольких GPU сразу. Четыре графических процессора в CrossFire или SLI могут реально увеличить скорость обработки совместимых задач. Мы говорим не только об играх. Было множество примеров, когда включение третей или четвёртой видеокарты в связку совсем не повышало частоту кадров, а иногда и напротив, понижало. Три или четыре карты чаще всего выбирают профессиональные пользователи, которые постоянно сталкиваются с массивными вычислениями с плавающей запятой.
Если вы всё же относитесь к той редкой группе людей, которым могут понадобиться три-четыре двухслотовые видеокарты, работающие вместе, тогда вы наверняка столкнётесь с некоторыми трудностями, связанными с конфигурацией такой системы. Какую материнскую плату выбрать? Какой нужен корпус? Есть ли блок питания с достаточным количеством разъёмов вспомогательного питания? Как всё это охлаждать? Даже если вы разберётесь с этими вопросами, не думайте, что у вас останется место для других PCIe устройств.
Но что если вынести всё необходимое железо за пределы рабочей станции, а заодно и понизить уровень шума? Где можно разместить столько видеокарт? Для этого вам понадобится достаточно большой корпус с восемью слотами на задней панели ввода/вывода. Также нужна системная плата хотя бы с четырьмя слотами PCI Express x16 для видеокарт. Естественно, необходимо подобрать соответствующий блок питания. К тому же нужно позаботиться о системе охлаждения, она должна не только обеспечить стабильную работу четырёх графических адаптеров, но и не выходить за определённые рамки по уровню шума.
Встречайте Netstor TurboBox NA255A. Решение очень похоже на стандартный MidiTower, однако применение у него более специализированное. TurboBox NA255A разработан как внешний модуль расширения с соединением по шине PCI Express 3.0, он оснащается собственным блоком питания на 1000 Вт и радиаторами охлаждения. Его главная цель – обеспечить функционирование четырех дополнительных слотов PCIe x16 (физически разведенных для работы на скорости до x8) и два слота x4 для карт расширения. Всё это управляется одной 16-линейной картой расширения, которая устанавливается в рабочую станцию и связывается с Netstor TurboBox NA255A внешним кабелем.
Один слот PCI Express x16 третьего поколения обеспечивает пропускную способность до 16 Гбайт/с в каждую сторону. Хотя на практике реальная пропускная способность обычно ниже, тем не менее, это значение очень велико. Другими словами, на платформе с процессором Sandy Bridge с одним слотом PCIe 3.0 x16 вы получите почти такую же скорость передачи данных, как с четырьмя x8 слотами версии 2.0, которые обычно используются для создания массивов GPU.
В теории, для игр этого более чем достаточно. Тем не менее, рассматриваемая система не позиционируется для игрового рынка. Она предназначена для конфигураций из нескольких видеокарт, которые будут производить большие объёмы вычислений общего назначения на GPU. Однако мы заинтересованы в двух направлениях, поэтому проведём тесты для обоих сегментов.
Размеры корпуса составляют 457 x 355 x 178 мм. Он жёсткий, выполнен из шлифованного алюминия с решёткой на лицевой стороне для улучшения воздушного потока. Создаётся впечатление, что Netstor переняла стиль Apple. Netstor TurboBox NA255A совместим как с PC, так и с Mac. Не удивительно, что Netstor обратила внимание на платформу Apple, ведь Mac Pro предоставляет только один слот x16 второго поколения и два слота x4 общей мощность 300 Вт.
Одна карта устанавливается в хост-систему, другая в сам корпус Netstor TurboBox NA255A. Связующие их кабели подключаются к соответствующим внешним разъёмам.
Но самое интересное находится внутри Netstor TurboBox NA255A. Здесь вы найдёте блок питания Surestar TC-1000PL 1000 Вт, два 120 миллиметровых вентилятора, поддерживающих горячую замену, печатную плату размером 241 x 297 мм (NP952A-GPU) и PCIe карту расширения размером 152 x 101 мм с внешним интерфейсом (NP970A).
Обзор Netstor TurboBox NA255A | Установка и связанные с ней трудности
В теории, установить видеокарты в Netstor TurboBox NA255A, подключить шнуры питания и присоединить блок к PCI Express карте на рабочей станции должно быть легко. TurboBox разработан для расширения стандартного интерфейса, поэтому в драйверах нет никакой необходимости. Однако на практике сборка оказалась не такой простой.
В процессе мы столкнулись с рядом препятствий. Во-первых, мы не предполагали, что интерфейсная карта PCIe имеет разные разъёмы для подключения кабеля. Если присмотреться, один порт подписан как x16, а другой – как x8. Мы случайно подключили x16 к x8 на самом блоке. Ошибку исправить не сложно, но в документации Netstor об этом не упоминается.
Второе препятствие оказалось более неприятным. Мы не могли заставить Netstor TurboBox NA255A работать в режиме PCI Express 3.0. PCI Express первого и второго поколения работали без проблем, но когда перемычка устанавливалась на PCIe 3.0, система переставала распознавать установленные в него видеокарты. Специалисты компании Netstor помогли разобраться с проблемой. Для этого нужно было также переконфигурировать переключатели на интерфейсных картах.
Третья проблема вообще не связана с Netstor TurboBox NA255A. Во время первого прогона тестов мы наблюдали странные проседания производительности с конфигурацией из трёх Radeon HD 7970. При выявлении неисправностей выяснилось, что некоторые карты на базе GPU Tahiti плохо работали в связке. Как оказалось, модели разных производителей оснащались несовместимыми прошивками, что и приводило к падению скорости в конфигурациях из нескольких GPU (хотя должно быть всё нормально). То есть использование разных продуктов даже из одного семейства может привести к проблемам. Нашу ситуацию удалось решить установкой другой комбинации графических карт.
И последнее: нам не удалось протестировать четыре Radeon HD 7970 одновременно. Но опять же, корпус Netstor TurboBox NA255A в этом не виноват. TurboBox полностью совместим с квартетом двухслотовых карт, но поскольку карты Radeon HD 7970 в нашей лаборатории имели чуть больший размер, они не помещались в отведённое под два слота расширения пространство. Поэтому тесты мы провели на трёх Radeon HD 7970. Тем не менее, всё совпало: системная плата ASRock X79 Extreme9 в нашей хост-системе может обеспечить работу максимум трём картам 7970-х, поэтому нам удалось сравнить производительность основной и вспомогательной систем.
Обзор Netstor TurboBox NA255A | Тестовый стенд и бенчмарки
Наша тестовая система построена на базе чипсета Intel X79 Express, со скоростью передачи данных 8 Гтекс/с на каждый слот PCI Express х16 для графических ускорителей. Мы измерим скорость основного соединения и Netstor TurboBox NA255A, используя конфигурации из одного, двух и трёх графических процессоров. Так же мы узнаем, есть ли есть падение производительности при внешнем подключении графики в сравнении с внутренней установкой карт в один слот PCI Express x16 третьего поколения. Часть наших тестов также сравнивает PCIe 2.0 и 3.0, чтобы показать преимущества современных технологий над старыми.
Как уже упоминалось, для тестирования мы используем три видеокарты Radeon HD 7970. Частоты ядра и памяти всех образцов выставлены на эталонные значения.
Несколько игр помогут раскрыть уровень производительности в трёхмерных приложениях, а бенчмарки LuxMark и GUIMiner выступят в роли тестов с OpenCL-ускорением. Мы понимаем, что Netstor TurboBox NA255A не рассчитан на игры, однако несколько игровых тестов в разрешении 1920×1080 и 5760×1080 смогут пролить свет на потенциал производительности.
Конфигурация тестового стенда | |
CPU | Intel Core i7-3960X (Sandy Bridge-E) 3,3 ГГц, разгон до 4,5 ГГц, 15 Мбайт общего кэша L3, Hyper-Threading вкл. |
Материнская плата | ASRock X79 Extreme9 (LGA 2011) чипсет: Intel X79 Express |
Сеть | Встроенный контроллер Gigabit LAN |
Память | Corsair Vengeance LP PC3-16000, 4 x 4 Гбайт, 1600 MT/s, CL 8-8-8-24-2T |
Видеокарта | 3 x Radeon HD 7970 |
Накопитель | Samsung 470 256 Гбайт (SSD) |
Питание | ePower EP-1200E10-T2 1200 Вт ATX12V, EPS12V |
ПО и драйверы | |
Операционная система | Microsoft Windows 8 |
Графический драйвер | Nvidia 310.70 beta |
DirectX | DirectX 11.1 |
Обзор Netstor TurboBox NA255A | Результаты тестов
Вычисления общего назначения на GPU
Netstor TurboBox NA255A предназначен для рабочих станций, использующих несколько GPU и способных использовать вычислительные возможности графической подсистемы. Итак, оценку мы начинаем с бенчмарка LuxMark.
Как видно из диаграммы, разницы в производительности между материнской платой, работающей с PCI Express 2.0, материнской платы с PCI Express 3.0 и Netstor TurboBox NA255A нет. Данный тест полностью нагружает вычислительные ресурсы каждой видеокарты, однако пропускная способность PCI Express в нем используется не на 100%. Следовательно, масштабирование впечатляющее.
В этом тесте мы снова видим практически идентичные результаты между основной системой и Netstor TurboBox NA255A. Это значит, что переход на внешнюю графическую систему или понижение до PCI Express 2.0 проблем не вызовет, по крайней мере в вычислительных задачах.
Дополнительно мы провели тест bitcoin mining на материнской плате с разъёмом Socket FM1 и одним четырёхполосным слотом PCI Express. Результат не отличался от теста слота x16: приблизительно 550 миллионов операций хэширования в секунду. Другими словами, один слот PCIe x16 третьего поколения обеспечивает достаточную пропускную способность для четырёх видеокарт в корпусе Netstor TurboBox NA255A. Мы предполагаем, что ещё и запас остаётся.
Medal Of Honor Warfighter
Проведя вычислительные тесты, мы переходим к совершенно другой модели использования – играм. Ещё раз напомним, что Netstor TurboBox NA255A для них не предназначен, однако игры помогут выявить другие аспекты производительности TurboBox. Возможно, мы сможем увидеть, в каких режимах доступная пропускная способность влияет на масштабирование, и как это соотносится с вариантом установки карт непосредственно в материнскую плату.
Любопытно, но самый лучший результат показала конфигурация из двух видеокарт, установленных в системную плату X79. Установка третьей видеокарты отрицательно сказывается на производительности. Это связано либо с ограничениями платформы, либо с профилем CrossFire, неоптимизированным под три карты, оба аспекта могут вызвать снижение частоты кадров. Netstor TurboBox NA255A работает хорошо, но отстаёт от хост-системы с тремя видеокартами.
При работе с одной картой результаты всех трёх конфигураций одинаковы.
И снова Netstor TurboBox NA255A работает почти на одном уровне с видеокартами, установленными в материнскую плату. На таком высоком разрешении три карты немного обгоняют две, хотя при этом у тройной связки минимальная частота ниже. В любом случае, масштабирование не существенное.
Crysis 2
Представленные ниже данные мы получили перед премьерой Crysis 3. Вот почему используется именно вторая часть игры.
1920×1080 – не достаточно высокое разрешение, чтобы заставить три Radeon HD 7970 попотеть. Похоже, узкое место в платформе сдерживает конфигурации из двух и трёх видеокарт, у них одинаковые показатели средней частоты кадров. Однако есть исключение: две Radeon HD 7970 установленные в Netstor TurboBox NA255A. Поскольку три карты в этом корпусе работают согласно ожиданиям, проблема может заключаться в конфигурации системы (на предыдущих страницах мы о них говорили).
В разрешении 5760×1080 отмеченная выше проблема с двумя картами решилась сама собой. Тем не менее, при переходе с двух на три видеокарты Radeon HD 7970 система Netstor TurboBox NA255A масштабируется не так агрессивно. К счастью, у нас есть ещё несколько тяжёлых приложений, которые могут либо подтвердить, либо опровергнуть уже полученный результаты.
DiRT Showdown
Существующее узкое место в платформе на разрешении 1920х1080 не даёт прирост скорости при переходе с двух на три карты Radeon HD 7970.
У двух видеокарт на плате X79 минимальная частота кадров ниже, однако средняя на одном уровне с другими многокартовыми конфигурациями.
Очевидно, что покупатель более двух видеокарт high-end класса вероятнее всего будет играть на разрешениях 2560×1600 или 5760×1080. На таких высоких разрешениях конфигурации продолжают масштабирование.
На практике разницы между тремя проверенными конфигурациями нет, это говорит о том, что одного шестнадцатилинейного слота для трёх Radeon HD 7970 достаточно.
Metro 2033
Судя по результатам теста Metro 2033 масштабирование в игре идентично на всех трёх конфигурациях.
Тоже самое можно сказать про разрешение 5760×1080. В компании Netstor возможно будут рады узнать, что Netstor TurboBox NA255A хорошо проявляет себя в играх, хотя для этого и не был предназначен.
Энергопотребление и тепловыделение
Для лучшего восприятия данных мы добавили на диаграмму следующие цвета: синий – отдельный показатель для PC, красный – значения для Netstor TurboBox NA255A и чёрный – PC и TurboBox вместе.
Естественно в половине конфигураций нет красной полосы, потому что Netstor TurboBox NA255A не используется, когда мы подключаем видеокарты к плате ASRock. В другой половине диаграмм синяя полоса (PC) очень короткая, здесь мы даём большую нагрузку bitcoin mining на видеокарты в TurboBox, что на PC почти не влияет.
Как видите, комбинация Netstor TurboBox NA255A/PC потребляет приблизительно на 100 – 150 Вт больше энергии, чем один PC. Как мы и ожидали, дополнительное “железо” заметно сказывается на энергопотреблении.
Хотя Netstor TurboBox NA255A повышает энергопотребление, рабочая температура видеокарт благодаря улучшенному воздушному потоку NA255A ниже. Кроме того, других компонентов PC в корпусе нет, следовательно, и внутреннюю температуру они не повышают, как в случае с видеокартами внутри основной системы.
Обзор Netstor TurboBox NA255A | Эффективность доказана, а что с ценой?
Реальные данные говорят о многом. Без них правильные выводы сформулировать невозможно, даже если изначальные расчёты были точны. Netstor TurboBox NA255A тому пример. Перед тестированием мы были уверены, что один разъём PCI Express 3.0 х16 обеспечит достаточно широкий канал для параллельной работы нескольких графических процессоров, не создавая при этом узких мест.
Но чтобы подтвердить результаты Netstor TurboBox NA255A, нам всё же пришлось протестировать карту в одном х4 слоте PCI Express 2.0. Цифры говорят сами за себя: данное устройство успешно выносит видеокарты за пределы основной системы для обработки задач с GPU-ускорением (или игр, хотя выгодным такое решение назвать нельзя). Разницу в производительности между Radeon HD 7970 в корпусе TurboBox и тремя Radeon HD 7970 на системной плате X79 мы не увидели. Дополнительные тесты показывают, что с четвёртой картой результаты хуже не станут, по крайне мере в bitcoin mining.
А что насчёт цены? За модель NA255A компания Netstor просит приблизительно $2200. Это очень дорого. За такие деньги можно собрать мощную рабочую станцию, включающую три Radeon HD 7970. Естественно вам придётся самим найти подходящий корпус, блок питания, совместимую системную плату и систему охлаждения. Но на Tom’s Hardware именно этим мы и занимаемся. Потому, с точки зрения сборщика PC, смысла в данной системе мы не видим.
Тем не менее, корпус Netstor TurboBox NA255A может быть интересен пользователям Mac Pro. Экосистема Apple ограничена, поэтому такого понятия как массив из трёх или четырёх видеокарт здесь не существует. Netstor TurboBox NA255A, возможно, единственный вариант работы с множеством GPU. Если вы хотите работать в экосистеме Apple и вам необходима большая вычислительная мощь, то придётся смириться с ценой.