Введение
На протяжении двух десятков лет персональные компьютеры оснащались одноядерными процессорами. В этом году мы постепенно переходим в эру двуядерных CPU, которые являются хорошим (и уже почти единственным) средством повышения производительности. В будущем нас ждут четыре ядра и больше. В компьютерной графике можно проследить такую же тенденцию. Вспомним технологию 3dfx Scan Line Interleave (SLI) у карт линейки Voodoo, когда две видеокарты работали совместно и усиливали мощность 3D-подсистемы.
Летом 2004 года, с объявлением линейки GeForce 6, nVidia впервые заговорила об обновлённой технологии SLI, которая теперь стала расшифровываться как “Scalable Link Interface”. Через годик подтянулась и ATi, представив CrossFire. Сегодня же nVidia вновь шагнула вперёд в области параллельных вычислений, объявив систему Quad SLI: четыре графических ядра призваны увеличить мощность 3D-рендеринга, позволяя играть с большим разрешением и максимальным визуальным качеством.
Традиционно конвейер 3D-рендеринга ограничен рядом фиксированных характеристик, числом инструкций, которые шейдеры могут выполнить за определённое время, а также и множеством проблем, которые Microsoft DirectX 9 решить не может. До появления первого поколения видеокарт DirectX 10 и ОС Microsoft Windows Vista пропускная способность графической подсистемы будет ограничиваться теми же параметрами. Но производители всё же пытаются представить более скоростные и широкие 3D-решения, которые способны увеличить пропускную способность. nVidia называет новую планку качества XHD (Extreme High Definition, экстремально высокое разрешение), и Quad SLI как раз на неё и нацеливается: обеспечивает максимальное разрешение со всеми включёнными опциями улучшения качества картинки.
Что же такое Quad SLI?
Quad SLI, как понятно по названию, подразумевает использование технологии SLI, но уже с четырьмя графическими процессорами. Мир узнал о Quad SLI в январе, после анонса Dell XPS Renegade 600 с красочным корпусом и nVidia Quad SLI в комплекте. На выставке CES утверждалось, что новая система XPS станет первой с поддержкой двух новых видеокарт nVidia GeForce 7800 SLI, у которых четыре GPU будут связаны между собой для ускорения производительности графики и повышения реализма. К сожалению, так не получилось: в нашу лабораторию первыми поступили системы Quad SLI от Falcon Northwest и iBuyPower, а в середине мая ожидается и новая графическая/игровая станция Kraftway.
На CES появилась и другая информация о Quad SLI. Многие заметили, что каждая из карт nVidia подключалась к внешним блокам питания на 150 Вт. По слухам, карты Quad SLI потребуют более 600 Вт только для себя, не принимая в расчёт другие компоненты системы. Такое число получилась от сложения максимальной потребляемой мощности по внутреннему питанию (75 Вт на чип) и от внешних блоков питания (150 Вт на карту). 150 Вт x 2 + 75 Вт x 4 = 600 Вт. Но опасения оказались напрасными: система Falcon Northwest Mach V, которую мы получили, оснащена блоком питания на 650 Вт.
Совсем недавно поползли слухи, что карты будут оснащаться графическими ядрами GeForce Go 7900 GTX, чтобы не решать проблемы с охлаждением и питанием обычных настольных ядер. Но Дерек Перез (Derek Perez) из nVidia сообщил, что это абсолютно неверно. nVidia использует настольные чипы. И хотя они работают с такими же частотами, как и GeForce Go 7900 GTX, то есть 500 МГц у ядра и 600 МГц (1200 МГц эффективная частота DDR3) у памяти, это не мобильные чипы. Снижение частоты позволило уменьшить энергопотребление Quadro и снизить требования к системе охлаждения.
Включаем SLI в драйвере и получаем Quad SLI.
Когда мы завершили тестирование, в нашу лабораторию поступила третья система: Gamer Ultra SLI Quad от CyberPowerPC. Тесты же проводились на системе Falcon Northwest Mach V.
CyberPowerPC Gamer Ultra SLI Quad.
Как работает Quad SLI?
Ещё в прошлом году Gigabyte реализовала подключение до четырёх видеокарт в одной системе. Но когда информация о
Falcon Northwest и другие системы, которые мы встречали, оснащены материнскими платами Asus A8N32-SLI. nVidia в документации утверждает, что Quad SLI будет работать “только на материнских платах nVidia nForce4 Dual X16 или nVidia nForce4 SLI, как под процессорами AMD, так и Intel”.
Для Quad SLI требуются две видеокарты с двумя GPU каждая. Каждая из двух видеокарт GX2 состоит из двух печатных плат с GPU на каждой. Платы соединены тремя горизонтальными втулками. Первый мостик SLI соединяет первый GPU с третьим, а ещё один мостик – второй GPU с четвёртым. В нижней части основной платы GX2 располагается интерфейс шины x16 PCI Express и специальный чип-коммутатор, отвечающий за внутреннюю передачу данных.
Две платы подключаются друг к другу специальным 10-контактным разъёмом. Дорожки у плат проходят через одни и те же структуры резисторов и стабилизаторов напряжения. Мы пока ждём информации от nVidia, для чего конкретно используются эти разъёмы.
Каждый GPU оснащён 512 Мбайт памяти. 2 Гбайт суммарной памяти – очень неплохой объём. В него можно закачать очень большие текстуры. Каждое ядро использует собственную выделенную память. Так что конфигурация, по сути, такая же, как у традиционных видеокарт или системы SLI.
Качество картинки
Конфигурация Quad SLI открывает интересные способы повышения качества картинки. И прежде всего это касается полноэкранного сглаживания. С традиционными SLI-конфигурациями на основе двух GPU максимальный режим сглаживания составляет 16x. Если один кадр в системе SLI можно было обработать с помощью двух GPU, то в системе Quad SLI один кадр может обрабатываться всеми четырьмя GPU. Такой режим называется 4-SFR (Single Frame Render). Нагрузка динамически распределяется между четырьмя графическими ядрами.
Удвоение графической мощности позволило реализовать просто сумасшедшее сглаживание 32x. Оно реализуется с помощью сглаживания мультисэмплинга 8xS на каждом GPU. В итоге получаем как раз 32x.
Вторая возможность: альтернативное сглаживание 16x для каждого в режиме Alternative Frame Rendering (AFR).
Заветные fps
Теперь перейдём к частоте кадров. Она зависит от типа рендеринга и от общего числа объектов в данной сцене. AFR как раз и является способом увеличения частоты кадров.
Самый быстрый способ работы Quad SLI: распределение нагрузки таким образом, чтобы каждый GPU обрабатывал каждый четвёртый кадр. Этот режим называется 4-way AFR. На диаграмме выше показано, как первый кадр обрабатывается GPU0, второй – GPU1 и т.д.
Есть и гибрид между качеством картинкой и скоростью: режим “AFR of SFR”. Первые два GPU работают над нечётными кадрами (1,3,5,…), а чётные кадры обрабатываются второй парой GPU.
Трудности перед началом тестирования
Система Quad SLI поступила к нам за несколько дней до выхода этой статьи. Но мы ждали правильной версии драйверов. Первые проблемы возникли с версией 87.05: они проявлялись на некоторых приложениях типа 3DMark05. Что интересно, у тестовой машины Falcon Northwest был установлен другой драйвер. Но вот в тестовой машине iBuyPower была именно версия 87.05. Проблемы оставались, и мы решили ждать WHQL-сертифицированной версии от nVidia.
Следующей версией оказалась 87.08 – официальная версия драйвера, которая будет поставляться вместе с системами Quad SLI. В ней исправлены многие проблемы, но ситуации с машиной Falcon Northwest новая версия не улучшила. Установка этих драйверов на машину iBuyPower привела к таким же печальным результатам.
Мы стали связываться с nVidia и производителями компьютеров, пытаясь решить проблемы. Драйвер 87.08 запущен на WHQL-сертификацию. Как мы обнаружили, существуют две версии драйвера: для поставщиков систем и для обычных пользователей. Они различаются XML-файлом, который содержит профили nVidia для игр. В одной версии XML сжат, а в другой находится в нормальном состоянии.
Ещё одна проблема появилась с BIOS Asus. У оригинальной версии возникали проблемы с отображением правильного объёма памяти – независимо от количества памяти в слотах DIMM. Мы устанавливали 2 Гбайт или 4 Гбайт, но материнская плата сообщала только об 1,1 Гбайт. Пришлось подключить и Asus, поскольку мы всё же пытались найти причину зависаний системы и “голубых экранов смерти”. Asus быстро выслала нам новую версию BIOS с маркировкой “0000”. Да, она решила проблему с памятью, но поддержка Quad SLI исчезла!
Во время копания в BIOS возникла ещё одна проблема. Мы заметили, что система без всяких на то оснований выставляла частоту канала HyperTransport между северным и южным мостами в режим 2x и 16 бит в одну и другую стороны, либо 8/8 бит. Даже когда мы выставляли в BIOS режим 5x и 16/16 бит, система продолжала работать в прежнем режиме.
Поскольку каналы HyperTransport работают на разных частотах, то Quad SLI не будет работать синхронно. Первые два GPU будут связываться с системной памятью и CPU на частоте 1000 МГц, а вторая пара GPU – всего на 400 МГц. Хотя, надо признать, GPU смогут быстрее обмениваться через мостики SLI, чем через PCI Express.
nVidia, между тем, в поте лица работала над ещё одной версией драйвера: 87.24. Она решила проблемы зависаний в 3DMark05 и Elder Scrolls IV (Oblivion), но мы всё же хотели добиться правильной синхронизации карт. Asus наконец-то выслала нам версию BIOS 1204. Мы обнаружили прежнюю медленную настройку канала между южным и северным мостами по умолчанию, но, в отличие от версии “0000”, теперь мы смогли выставить нужные настройки вручную.
Что ж, теперь можно приступать к тестам.
Тесты Oblivion
В наши тесты мы добавили очень популярную игру Elder Scrolls IV: Oblivion, которая немало нагружает видеокарту. Для адекватного тестирования Oblivion мы решили использовать встроенный скринсейвер и утилиту Fraps. Мы обсудили методику с некоторыми другими лабораториями, включая Intel, и признали её адекватной. Вместо отдельных тестов мы решили включить 4xAA и освещение Bloom. Обратите внимание, что текущая версия чипов nVidia не поддерживает сглаживание вместе с HDR-освещением, поэтому пришлось прибегнуть к наименьшему общему знаменателю ATi и nVidia.
В наших тестах мы выбрали две локации. Первая снаружи города Chorrol рядом с опушкой леса на северо-западе. Вторая локация – внутри башни в Oblivion Gate, поскольку мы хотели оценить производительность и внутри помещения. Мы загружали сохранённую игру, после чего ждали, пока камера не начнёт вращаться вокруг главного героя. Мы настроили Fraps на запись FPS каждую секунду и проводили два полных прохода. Мы брали первые 90 секунд данных Fraps, после чего вычисляли максимальный, минимальный и средний результат.
Ниже приведены настройки, которые мы использовали в Oblivion.
Настройки Oblivion | |
Разрешение/ Resolution | 1024×768, 1280×1024, 1600×1200, 2048×1536, 2560×1600 |
Яркость/ Brightness | Default (мы оставили её по умолчанию) |
Размер текстур/ Texture Size | Большой/ Large |
Дальность обзора деревьев/ Tree Fade | Максимальная/ Max (движок в самое правое положение) |
Дальность обзора героев/ Actor Fade | Максимальная/ Max |
Дальность обзора предметов/ Item Fade | Максимальная/ Max |
Дальность обзора объектов/ Object Fade | Максимальная/ Max |
Дальность обзора травы/ Grass Distance | Максимальная/ Max |
Дальность обзора/ View Distance | Максимальная/ Max |
Удалённый ландшафт/ Distant Land | Вкл./ On |
Удалённые строения/ Distant Buildings | Вкл./ On |
Удалённые деревья/ Distant Trees | Вкл./ On |
Тени внутри/ Int. Shadows | Макс./ Max |
Тени снаружи/ Ext. Shadows | Макс./ Max |
Self Shadows | Выкл./ Off |
Тени на траве/ Shadows on Grass | Вкл./ On |
Тени деревьев/ Tree Canopy Shadows | Вкл./ On |
Фильтрация теней/ Shadow Filtering | Высокая/ High |
Secular Distance | Макс./ Max |
HDR-освещение/ HDR Lighting | Выкл./ Off |
Освещение Bloom/ Bloom Lighting | Вкл./ On |
Детализация воды/ Water Detail | Высокая/ High |
Отражения на воде/ Water Reflections | Вкл./ On |
Волны на воде/ Water Ripples | Вкл./ On |
Отражения в окнах/ Window Reflections | Вкл./ On |
Детализация крови/ Blood Decals | Высокая/ High |
Сглаживание/ Anti-aliasing | 4x |
Мы отключили тени Self Shadows, поскольку они работают некорректно: каждый персонаж начинает выглядеть так, будто у него борода. Даже женщины. Как мы уже упоминали выше, карты nVidia не могут сочетать вместе HDR-освещение и полноэкранное сглаживание.
Кстати, недавно мы опубликовали интересный материал, посвящённый качеству графики в Oblivion на разных видеокартах: “
Тестовая конфигурация
Системное аппаратное обеспечение | |
Процессоры | AMD Athlon 64 FX-60 2,6 ГГц, 1,0 ГГц HTT, 1 Мбайт кэша L2 |
Платформа | Asus AN832-SLI Deluxe ATi Xpress 200 CrossFire Edition – эталонная плата |
Память | Corsair CMX1024-4400Pro 2x 1024 Мбайт @ DDR400 (CL3,0-4-4-8) |
Жёсткий диск | Western Digital Raptor, WD740GD 74 Гбайт, 10 000 об/мин, кэш 8 Мбайт, SATA150 |
Сеть | Встроенная nForce4 Ethernet 1 Гбит/с |
Видеокарты | nVidia GeForce GX2 (Quad) 1024 Мбайт GDDR3, 500 МГц ядро, 600 МГц память nVidia GeForce 7900 GTX 512 Мбайт GDDR3, 650 МГц ядро, 800 МГц память nVidia GeForce 7900 GT 512 Мбайт GDDR3, 600 МГц ядро, 800 МГц память nVidia GeForce 7600 GT 256 Мбайт GDDR3, 550 МГц ядро, 850 МГц (1,7 ГГц DDR) память ATi Radeon X1900XTX 512 Мбайт GDDR3, 650 МГц ядро, 775 МГц (1,55 ГГц DDR) память ATi Radeon X1900XT CrossFire Edition 512 Мбайт GDDR3, 625 МГц ядро, 725 МГц (1,45 ГГц DDR) память ATi Radeon X1800GTO 256 Мбайт GDDR3, 625 МГц ядро, 750 МГц (1,50 ГГц DDR) память |
Блок питания | PC Power & Cooling Turbo-Cool 1,000 Вт |
Системное ПО и драйверы | |
ОС | Microsoft Windows XP Professional 5.10.2600, Service Pack 2 |
Версия DirectX | 9.0c (4.09.0000.0904) |
Драйвер платформы | Asus – nForce 6.65 ATI X200 Reference |
Графические драйверы | ATi – Catalyst 6.3 WHQL nVidia – Forceware 87.24 |
Тесты Quad SLI на низких разрешениях
Мы решили начать тесты Quad SLI с низкого разрешения. Под “низким разрешением” мы понимаем то разрешение, в котором, по информации Valve Software/Steam, играют 97% геймеров: 1600×1200 или меньше. Что интересно, 95% вообще используют разрешение 1280×1024 или меньше. И ситуация здесь получилась точно такая же, как при сравнении производительности SLI с одиночной картой.
Конфигурация с несколькими GPU отводит определённые ресурсы на синхронизацию между картами и управление системой. Четырьмя графическими процессорами управлять намного сложнее и накладнее, чем одним. С учётом этого мы не думаем, что система Quad SLI будет хорошо масштабироваться при низком разрешении на тех играх, где SLI показывала себя неэффективно. Впрочем, не будем забывать, что цель Quad SLI заключается отнюдь не в низком разрешении. Чуть ниже мы повысим разрешение и посмотрим, как Quad SLI проявит себя.
3DMark05: низкое разрешение
Doom 3: низкое разрешение
Half-Life 2: Lost Coast: низкое разрешение
Black & White 2: низкое разрешение
Результаты Black & White оказались выпадающими. Как мы думаем, это проблема драйверов, которая решится с их обновлением или с выходом линейки 90. У nVidia в документации приведены похожие низкие результаты. Будем ждать драйвера.
F.E.A.R.: низкое разрешение
Тесты Quad SLI на высоких разрешениях
Как мы уже упоминали, при низких разрешениях система Quad SLI ведёт себя едва ли ощутимо быстрее обычной SLI или CrossFire. Поэтому Quad SLI вряд ли можно рекомендовать для низкого разрешения, особенно без включения опций повышения качества картинки. Но при “тяжёлых” настройках Quad SLI начинает себя проявлять. Да, на Quad SLI действительно можно собрать high-end игровую систему, особенно для игр, подобных Black & White 2, F.E.A.R. и Oblivion.
3DMark 05: высокое разрешение
3DMark 06: высокое разрешение
В тесте 3DMark мы видим равномерное падение общей производительности. Раньше кривая была более похожа на экспоненту. Конечно, вся мощь Quad SLI проявляется только при включении функций повышения качества. При этом линия оказывается параллельной линии NoAA NoAF и ничуть не спадает быстрее.
Doom 3: высокое разрешение
Doom 3 (и все игры на этом движке) от Quad SLI действительно выигрывают. Причём кривая со сглаживанием очень близка к кривой без AA. Мы наблюдаем ту же ситуацию, что и в тестах 3DMark.
Half-Life 2: Lost Coast: высокое разрешение
Что интересно, у Half-life 2: Lost Coast ситуация иная. При низком разрешении мы получаем схожие результаты для режимов со сглаживанием и без него, то есть производительность упирается в CPU. По мере повышения разрешения линия без опций улучшения качества остаётся практически горизонтальной, а линия AA начинает быстро спадать. При разрешении 2560×1600 система Quad SLI даёт почти 58 fps. Великолепный результат, учитывая весь объём рендеринга: 245 мегапикселей в секунду!
Black & White 2: высокое разрешение
В Black and White 2 весьма трудно сохранять высокую частоту кадров. Игра является гибридом стратегии реального времени, когда камера может двигаться под любым углом. С высоким уровнем детализации графический процессор никогда не отдыхает. Quad SLI в Black & White 2 обеспечивает стабильную частоту кадров, если сглаживание выключено. После включения сглаживания частота кадров падает, но не сильно. Низкие fps, как мы уже говорили выше, связаны с недоработанным драйвером.
F.E.A.R.: высокое разрешение
Приятно, не правда ли? Увеличивайте разрешение до максимума, но система Quad SLI будет уверенно выдавать fps, с которыми можно играть. Кстати, при включённых мягких тенях Quad SLI даёт более высокие результаты, чем при выключенных тенях с включённым сглаживанием. Подобная ситуация отличается от того, что мы видели на других картах при разрешении 1600×1200 и ниже. Обычно карты в режиме 4xAA 8xAF обгоняли NoAA 16xAF с мягкими тенями (Softshadows).
Elder Scrolls IV: Oblivion
А вот и задача “не по зубам”: игра Oblivion, которая сегодня является одной из самых требовательных. Мы специально решили поставить систему Quad SLI “на колени”, включив по максимуму практически все опции улучшения картинки в игре. Так что Quad SLI для Oblivion подходит хорошо. Конечно, при разрешении 2560×1600 даже Quad SLI сдаётся, но если чуть снизить настройки, то играть будет можно. Огромные наружные ландшафты легко “убивают” частоту кадров. Но внутри помещения частота кадров не снижается меньше 60 fps. Великолепная производительность! Аналогов сегодня просто нет.
Заключение
Система Quad SLI от Kraftway на московском Форуме Intel для разработчиков.
Что ж, система Quad SLI действительно впечатляет! Производительность на высоких разрешениях просто “сносит крышу”. Нам понравилось включать все настройки по максимуму в играх типа F.E.A.R. или Oblivion, но система Quad SLI успешно со всем справлялась (разве что за исключением максимальных настроек Oblivion). Quad SLI действительно предназначена для высоких разрешений – и это видно. Extreme High Definition – вот новый лозунг nVidia.
Конечно, главный недостаток Quad SLI – это цена! Саму систему можно купить где-то за $5000, но 30″ монитор обойдётся ещё не меньше $2000. Так что аппетит к высокой производительности и качеству должен подкрепляться толстым бумажником. Если 30″ монитор для вас слишком уж “крут”, то с помощью Matrox TripleHead2Go можно подцепить к системе три 19″ панели и получить 3840×1024.
Внутренности IBuyPower Quad SLI Extreme Gaming System.
Последнее замечание: система Quad SLI не предназначена для сборки “на дому”. nVidia отчётливо дала это понять. Quad SLI будет поставляться только системным сборщикам, таким как Falcon Northwest, iBuyPower, CyberPowerPC, Dell, Alienware, Widow и Kraftway. Поэтому точную цену продукта оценить сложно: вы будете платить за сборку, гарантию и сервис. Зато вы получите полностью рабочую систему с гарантией. А для такой дорогой покупки это очень важно.