Тесты масштабируемости PCI Express и SLI: сколько линий нужно?
Редакция THG,  7 августа 2010


Упираемся в PCIe?

Всего семь месяцев прошлом с момента публикации нашей последней статьи, посвящённой масштабированию PCI Express, в которой мы обнаружили скромные отличия в производительности между слотами PCIe x8 и PCIe x16. Но эти семь месяцев были действительно жаркими!

Сначала вышла долгожданная видеокарта Nvidia GeForce GTX 480, которая сместила AMD Radeon HD 5870 в качестве самого быстрого решения с одним GPU на рынке. Да и затем появились видеокарты для среднего рынка, которые обеспечили самую высокую масштабируемость на нескольких GPU, какую мы когда-либо встречали.

К сожалению, подобные улучшения обесценивают наши предыдущие тесты. Поэтому мы посчитали нужным провести новое исследование производительности.

Упираемся в PCIe?

В данной статье мы попытаемся полностью ответить на наиболее острые и актуальные вопросы, которые задавали нам читатели. Действительно ли вам потребуется платформа X58, чтобы поддержать новейшие графические технологии, или будет достаточно платформы с меньшим количеством линий PCI Express? MSI позволила нам ответить на этот вопрос с одним продуктом, выпустив материнскую плату на Intel X58, у которой также есть режимы x8 и x4, знакомые нам по некоторым решениями Intel P55.

Мы уже видели, что материнские платы на Intel X58 и Intel P55 обеспечивают одинаковую производительность в играх при использовании одного слота x16. В данном тестировании мы смогли ограничить себя одной материнской платой, что позволило сфокусироваться только на линиях PCI Express, устранив все другие переменные. Встречайте платформу для нашего тестирования: материнскую плату MSI Big Bang-XPower.

MSI Big Bang-XPower

Нажмите на картинку для увеличения.

Конечно, эту модель нельзя назвать представителем рынка Intel P55 с его умеренными ценами, но у XPower есть качества, благодаря которым эта материнская плата прекрасно подошла для наших тестов. Два доступных слота PCIe 2.0 x16 можно разнести до трёх слотов x16 каждый, что даёт режимы x8-x0-x8-x8-x8-x0 при заполнении третьего и пятого слота, а также режим x8-x4-x4-x8-x4-x4 при заполнении второго и шестого слотов. Благодаря MSI, мы смогли провести тесты в режимах PCIe x16, x8 и x4 на одной материнской плате, не используя для этих же целей скотч, чтобы заклеивать контакты на видеокарте.

Тестовая конфигурация

Аппаратное обеспечение
CPU Intel Core i7-920 (2,66 ГГц, 8 Мбайт общего кэша L3), разгон до 4,00 ГГц на 1,40 В, 160 МГц BCLK
Материнская плата MSI Big Bang-XPower, BIOS V1.2 (06/09/2010), Intel X58 Express, LGA 1366
Память Kingston KHX16000D3ULT1K3/6GX (6 GB), DDR3-2000 в режиме DDR3-1600 CAS 7-7-7-21
Видеокарта GTX 480 MSI GeForce GTX 480 1.5 GB, 700 МГц GPU, GDDR5-3696
Жёсткий диск Western Digital VelociRaptor, 600 GB (WD6000HLHX), 10 000 об/мин, SATA/600, кэш 32 Мбайт
Звук Встроенный HD Audio
Сеть Встроенная Gigabit Networking
Блок питания OCZ-Z1000 1000 Вт модульный
Программное обеспечение
ОС Microsoft Windows 7 Ultimate 64-bit
Видеокарта GeForce Nvidia ForceWare 258.96
Чипсет Intel INF 9.1.1.1020

Наш процессор Core i7-920 был разогнан до 4,00 ГГц, чтобы минимизировать ограничения CPU в тестах 3D-игр.

Тестовая конфигурация

Кулер Thermalright MUX-120 достаточно хорошо охлаждал наш разогнанный CPU, чтобы мы не столкнулись с какими-либо проблемами стабильности.

Тестовая конфигурация

С эффективностью на средней нагрузке около 91% и рейтингом 80 PLUS Gold, блок питания OCZ Z1000 хорошо подходит для тестов системы под полной нагрузкой. Поскольку кривая эффективности снижается до 89% на обоих концах, вы можете умножить полученные нами значения энергопотребления от розетки на 0,9, чтобы получить фактическое энергопотребление комплектующих.

Тестовая конфигурация

Тесты и настройки

3D-игры
Aliens Vs. Predator Benchmark Alien Vs Predator Benchmark Tool
Test Set 1: Highest Settings, No AA
Test Set 2: Highest Settings, 4x AA
Call of Duty: Modern Warfare 2 Campaign, Act III, Second Sun (45 sec. FRAPS)
Test Set 1: Highest Settings, No AA
Test Set 2: Highest Settings, 4x AA
Crysis Patch 1.2.1, DirectX 10, 64-bit executable, benchmark tool
Test Set 1: Highest Quality, No AA
Test Set 2: Highest Quality, 4x AA
DiRT 2 Run with -benchmark example_benchmark.xml
Test Set 1: Highest Settings, No AA
Test Set 2: Highest Settings, 4x AA
S.T.A.L.K.E.R.: Call Of Pripyat Call Of Pripyat Benchmark version
Test Set 1: Highest Settings, No AA
Test Set 2: Highest Settings, 4x MSAA
Синтетические тесты
3DMark Vantage Version: 1.0.1, GPU and CPU scores

Результаты тестов масштабирования с одной видеокартой

3DMark Vantage

В 3DMark можно оценить производительность GPU и CPU, но мы не были уверены, насколько актуальны полученные результаты для нашего сравнения пропускной способности.

Слот PCIe 2.0 x8 работает всего примерно на 1% медленнее, чем слот с 16 линиями в прогоне 1280x1024 "Performance", а слот x4 даёт падение ещё на 3%.

3DMark Vantage

3DMark Vantage

3DMark Vantage

Разница в производительности между слотами x16 и x4 сузилась до 2% при переходе к прогону 3DMark 1920x1200 "Extreme".

Alien Vs. Predator

Некоторые игры ограничиваются пропускной способностью PCI Express, но другие упираются в производительность GPU или CPU. Игра Alien Vs. Predator, по всей видимости, относится к последней категории, поскольку производительность падает крайне незначительно, стоит переставить видеокарту в слот x4.

Alien Vs. Predator

Alien Vs. Predator

Alien Vs. Predator

Разница между PCIe 2.0 x4 и x16 составила всего около 1%.

Call of Duty: Modern Warfare 2

Игра Call of Duty настолько быстро идёт на современном "железе", что весьма сложно назвать какую-либо комбинацию ограниченной по производительности. Отличия, конечно, присутствуют, но комфортно играть можно в любой конфигурации.

Call of Duty: Modern Warfare 2

Call of Duty: Modern Warfare 2

Call of Duty: Modern Warfare 2

В худшем случае GeForce GTX 480 снижает производительность в два раза – в низких разрешения при переходе на x4. Эта разница уменьшается до примерно 1/3 в высоких разрешениях, а результаты x8 находятся примерно посередине на всех трёх диаграммах.

Crysis

Наш опыт говорит о том, что Crysis обычно упирается в GPU, поэтому при повышении разрешения снижение пропускной способности PCI Express доставляет всё меньше проблем.

Crysis

Crysis

Crysis

Слот x4 даёт падение производительности 9% в разрешении 1680x1050, а слот x8 позволяет GPU достичь 98% потенциала производительности. В целом же, слоты x8 кажутся вполне приемлемым вариантом для Crysis.

DiRT 2

DiRT 2 находится между Crysis и CoD:MW2 по зависимости от пропускной способности PCIe, получая падение производительности на 16% и 4%, когда GeForce GTX 480 приходится работать в режимах x4 и x8, соответственно.

DiRT 2

DiRT 2

DiRT 2

Разница в производительности между слотами x16 и x4 снижается до 8% в разрешении 2560x1600, но радует то, что в DiRT 2 всё равно можно комфортно играть на всех трёх конфигурациях.

S.T.A.L.K.E.R.: Call Of Pripyat

Последняя игра в семействе S.T.A.L.K.E.R. весьма слабо реагирует на снижение пропускной способности, переход на слот x8 или x4 даёт всего лишь падение на 1% и 6%, соответственно, по сравнению с 16 линиями в самом низком игровом разрешении.

S.T.A.L.K.E.R.: Call Of Pripyat

S.T.A.L.K.E.R.: Call Of Pripyat

S.T.A.L.K.E.R.: Call Of Pripyat

Повышение разрешения ещё сильнее переносит нагрузку с CPU и PCIe на видеокарту, разница между x16 и x4 составляет всего 3%. Слот x8 приводит к отставанию в производительности меньше 1% по сравнению со слотом x16 в разрешении 2560x1600.

Заключение по масштабированию PCIe

В большинстве игр мы обнаружили весьма скромные отличия между разными конфигурациями слотов. Только в Call of Duty: Modern Warfare 2 мы получили необычно большую разницу, но эта игра составляет 20% всех наших игровых тестов.

Заключение по масштабированию PCIe

Сборщикам игровых систем можно ожидать среднее падение производительности 8% при переходе со слота x16 на x8. Это могло бы вызвать проблемы на платформах с ограниченным количеством линий PCI Express, например, на чипсете LGA 1156 при переходе в режим SLI. Но перед тем как мы рассмотрим тесты SLI, позвольте оценить влияние конфигураций на энергопотребление, температуру и эффективность.

Заключение по масштабированию PCIe

Снижение количества используемых линий PCIe может уменьшить энергопотребление, но всё же недостаточно, чтобы на это обратили внимание владельцы high-end ПК.

Заключение по масштабированию PCIe

Мы не рассчитывали получить разницу в температуре просто из-за перемены слота, поэтому результаты вполне логичны.

Заключение по масштабированию PCIe

Потеря производительности без уменьшения энергопотребления приводит к существенному снижению эффективности, поскольку под эффективностью мы понимаем отношение производительности к энергопотреблению.

При перестановке одной GeForce GTX 480 из слота x16 в слот x8 PCIe 2.0 вы теряете 8% производительности. Но давайте посмотрим, что мы получим в случае конфигурации SLI. Действительно ли нам следует использовать больше шестнадцати линий PCIe для установки двух high-end видеокарт?

Результаты тестов масштабирования конфигурации SLI

3DMark Vantage

И вновь мы сталкиваемся с загадочным поведением 3DMark, у которого тесты GPU и CPU не отражают различий в некоторых реальных играх при уменьшении пропускной способности интерфейса видеокарты. Конечно, некоторые игры не используют пропускную способность шины PCI Express так же эффективно, как и другие, и, возможно, Futuremark может указать на эти игры в оправдание полученных результатов теста.

3DMark Vantage

3DMark Vantage

3DMark Vantage

Конечно, масштабирование PCIe не очень заметно по результатам 3DMark, но нам понравилось увеличение производительности на 91% при переходе с одной видеокарты на две в тестовом прогоне 1920x1200 "Extreme".

Alien Vs. Predator

Мы не получили существенной разницы при переходе между слотами x8 и x16 в Alien Vs Predator в наших тестах с одной видеокартой, поэтому мы не ожидали заметных отличий и в SLI. Впрочем, довольно приятно видеть, насколько хорошо конфигурация SLI масштабируется по сравнению с одной видеокартой, причём пиковый прирост производительности при переходе к SLI составляет 92%.

Alien Vs. Predator

Alien Vs. Predator

Alien Vs. Predator

При повышении разрешения наблюдается странная ситуация, два слота x8 начинают обгонять два слота x16 в 2560x1600. У нас нет ни малейших идей по поводу того, что вызвало подобное неравенство, за исключением неэффективной работы SLI в этой игре. Но, возможно, причина кроется в материнской плате.

Call Of Duty: Modern Warfare 2

Call Of Duty: Modern Warfare 2

При установке одной видеокарты игра CoD:MW2 показала наибольшую зависимость от доступной пропускной способности PCI Express. В случае разрешения 1680x1050 производительность явно упирается в CPU, что повлияет на финальный анализ средней производительности.

Call Of Duty: Modern Warfare 2

Call Of Duty: Modern Warfare 2

Как и в случае большинства тестов, чья производительность упирается в CPU, по мере увеличения разрешения в CoD:MW2 нагрузка смещается в сторону GPU. К сожалению, при этом зависимость от пропускной способности PCI Express тоже снижается. Даже при частоте 4,00 ГГц, "плохая" производительность нашего процессора Core i7 уменьшает как масштабирование в зависимости от пропускной способности PCIe, так и масштабирование SLI.

Crysis

В нашем предыдущем тесте Crysis упиралась в производительность GPU, но при переходе на SLI мы получаем хорошую масштабируемость: прирост производительности 70% в разрешении 1680x1050, который увеличивается до 92% в 2560x1600. Мы можем отметить, что изменение масштабирования SLI имеет ту же природу, что и переход с ограничений CPU на ограничения GPU при повышении разрешения.

Crysis

Crysis

Crysis

К сожалению, Crysis – не тот тест, где бы мы могли видеть существенное падение производительности при переходе на слот x8, и в случае двух видеокарт конфигурация в слотах x8 даёт падение от 3% в разрешении 1680x1050 до 2% в 2560x1600. По крайней мере, владельцам платформы P55 будет приятно из-за мизерного падения производительности в этой игре.

DiRT 2

DiRT 2 немного упирается в CPU при использовании двух видеокарт GeForce GTX 480 на средних разрешениях, прирост составляет "всего" 72% при переходе на SLI в разрешении 1680x1050. Опять же, зависимость от GPU увеличивается по мере повышения разрешения, поэтому прирост от SLI увеличивается до 91% в 2560x1600.

DiRT 2

DiRT 2

DiRT 2

Игра DiRT 2 не очень сильно зависела от пропускной способности PCIe в случае работы одной видеокарты, поэтому тот факт, что конфигурация двух видеокарт в слотах x8 уступает конфигурации с двумя слотами x16 всего на 2-5%, нас не удивляет.

S.T.A.L.K.E.R.: Call Of Pripyat

Если вы внимательно читали статью до этого места, то вас картина производительности S.T.A.L.K.E.R. вряд ли удивит. Тестирование GeForce GTX 480 в SLI не имеет смысла при средних разрешениях, поскольку 4,00-ГГц процессор Core i7 не способен раскрыть потенциал видеокарт в разрешениях ниже 2560x1600. В S.T.A.L.K.E.R.: Call of Pripyat мы наблюдаем исключение, поскольку видеокарты уже не так хорошо справляются с этой игрой в данном разрешении.

S.T.A.L.K.E.R.: Call Of Pripyat

S.T.A.L.K.E.R.: Call Of Pripyat

S.T.A.L.K.E.R.: Call Of Pripyat

Мы всё ещё наблюдаем прирост производительности от перехода на SLI от 75% в разрешении 1680x1050 до 94% в 2560x1600, хотя игра на максимальном разрешении шла уже не так плавно при максимальных тестовых настройках (минимальная частота кадров составила 16 fps) – большинство геймеров наверняка предпочтут снизить разрешение, уровень детализации или сглаживания, чтобы получить более плавную частоту кадров.

Заключение по масштабированию PCIe и SLI

В наших тестовых играх мы получили весьма приятное масштабирование производительности SLI, но только в самом высоком тестовом разрешении 2560x1600. В меньших разрешениях производительность часто упиралась в CPU. Для большинства игр не имеет смысл устанавливать пару видеокарт GeForce GTX 480 в разрешениях меньше 2560x1600, да и в одном игровом тесте производительности нашего 4-ГГц CPU было явно недостаточно даже в 1920x1200. Давайте посмотрим, какие результаты мы получим по масштабируемости.

Заключение по масштабированию PCIe и SLI

Две видеокарты способны по производительности обойти одну с приростом вплоть до 90% в большинстве игр, но это касается только самого высокого тестового разрешения. Плохая масштабируемость в меньших разрешениях снизила средний прирост до всего 63%. Более того, игра, которая показала самую сильную зависимость от пропускной способности PCIe в тестах с одной видеокартой, стала полностью зависима от CPU в SLI, уничтожив 8% разницу в среднем, которую мы получили в предыдущем сравнении с одной видеокартой PCIe.

Заключение по масштабированию PCIe и SLI

Прирост производительности в SLI превысил увеличение энергопотребления нынешней системы, но это касается только высоких разрешений. В целом же, конфигурация SLI потеряла эффективность из-за того, что в тесты мы добавили разрешение 1680x1050.

Заключение по масштабированию PCIe и SLI

В наших тестах была ещё одна особенность: конфигурация x8/x8 SLI требовала, чтобы видеокарты вплотную прилегали друг к другу, а в конфигурации x16/x16 между видеокартами оставался свободный слот. Но мы ни разу не столкнулись с перегревом. Какие проблемы вызывает расположение видеокарт вплотную друг к другу?

Заключение по масштабированию PCIe и SLI

Nvidia вырезала специальное отверстие в плате GTX 480 за вентилятором, чтобы видеокарты могли забирать воздух с обеих сторон. В результате мы не наблюдаем существенных изменений температур, когда видеокарты расположены вплотную друг к другу. Конечно, такой дизайн будет уже не таким эффективным для центральной видеокарты в конфигурации 3-way SLI, и в будущем мы планируем провести тесты масштабируемости более двух видеокарт.

Заключение

Главный вопрос нашего тестирования следующий: нужно ли нам более 16 линий для работы двух high-end видеокарт в конфигурации SLI? Как показали наши тесты, ответ будет, отрицательным.

Мы наблюдали довольно существенную разницу между конфигурациями x8 и x16 при использовании одной видеокарты, но при установке двух видеокарт "узким местом" становилась производительность CPU. Таким образом, для большинства протестированных игр более скоростной CPU будет намного важнее, чем два слота x16 для получения высокой производительности в конфигурации SLI.

Однако при этом возникают другие вопросы, поскольку наш мощный процессор Core i7 уже был разогнан до 4,00 ГГц. Большинство сборщиков просто не смогут найти более скоростные решения для повседневного использования в игровой сборке.

Впрочем, не будем забывать, что результат очень сильно зависит от разрешения. Зависимость от GPU увеличивается при повышении разрешения, и в какой-то момент две видеокарты начинают становиться более "узким местом", чем CPU. Впрочем, даже в этой ситуации зависимость от GPU перевешивает зависимость от пропускной способности PCIe x8 – и интерфейс так и не становится ощутимым замедлителем.

В общем, чтобы наши наблюдения по поводу зависимости конфигураций с одной видеокартой от пропускной способности PCI Express были перенесены на конфигурации с несколькими GPU, нам требуется более мощный CPU. Эта находка наверняка обрадует владельцев "high-end" систем на P55, которые планируют апгрейд на SLI с одиночных видеокарт GeForce GTX 480. Если у вас на материнскую плату установлен высокопроизводительный процессор, то разгон до 4 ГГц и выше даст намного более ощутимый эффект, чем апгрейд на платформу с чипсетом Intel X58. Чтобы платформа Intel X58 оправдала себя, вам потребуется ещё более быстрый процессор, а также разрешения выше 2560x1600.

КОНЕЦ СТАТЬИ


Координаты для связи с редакцией:

Общий адрес редакции: thg@thg.ru;
Размещение рекламы: Roman@thg.ru;
Другие координаты, в т.ч. адреса для отправки информации и пресс-релизов, приглашений на мероприятия и т.д. указаны на этой странице.


Все статьи: THG.ru

 

Rambler's Top100 Рейтинг@Mail.ru