Упираемся в PCIe?
Всего семь месяцев прошлом с момента публикации нашей последней статьи, посвящённой масштабированию PCI Express, в которой мы обнаружили скромные отличия в производительности между слотами PCIe x8 и PCIe x16. Но эти семь месяцев были действительно жаркими!
Сначала вышла долгожданная видеокарта Nvidia GeForce GTX 480, которая сместила AMD Radeon HD 5870 в качестве самого быстрого решения с одним GPU на рынке. Да и затем появились видеокарты для среднего рынка, которые обеспечили самую высокую масштабируемость на нескольких GPU, какую мы когда-либо встречали.
К сожалению, подобные улучшения обесценивают наши предыдущие тесты. Поэтому мы посчитали нужным провести новое исследование производительности.
В данной статье мы попытаемся полностью ответить на наиболее острые и актуальные вопросы, которые задавали нам читатели. Действительно ли вам потребуется платформа X58, чтобы поддержать новейшие графические технологии, или будет достаточно платформы с меньшим количеством линий PCI Express? MSI позволила нам ответить на этот вопрос с одним продуктом, выпустив материнскую плату на Intel X58, у которой также есть режимы x8 и x4, знакомые нам по некоторым решениями Intel P55.
Мы уже видели, что материнские платы на Intel X58 и Intel P55 обеспечивают одинаковую производительность в играх при использовании одного слота x16. В данном тестировании мы смогли ограничить себя одной материнской платой, что позволило сфокусироваться только на линиях PCI Express, устранив все другие переменные. Встречайте платформу для нашего тестирования: материнскую плату MSI Big Bang-XPower.
Нажмите на картинку для увеличения.
Конечно, эту модель нельзя назвать представителем рынка Intel P55 с его умеренными ценами, но у XPower есть качества, благодаря которым эта материнская плата прекрасно подошла для наших тестов. Два доступных слота PCIe 2.0 x16 можно разнести до трёх слотов x16 каждый, что даёт режимы x8-x0-x8-x8-x8-x0 при заполнении третьего и пятого слота, а также режим x8-x4-x4-x8-x4-x4 при заполнении второго и шестого слотов. Благодаря MSI, мы смогли провести тесты в режимах PCIe x16, x8 и x4 на одной материнской плате, не используя для этих же целей скотч, чтобы заклеивать контакты на видеокарте.
Тестовая конфигурация
Аппаратное обеспечение | |
CPU | Intel Core i7-920 (2,66 ГГц, 8 Мбайт общего кэша L3), разгон до 4,00 ГГц на 1,40 В, 160 МГц BCLK |
Материнская плата | MSI Big Bang-XPower, BIOS V1.2 (06/09/2010), Intel X58 Express, LGA 1366 |
Память | Kingston KHX16000D3ULT1K3/6GX (6 GB), DDR3-2000 в режиме DDR3-1600 CAS 7-7-7-21 |
Видеокарта GTX 480 | MSI GeForce GTX 480 1.5 GB, 700 МГц GPU, GDDR5-3696 |
Жёсткий диск | Western Digital VelociRaptor, 600 GB (WD6000HLHX), 10 000 об/мин, SATA/600, кэш 32 Мбайт |
Звук | Встроенный HD Audio |
Сеть | Встроенная Gigabit Networking |
Блок питания | OCZ-Z1000 1000 Вт модульный |
Программное обеспечение | |
ОС | Microsoft Windows 7 Ultimate 64-bit |
Видеокарта GeForce | Nvidia ForceWare 258.96 |
Чипсет | Intel INF 9.1.1.1020 |
Наш процессор Core i7-920 был разогнан до 4,00 ГГц, чтобы минимизировать ограничения CPU в тестах 3D-игр.
Кулер Thermalright MUX-120 достаточно хорошо охлаждал наш разогнанный CPU, чтобы мы не столкнулись с какими-либо проблемами стабильности.
С эффективностью на средней нагрузке около 91% и рейтингом 80 PLUS Gold, блок питания OCZ Z1000 хорошо подходит для тестов системы под полной нагрузкой. Поскольку кривая эффективности снижается до 89% на обоих концах, вы можете умножить полученные нами значения энергопотребления от розетки на 0,9, чтобы получить фактическое энергопотребление комплектующих.
Тесты и настройки
3D-игры | |
Aliens Vs. Predator Benchmark | Alien Vs Predator Benchmark Tool Test Set 1: Highest Settings, No AA Test Set 2: Highest Settings, 4x AA |
Call of Duty: Modern Warfare 2 | Campaign, Act III, Second Sun (45 sec. FRAPS) Test Set 1: Highest Settings, No AA Test Set 2: Highest Settings, 4x AA |
Crysis | Patch 1.2.1, DirectX 10, 64-bit executable, benchmark tool Test Set 1: Highest Quality, No AA Test Set 2: Highest Quality, 4x AA |
DiRT 2 | Run with -benchmark example_benchmark.xml Test Set 1: Highest Settings, No AA Test Set 2: Highest Settings, 4x AA |
S.T.A.L.K.E.R.: Call Of Pripyat | Call Of Pripyat Benchmark version Test Set 1: Highest Settings, No AA Test Set 2: Highest Settings, 4x MSAA |
Синтетические тесты | |
3DMark Vantage | Version: 1.0.1, GPU and CPU scores |
Результаты тестов масштабирования с одной видеокартой
3DMark Vantage
В 3DMark можно оценить производительность GPU и CPU, но мы не были уверены, насколько актуальны полученные результаты для нашего сравнения пропускной способности.
Слот PCIe 2.0 x8 работает всего примерно на 1% медленнее, чем слот с 16 линиями в прогоне 1280×1024 “Performance”, а слот x4 даёт падение ещё на 3%.
Разница в производительности между слотами x16 и x4 сузилась до 2% при переходе к прогону 3DMark 1920×1200 “Extreme”.
Alien Vs. Predator
Некоторые игры ограничиваются пропускной способностью PCI Express, но другие упираются в производительность GPU или CPU. Игра Alien Vs. Predator, по всей видимости, относится к последней категории, поскольку производительность падает крайне незначительно, стоит переставить видеокарту в слот x4.
Разница между PCIe 2.0 x4 и x16 составила всего около 1%.
Call of Duty: Modern Warfare 2
Игра Call of Duty настолько быстро идёт на современном “железе”, что весьма сложно назвать какую-либо комбинацию ограниченной по производительности. Отличия, конечно, присутствуют, но комфортно играть можно в любой конфигурации.
В худшем случае GeForce GTX 480 снижает производительность в два раза – в низких разрешения при переходе на x4. Эта разница уменьшается до примерно 1/3 в высоких разрешениях, а результаты x8 находятся примерно посередине на всех трёх диаграммах.
Crysis
Наш опыт говорит о том, что Crysis обычно упирается в GPU, поэтому при повышении разрешения снижение пропускной способности PCI Express доставляет всё меньше проблем.
Слот x4 даёт падение производительности 9% в разрешении 1680×1050, а слот x8 позволяет GPU достичь 98% потенциала производительности. В целом же, слоты x8 кажутся вполне приемлемым вариантом для Crysis.
DiRT 2
DiRT 2 находится между Crysis и CoD:MW2 по зависимости от пропускной способности PCIe, получая падение производительности на 16% и 4%, когда GeForce GTX 480 приходится работать в режимах x4 и x8, соответственно.
Разница в производительности между слотами x16 и x4 снижается до 8% в разрешении 2560×1600, но радует то, что в DiRT 2 всё равно можно комфортно играть на всех трёх конфигурациях.
S.T.A.L.K.E.R.: Call Of Pripyat
Последняя игра в семействе S.T.A.L.K.E.R. весьма слабо реагирует на снижение пропускной способности, переход на слот x8 или x4 даёт всего лишь падение на 1% и 6%, соответственно, по сравнению с 16 линиями в самом низком игровом разрешении.
Повышение разрешения ещё сильнее переносит нагрузку с CPU и PCIe на видеокарту, разница между x16 и x4 составляет всего 3%. Слот x8 приводит к отставанию в производительности меньше 1% по сравнению со слотом x16 в разрешении 2560×1600.
Заключение по масштабированию PCIe
В большинстве игр мы обнаружили весьма скромные отличия между разными конфигурациями слотов. Только в Call of Duty: Modern Warfare 2 мы получили необычно большую разницу, но эта игра составляет 20% всех наших игровых тестов.
Сборщикам игровых систем можно ожидать среднее падение производительности 8% при переходе со слота x16 на x8. Это могло бы вызвать проблемы на платформах с ограниченным количеством линий PCI Express, например, на чипсете LGA 1156 при переходе в режим SLI. Но перед тем как мы рассмотрим тесты SLI, позвольте оценить влияние конфигураций на энергопотребление, температуру и эффективность.
Снижение количества используемых линий PCIe может уменьшить энергопотребление, но всё же недостаточно, чтобы на это обратили внимание владельцы high-end ПК.
Мы не рассчитывали получить разницу в температуре просто из-за перемены слота, поэтому результаты вполне логичны.
Потеря производительности без уменьшения энергопотребления приводит к существенному снижению эффективности, поскольку под эффективностью мы понимаем отношение производительности к энергопотреблению.
При перестановке одной GeForce GTX 480 из слота x16 в слот x8 PCIe 2.0 вы теряете 8% производительности. Но давайте посмотрим, что мы получим в случае конфигурации SLI. Действительно ли нам следует использовать больше шестнадцати линий PCIe для установки двух high-end видеокарт?
Результаты тестов масштабирования конфигурации SLI
3DMark Vantage
И вновь мы сталкиваемся с загадочным поведением 3DMark, у которого тесты GPU и CPU не отражают различий в некоторых реальных играх при уменьшении пропускной способности интерфейса видеокарты. Конечно, некоторые игры не используют пропускную способность шины PCI Express так же эффективно, как и другие, и, возможно, Futuremark может указать на эти игры в оправдание полученных результатов теста.
Конечно, масштабирование PCIe не очень заметно по результатам 3DMark, но нам понравилось увеличение производительности на 91% при переходе с одной видеокарты на две в тестовом прогоне 1920×1200 “Extreme”.
Alien Vs. Predator
Мы не получили существенной разницы при переходе между слотами x8 и x16 в Alien Vs Predator в наших тестах с одной видеокартой, поэтому мы не ожидали заметных отличий и в SLI. Впрочем, довольно приятно видеть, насколько хорошо конфигурация SLI масштабируется по сравнению с одной видеокартой, причём пиковый прирост производительности при переходе к SLI составляет 92%.
При повышении разрешения наблюдается странная ситуация, два слота x8 начинают обгонять два слота x16 в 2560×1600. У нас нет ни малейших идей по поводу того, что вызвало подобное неравенство, за исключением неэффективной работы SLI в этой игре. Но, возможно, причина кроется в материнской плате.
Call Of Duty: Modern Warfare 2
При установке одной видеокарты игра CoD:MW2 показала наибольшую зависимость от доступной пропускной способности PCI Express. В случае разрешения 1680×1050 производительность явно упирается в CPU, что повлияет на финальный анализ средней производительности.
Как и в случае большинства тестов, чья производительность упирается в CPU, по мере увеличения разрешения в CoD:MW2 нагрузка смещается в сторону GPU. К сожалению, при этом зависимость от пропускной способности PCI Express тоже снижается. Даже при частоте 4,00 ГГц, “плохая” производительность нашего процессора Core i7 уменьшает как масштабирование в зависимости от пропускной способности PCIe, так и масштабирование SLI.
Crysis
В нашем предыдущем тесте Crysis упиралась в производительность GPU, но при переходе на SLI мы получаем хорошую масштабируемость: прирост производительности 70% в разрешении 1680×1050, который увеличивается до 92% в 2560×1600. Мы можем отметить, что изменение масштабирования SLI имеет ту же природу, что и переход с ограничений CPU на ограничения GPU при повышении разрешения.
К сожалению, Crysis – не тот тест, где бы мы могли видеть существенное падение производительности при переходе на слот x8, и в случае двух видеокарт конфигурация в слотах x8 даёт падение от 3% в разрешении 1680×1050 до 2% в 2560×1600. По крайней мере, владельцам платформы P55 будет приятно из-за мизерного падения производительности в этой игре.
DiRT 2
DiRT 2 немного упирается в CPU при использовании двух видеокарт GeForce GTX 480 на средних разрешениях, прирост составляет “всего” 72% при переходе на SLI в разрешении 1680×1050. Опять же, зависимость от GPU увеличивается по мере повышения разрешения, поэтому прирост от SLI увеличивается до 91% в 2560×1600.
Игра DiRT 2 не очень сильно зависела от пропускной способности PCIe в случае работы одной видеокарты, поэтому тот факт, что конфигурация двух видеокарт в слотах x8 уступает конфигурации с двумя слотами x16 всего на 2-5%, нас не удивляет.
S.T.A.L.K.E.R.: Call Of Pripyat
Если вы внимательно читали статью до этого места, то вас картина производительности S.T.A.L.K.E.R. вряд ли удивит. Тестирование GeForce GTX 480 в SLI не имеет смысла при средних разрешениях, поскольку 4,00-ГГц процессор Core i7 не способен раскрыть потенциал видеокарт в разрешениях ниже 2560×1600. В S.T.A.L.K.E.R.: Call of Pripyat мы наблюдаем исключение, поскольку видеокарты уже не так хорошо справляются с этой игрой в данном разрешении.
Мы всё ещё наблюдаем прирост производительности от перехода на SLI от 75% в разрешении 1680×1050 до 94% в 2560×1600, хотя игра на максимальном разрешении шла уже не так плавно при максимальных тестовых настройках (минимальная частота кадров составила 16 fps) – большинство геймеров наверняка предпочтут снизить разрешение, уровень детализации или сглаживания, чтобы получить более плавную частоту кадров.
Заключение по масштабированию PCIe и SLI
В наших тестовых играх мы получили весьма приятное масштабирование производительности SLI, но только в самом высоком тестовом разрешении 2560×1600. В меньших разрешениях производительность часто упиралась в CPU. Для большинства игр не имеет смысл устанавливать пару видеокарт GeForce GTX 480 в разрешениях меньше 2560×1600, да и в одном игровом тесте производительности нашего 4-ГГц CPU было явно недостаточно даже в 1920×1200. Давайте посмотрим, какие результаты мы получим по масштабируемости.
Две видеокарты способны по производительности обойти одну с приростом вплоть до 90% в большинстве игр, но это касается только самого высокого тестового разрешения. Плохая масштабируемость в меньших разрешениях снизила средний прирост до всего 63%. Более того, игра, которая показала самую сильную зависимость от пропускной способности PCIe в тестах с одной видеокартой, стала полностью зависима от CPU в SLI, уничтожив 8% разницу в среднем, которую мы получили в предыдущем сравнении с одной видеокартой PCIe.
Прирост производительности в SLI превысил увеличение энергопотребления нынешней системы, но это касается только высоких разрешений. В целом же, конфигурация SLI потеряла эффективность из-за того, что в тесты мы добавили разрешение 1680×1050.
В наших тестах была ещё одна особенность: конфигурация x8/x8 SLI требовала, чтобы видеокарты вплотную прилегали друг к другу, а в конфигурации x16/x16 между видеокартами оставался свободный слот. Но мы ни разу не столкнулись с перегревом. Какие проблемы вызывает расположение видеокарт вплотную друг к другу?
Nvidia вырезала специальное отверстие в плате GTX 480 за вентилятором, чтобы видеокарты могли забирать воздух с обеих сторон. В результате мы не наблюдаем существенных изменений температур, когда видеокарты расположены вплотную друг к другу. Конечно, такой дизайн будет уже не таким эффективным для центральной видеокарты в конфигурации 3-way SLI, и в будущем мы планируем провести тесты масштабируемости более двух видеокарт.
Заключение
Главный вопрос нашего тестирования следующий: нужно ли нам более 16 линий для работы двух high-end видеокарт в конфигурации SLI? Как показали наши тесты, ответ будет, отрицательным.
Мы наблюдали довольно существенную разницу между конфигурациями x8 и x16 при использовании одной видеокарты, но при установке двух видеокарт “узким местом” становилась производительность CPU. Таким образом, для большинства протестированных игр более скоростной CPU будет намного важнее, чем два слота x16 для получения высокой производительности в конфигурации SLI.
Однако при этом возникают другие вопросы, поскольку наш мощный процессор Core i7 уже был разогнан до 4,00 ГГц. Большинство сборщиков просто не смогут найти более скоростные решения для повседневного использования в игровой сборке.
Впрочем, не будем забывать, что результат очень сильно зависит от разрешения. Зависимость от GPU увеличивается при повышении разрешения, и в какой-то момент две видеокарты начинают становиться более “узким местом”, чем CPU. Впрочем, даже в этой ситуации зависимость от GPU перевешивает зависимость от пропускной способности PCIe x8 – и интерфейс так и не становится ощутимым замедлителем.
В общем, чтобы наши наблюдения по поводу зависимости конфигураций с одной видеокартой от пропускной способности PCI Express были перенесены на конфигурации с несколькими GPU, нам требуется более мощный CPU. Эта находка наверняка обрадует владельцев “high-end” систем на P55, которые планируют апгрейд на SLI с одиночных видеокарт GeForce GTX 480. Если у вас на материнскую плату установлен высокопроизводительный процессор, то разгон до 4 ГГц и выше даст намного более ощутимый эффект, чем апгрейд на платформу с чипсетом Intel X58. Чтобы платформа Intel X58 оправдала себя, вам потребуется ещё более быстрый процессор, а также разрешения выше 2560×1600.