PCI Express 2.0 против 1.0a: тесты одиночных видеокарт и CrossFire
Редакция THG,  15 января 2008


Введение

Crossfire, PCI Express 2.0

Читатели в форумах активно интересуются новым интерфейсом PCI Express 2.0. Хватит ли для него чипсета Intel P35, или X38 будет лучшим выбором? Какой прирост производительности можно ожидать от подобного обновления? Могут ли современные видеокарты выиграть от увеличения пропускной способности интерфейса PCI Express?

Многие считают, что чипсет Intel 975 с "урезанным" интерфейсом PCIe не позволяет современной конфигурации на двух картах HD38x0 раскрыться в полную силу. И такую систему уже нельзя считать современной. В этом есть определённая доля истины. Мы провели сравнительные тесты на чипсете X38 и обнаружили, что в некоторых специфических тестах, которые фокусируются на высоких разрешениях CrossFire, прирост производительности действительно есть. В лучшем случае мы получили до 20% прироста.

В данном тесте мы проверим производительность таких современных видеокарт с интерфейсом PCI Express 2.0, как nVidia GeForce 8800 GT и 8800 GTS 512, а также ATI Radeon HD 3850 и 3870. Мы добавили в тест и ATI Radeon HD2900XT. Эта видеокарта относится к классу PCIe 1.1, но она остаётся самым быстрым предложением AMD, поэтому идеально подойдёт для сравнения производительности старой и новой платформ.

Сравнение графических чипов

В данный тест мы добавили наиболее свежие видеокарты nVidia и конфигурации SLI. Напомним, что только nVidia GeForce 8800 GT и 8800 GTS 512, а также ATI Radeon HD3850 и HD3870 уже оснащены интерфейсом PCI Express 2.0.

Видеокарты nVidia
Видеокарта и чип Кодовое название Память Блок шейдеров Частота GPU Частота памяти
GeForce 8800 Ultra ОС G80 768 Мбайт GDDR3 4.0, 1 512 МГц 660 МГц 2300 МГц
GeForce 8800 GTX G80 768 Мбайт GDDR3 4.0, 1 350 МГц 576 МГц 1 800 МГц
GeForce 8800 GTS ОС SLI G92 512 Мбайт GDDR3 4.0, 1 825 МГц 730 МГц 1944 МГц
GeForce 8800 GTS ОС G92 512 Мбайт GDDR3 4.0, 1 825 МГц 730 МГц 1944 МГц
GeForce 8800 GT ОС SLI G92 512 Мбайт GDDR3 4.0, 1 650 МГц 660 МГц 1 900 МГц
GeForce 8800 GT ОС G92 512 Мбайт GDDR3 4.0, 1 650 МГц 660 МГц 1900 МГц
Видеокарты AMD
Видеокарта и чип Кодовое название Память Блок шейдеров Частота GPU Частота памяти
Radeon HD3870 ОС CF RV670 512 Мбайт GDDR4 4.1 800 МГц 2 252 МГц
Radeon HD3870 ОС RV670 512 Мбайт GDDR4 4.1 800 МГц 2 252 МГц
Radeon HD3850 ОС CF RV670 256 Мбайт GDDR3 4.1 690 МГц 1 658 МГц
Radeon HD3850 ОС RV670 256 Мбайт GDDR3 4.1 690 МГц 1 658 МГц
Radeon HD2900 XT CF R600 512 Мбайт GDDR3 4.0 743 МГц 1 656 МГц
Radeon HD2900 XT R600 512 Мбайт GDDR3 4.0 743 МГц 1 656 МГц

В таблице указана эффективная частота памяти (DDR), физическая будет в два раза меньше. OC - разогнанная карта. SLI - соответствующий режим совместной работы карт nVidia. CF - соответствующий режим CrossFire совместной работы карт AMD.


Одиночные карты nVidia, одиночные карты AMD и две в CrossFire
CPU Intel Core 2 Extreme X6800, 2,93 ГГц, FSB1066
Материнская плата Intel D975XBX2, PCIe 1.0a, чипсет Intel 975X
Память 2x1 Гбайт, Vitesta DDR2 800 4-4-4-12 533 МГц
Жёсткий диск Hitachi 2 x 120 Гбайт SATA, кэш 8 Мбайт
DVD Gigabyte GO-D1600C
LAN Intel 1000 Pro
Звук Intel High Definition Audio
Блок питания Seasonic M12 600 Вт
Одиночные карты nVidia, одиночные карты AMD и две в CrossFire
CPU Intel Core 2 Extreme X6800, 2,93 ГГц, FSB1066
Материнская плата Asus P5E3 Deluxe, PCIe 2.0, чипсет Intel X38
Память 2x1 Гбайт, Ballistix DDR3 800 5-5-5-16 800 МГц
Звук Intel High Definition Audio
Блок питания CoolerMaster RS-850-EMBA 850 Вт
Две видеокарты nVidia в SLI
CPU Intel Core 2 Extreme X6800, 2,93 ГГц, FSB1066
Материнская плата nVidia 680i SLI, чипсет nVidia 680i SLI
Драйверы и система
Видеокарта ATI Catalyst 7.11
nVidia Forceware 169.12, 8800 GTS 512 MSI 169.06
ОС Windows Vista Enterprise
DirectX 10
Драйвер чипсета Intel 975BX2 Intel 8.2.0.1014, X38 Intel 8.3.1.1009

Слоты PCI Express x16, x8 и x4

Материнская плата, которую мы использовали для тестов в прошлом году, была построена на чипсете 975 и предоставляла слоты PCI Express с числом линий x16, x8 и x4. По очевидным причинам, если вы используете в системе одну видеокарту, то на материнской плате лучше использовать самый быстрый слот PCI Express. В случае нашей 975BX2 этот слот располагался ближе к CPU и обеспечивал полное число линий x16.

Часто скорость слота PCIe можно узнать по маркировке на материнской плате. Например, слот x16 может быть маркирован, как поддерживающий скорость x8. Это достаточно важная информация для пользователей CrossFire. Когда используются две видеокарты AMD в режиме CrossFire, то линии x16 разбиваются на два слота x8.

Crossfire, PCI Express 2.0

Первый слот PCI Express поддерживает полную скорость x16, его и следует использовать для видеокарты. Нажмите на картинку для увеличения.

Crossfire, PCI Express 2.0

Второй слот PCI Express поддерживает x8. В режиме CrossFire первый слот тоже переходит в конфигурацию x8. Нажмите на картинку для увеличения.

Crossfire, PCI Express 2.0

Третий слот для видеокарт лучше не использовать - он даёт всего x4 линии PCIe. Нажмите на картинку для увеличения.

На рынке есть дешёвые материнские платы, поддерживающие слоты AGP и PCI Express, да и вы можете встретиться со слотами, которые дают скорость всего x4. Мы уже проводили тесты в нескольких современных играх на разных скоростях и в разных разрешениях. Результаты x8 наглядно показывают, что конфигурация CrossFire уже будет испытывать падение производительности, поскольку чипсет 975 даёт два интерфейса только в режиме x8.

Производительность одиночных видеокарт - HD2900 XT (512 Мбайт), PCIe 1.0a x4, x8 и x16 fps Процент
HD2900 XT (512 Мбайт) PCIe 1.0a x4 1209,4 67,3
HD2900 XT (512 Мбайт) PCIe 1.0a x8 1673,6 93,1
HD2900 XT (512 Мбайт) PCIe 1.0a x16 1796,8 100,0
Производительность одиночных видеокарт - 8800 GTS (512 Мбайт), PCIe 1.0a x4, x8 и x16 fps Процент
8800 GTS (512 Мбайт) ОС PCIe 1.0a x4 1678,1 75,1
8800 GTS (512 Мбайт) ОС PCIe 1.0a x8 2063,6 92,3
8800 GTS (512 Мбайт) ОС PCIe 1.0a x16 2235,3 100,0

В приведённой таблице интерфейс x16 взят за 100%. Видеокарты AMD и nVidia теряют около 7-8 процентов производительности при переходе к слоту x8. Теоретически, в конфигурации CrossFire падение производительности будет в два раза выше. При перестановке видеокарты в слот x4 падение 3D-производительности ещё более заметно. Как видим, скорость GeForce 8800 GTS 512 снижается на 25 процентов, а ATI HD2900 XT - на целых 33 процента.

Если посмотреть на цены современных видеокарт и падение производительности из-за медленных соединений, то на материнской плате лучше не экономить. Падение производительности на 25-33% вряд ли приемлемо.

CrossFire x8 + x8 против x16 + x16

Чипсет X38 позволяет двум видеокартам работать с полноценным интерфейсом x16 на каждую. Поскольку этот чипсет Intel поддерживает сдвоенную конфигурацию только на видеокартах AMD, нам пришлось ими и ограничиться.

Кроме того, мы ограничили наши тесты разрешениями, в которых конфигурации CrossFire демонстрируют ощутимый прирост производительности на нашей старой материнской плате 975BX2 в конфигурации 2x8. Обычно наши тесты состоят из 35 прогонов в разных разрешениях, но в данном случае мы ограничились всего 13.

Call of Duty 4
1 280 x 1 024, 0xAA, Trilinear, max. Quality
1 680 x 1 050, 0xAA, Trilinear, max. Quality
1 920 x 1 200, 0xAA, Trilinear, max. Quality
1 280 x 1 024, 4xAA, 8xAF, max. Quality
1 680 x 1 050, 4xAA, 8xAF, max. Quality
1 920 x 1 200, 4xAA, 8xAF, max. Quality
Doom 3
1 600 x 1 200, 4xAA, 8xAF, Ultra Quality
Half Life 2 Episode 2
1 280 x 1 024, 4xAA, 8xAF, Very High Quality
1 680 x 1 050, 4xAA, 8xAF, Very High Quality
1 920 x 1 200, 4xAA, 8xAF, Very High Quality
World in Conflict
1 280 x 1 024, 0xAA, Trilinear, Very High Quality
1 680 x 1 050, 0xAA, Trilinear, Very High Quality
1 920 x 1 200, 0xAA, Trilinear, Very High Quality

В режиме CrossFire видеокарты Radeon HD3870 и HD2900 XT при переходе с x8x8 на x16x16 обеспечивают прирост производительности на 12 процентов. Radeon HD3850 выигрывает сильнее всего, получая 15% прирост производительности.

Суммарная производительность: CrossFire PCle x8x8 против x16x16 fps Процент
HD2900 XT (512 Мбайт) CF PCle 1.0a x8x8 1190,1 100,0
HD2900 XT (512 Мбайт) CF PCle 2.0 x16x16 1335,1 112,2
HD3870 (512 Мбайт) ОС CF PCle 1.0a x8x8 1163,8 100,0
HD3870 (512 Мбайт) ОС CF PCle 2.0 x16x16 1312,8 112,8
HD3850 (256 Мбайт) ОС CF PCle 1.0a x8x8 981,4 100,0
HD3850 (256 Мбайт) ОС CF PCle 2.0 x16x16 1128,6 115,0

Давайте рассмотрим результаты в перспективе. Прирост производительности от 12 до 15 процентов касается только 13 из 35 тестовых прогонов. Если же принять во внимание все 35 прогонов, то прирост производительности составит от 6 до 7,7 процентов. Если же вы хотите посмотреть на конкретные значения производительности отдельных тестов, то мы привели их ниже.

Самый большой прирост составляет почти 20% в Call of Duty 4 на конфигурации CrossFire Radeon HD3850. С другой стороны, Call of Duty 4 уже плавно работает даже в конфигурации x8. В разрешении 1 920 x 1 200 с полноэкранным сглаживанием и анизотропной фильтрацией частота возрастает с 53 до 63 fps. В остальных разрешениях мы получаем производительность больше 60 или даже 100 fps на всех трёх конфигурациях со сдвоенными видеокартами. В любом случае, мы получили новый рекорд. Видеокарты Radeon HD2900 XT обеспечили 215,6 fps в режиме CrossFire, хотя две GeForce 8800 GTS 512 смогли дать "всего" 176,7 fps на материнской плате 680i.

В Doom 3 производительность увеличивается на 5 процентов. Другими словами, вы получите 110 вместо 105 fps. В Half Life 2 Episode 2 прирост составляет 9 процентов на новых видеокартах HD38x0, поскольку частота увеличивается от 64 до 71 fps или от 75 до 80 fps. В World in Conflict прирост замерить было можно, но на практике он не ощутим: игра работает на 1-3 fps быстрее.

Производительность CrossFire в отдельных тестах, PCIe x8x8 против x16x16
Игра fps Процент
Call of Duty 4
HD2900 XT (512 MB) CF PCIe 1.0a x8x8 779,2 100,0
HD2900 XT (512 MB) CF PCIe 2.0 x16x16 904,8 116,1
HD3870 (512 MB) ОС CF PCIe 1.0a x8x8 747,3 100,0
HD3870 (512 MB) ОС CF PCIe 2.0 x16x16 870,9 116,5
HD3850 (256 MB) ОС CF PCIe 1.0a x8x8 593,0 100,0
HD3850 (256 MB) ОС CF PCIe 2.0 x16x16 710,5 119,8
Doom 3
HD2900 XT (512 MB) CF PCIe 1.0a x8x8 107,7 100,0
HD2900 XT (512 MB) CF PCIe 2.0 x16x16 112,9 104,8
HD3870 (512 MB) ОС CF PCIe 1.0a x8x8 106,7 100,0
HD3870 (512 MB) ОС CF PCIe 2.0 x16x16 112,6 105,5
HD3850 (256 MB) ОС CF PCIe 1.0a x8x8 104,1 100,0
HD3850 (256 MB) ОС CF PCIe 2.0 x16x16 109,0 104,7
Half Life 2 Ep. 2
HD2900 XT (512 MB) CF PCIe 1.0a x8x8 223,2 100,0
HD2900 XT (512 MB) CF PCIe 2.0 x16x16 234,4 105,0
HD3870 (512 MB) ОС CF PCIe 1.0a x8x8 219,8 100,0
HD3870 (512 MB) ОС CF PCIe 2.0 x16x16 239,3 108,9
HD3850 (256 MB) ОС CF PCIe 1.0a x8x8 212,3 100,0
HD3850 (256 MB) ОС CF PCIe 2.0 x16x16 231,1 108,9
World in Conflict
HD2900 XT (512 MB) CF PCIe 1.0a x8x8 80,0 100,0
HD2900 XT (512 MB) CF PCIe 2.0 x16x16 83,0 103,8
HD3870 (512 MB) ОС CF PCIe 1.0a x8x8 90,0 100,0
HD3870 (512 MB) ОС CF PCIe 2.0 x16x16 90,0 100,0
HD3850 (256 MB) ОС CF PCIe 1.0a x8x8 72,0 100,0
HD3850 (256 MB) ОС CF PCIe 2.0 x16x16 78,0 108,3

В целом, смена платформы даёт прирост всего на несколько процентов. Игры, которые и до этого шли плавно, будут идти чуть быстрее. А такие "медленные" игры, как Crysis или Flight Simulator X, пока ещё не выигрывают от оптимизации CrossFire с драйверами WHQL. Сегодня переход с x8 на x16 в CrossFire оправдывает себя только на высоких разрешениях. В самом высоком разрешении 1 920 x 1 200 пикселей только один тест мог ощутимо выиграть от более скоростного интерфейса, обеспечив прирост от 53 до 63 fps. На остальных разрешениях игра и так уже идёт плавно, частота кадров превышает порог 60 или 100 fps, так что любое улучшение скажется больше на рейтинге производительности, чем на реальной скорости.

Переход с PCI Express 1.0a на 2.0

Здесь можно сказать сразу: переход с PCI Express 1.x на 2.0 сегодня себя не оправдывает. Современное поколение видеокарт попросту не нагружает шину PCI Express до такой степени, чтобы разница была ощутимой. Все тестовые карты показали ничтожный прирост производительности от 1 до 2 процентов, да и HD2900 XT смогла улучшить свой результат, хотя у этой карты нет интерфейса 2.0.

Производительность одиночных видеокарт PCIe 1.0a x16 против 2.0 x16
Видеокарта fps Процент
HD3850 ОС (256 MB)
HD3850 (256 MB) ОС PCIe 1.0a x16 1 576,5 100,0
HD3850 (256 MB) ОС PCIe 2.0 x16 1 612,4 102,3
HD3870 ОС (512 MB)
HD3870 (512 MB) OC PCIe 1.0a x16 1 795,3 100,0
HD3870 (512 MB) ОС PCIe 2.0 x16 1 828,6 101,9
HD2900 XT (512 MB)
HD2900 XT (512 MB) PCIe 1.0a x16 1 796,8 100,0
HD2900 XT (512 MB) PCIe 2.0 x16 1 832,8 102,0
8800 GT (512 MB)
8800 GT (512 MB) OC PCIe 1.0a x16 2 137,9 100,0
8800 GT (512 MB) ОС PCIe 2.0 x16 2 185,1 102,2
8800 GTS (512 MB)
8800 GTS (512 MB) ОС PCIe 1.0a x16 2 235,3 100,0
8800 GTS (512 MB) ОС PCIe 2.0 x16 2 260,6 101,1

Подобное улучшение может быть связано с более новым чипсетом или небольшой разницей в производительности памяти. Разница в 1-3 процента слишком мала, чтобы считать её весомой, - она находится в пределах погрешности. Однако нам ещё предстоит увидеть, какова будет ситуация после выхода таких новых видеокарт, как GeForce 9 или Radeon 4xx0, если они начнут передавать по шине большие объёмы данных. В любом случае, чипсетов P35 и 975 для текущего поколения видеокарт достаточно.

Результаты тестов

Для полноты картины мы добавили отдельные результаты тестов GeForce 8800 GTX, Ultra, GT и GTS-512. Для сравнения CrossFire между x16x16 и x8x8 мы проводили тесты только в подходящих разрешениях, в которых, судя по нашим предыдущим тестам, наблюдается прирост производительности. Во всех других разрешениях мы конфигурацию не тестировали, а результаты обозначены как "Kein Test" ("не тестировалось").

BlackSite Area 51

BlackSite Area 51

BlackSite Area 51

BlackSite Area 51

Call of Duty 4

Call of Duty 4

Call of Duty 4

Call of Duty 4

Call of Duty 4

Call of Duty 4

Call of Duty 4

Crysis

Crysis

Crysis

Crysis

Crysis

Doom 3

Doom 3

Doom 3

Doom 3

Doom 3

Half Life 2 Episode 2

Half Life 2 Episode 2

Half Life 2 Episode 2

Half Life 2 Episode 2

Half Life 2 Episode 2

Half Life 2 Episode 2

Half Life 2 Episode 2

Microsoft Flight Simulator X SP1

Microsoft Flight Simulator X SP1

Microsoft Flight Simulator X SP1

Microsoft Flight Simulator X SP1

Microsoft Flight Simulator X SP1

Microsoft Flight Simulator X SP1

Microsoft Flight Simulator X SP1

World in Conflict

World in Conflict

World in Conflict

World in Conflict

World in Conflict

World in Conflict

World in Conflict

Заключение: переход на PCI Express 2.0 пока ничего не даёт

Crossfire, PCI Express 2.0

Установка видеокарты в слот PCI Express x4 - дело совершенно неразумное, поскольку производительность упадёт на 25-33 процента. Даже если вы купите самую дешёвую материнскую плату с таким слотом, это ощутимо повлияет на соотношение цена/производительность видеокарты. Да, при переходе с x16 на x8 производительность тоже падает, но, в среднем, на 7-8 процентов.

Переход на чипсет X38 для конфигураций CrossFire сегодня вполне логичен. Два интерфейса x16 обеспечивают средний прирост производительности на 6-7,7 процента (x16x16 против x8x8), а в таких оптимизированных играх, как Call of Duty 4, прирост может достигать почти 20 процентов. Если же отобрать игры и разрешения, на которых CrossFire даёт прирост производительности, то переход на x16x16 обеспечит прирост на 12-15 процентов.

Кроме того, мы увидели, что сдвоенная конфигурация x16x16 для CrossFire оказывается не более эффективной, чем для одиночной видеокарты x16. Как упоминалось выше, одна видеокарта выигрывает от 7 до 8 процентов по сравнению со слотом x8. Переход с x8x8 на x16x16 даёт всего лишь 7,7-процентный прирост, что отнюдь не в два раза выше. Хотя в начале статьи мы предполагали именно удвоение.

На данный момент переход с PCI Express 1.0a на 2.0 не даст прирост производительности, если рассматривать видеокарты современного поколения. Несмотря на то, что у ATI Radeon HD2900 XT нет интерфейса PCIe 2.0, эта видеокарта получила прирост производительности на два процента, как и модели HD3850 и HD3870, а также nVidia GeForce 8800 GT. Подобный мизерный прирост может быть вообще связан не с новым интерфейсом, а с обновлённым чипсетом, немного оптимизированной подсистемой памяти или вообще с погрешностью измерения.

Является ли переход на материнскую плату с чипсетом P35 или X38 стоящим вложением денег для систем с одиночной видеокартой - решать вам. Если вы собираете новую систему для возможной установки CrossFire, то мы рекомендуем плату на чипсете X38 с двумя слотами x16 PCIe. Модернизация системы CrossFire с чипсета Intel 975X или P35 на X38 оправдает себя, только если вы играете на разрешениях 1 920 x 1 200 или выше.

КОНЕЦ СТАТЬИ


Координаты для связи с редакцией:

Общий адрес редакции: thg@thg.ru;
Размещение рекламы: Roman@thg.ru;
Другие координаты, в т.ч. адреса для отправки информации и пресс-релизов, приглашений на мероприятия и т.д. указаны на этой странице.


Все статьи: THG.ru

 

Rambler's Top100 Рейтинг@Mail.ru