Насколько хорошо масштабируется PCI Express 2.0?
Нажмите на картинку для увеличения.
Интерфейс PCI Express находится на рынке уже почти четыре года, и сегодня как раз происходит постепенный переход на второе поколение. PCIe 2.0 эффективно удваивает пропускную способность и обеспечивает лучшую гибкость, сохраняя совместимость с PCIe 1.1. Когда стандарт PCI Express впервые появился, он обеспечивал большую пропускную способность, гибкость и масштабируемость, чем стареющий интерфейс AGP, и позволил графическим компаниям ATI и nVidia создать решения на основе нескольких видеокарт для более мощного ускорения 3D-графики и улучшения качества. Второе поколение шины PCI Express вышло вместе с чипсетом для энтузиастов Intel X38, а затем появилось и на чипсетах Intel X48, AMD 790/770 и nVidia nForce 7. Но нужен ли PCI Express 2.0 сегодня?
Разница в производительности между технически схожими платформами практически исчезла, в результате чего основными отличительными факторами остались функциональность и возможности разгона. Если производитель материнских плат не ошибётся в отладке своего продукта, то две материнские платы на одинаковом чипсете будут давать равную производительность при работе в одинаковых условиях. PCI Express 2.0 сегодня поддерживает только последнее поколение чипсетов, но на рынке продаётся множество других моделей, которые дают такую же производительность и сравнимый набор функций. Однако PCI Express 2.0 даёт в два раза большую пропускную способность, чем PCI Express 1.1, удвоив её с 250 Мбайт/с до 500 Мбайт/с на линию (в одном направлении). Поэтому интерфейс x16 PCI Express даёт такую же пропускную способность, что и PCI Express 2.0 x8.
Чтобы выиграть от более высокой пропускной способности, стандарт PCIe 2.0 должны поддерживать как материнская плата, так и видеокарта. Если ATI весьма быстро интегрировала поддержку PCIe 2.0 в линейку Radeon HD 3000, то лишь последнее поколение видеокарт GeForce 8800 GT/GTS и GeForce 9 совместимо с PCIe 2.0.
Мы взяли видеокарты ATI Radeon HD3850 для массового рынка и nVidia GeForce 9800 GX2 с двумя GPU, после чего провели тесты с интерфейсами PCI Express 2.0 x8, x4 и x1. Мы хотели обнаружить, необходим ли интерфейс PCI Express 2.0, чтобы получить должную производительность. В любом случае, независимо от результата, у PCI Express 2.0 есть одно существенное преимущество: новые видеокарты PCIe 2.0 совместимы с материнскими платами PCIe 1.1, то есть они будут прекрасно работать на них, используя доступную пропускную способность PCI Express 1.1.
Статьи по теме.
- “Готовимся к SLI: анализ графической производительности разных режимов PCI Express“;
- “Анализ масштабируемости PCI Express“.
Детали о PCI Express 2.0
Слоты PCI Express 1.1 и 2.0 механически идентичны. Верхний слот имеет 164 контакта, которые требуются для интерфейса x16 PCI Express, а нижний слот – 36 контактов для PCI Express x1.
Если PCI представляла собой 32- или 64-битную параллельную шину, пропускная способность которой разделялась между всеми подключёнными устройствами, то PCI Express – последовательный интерфейс на основе связей “точка-точка”. Это означает, что вся доступная пропускная способность выделяется исключительно одному устройству, а несколько подключений отрабатывается через коммутацию PCI Express на контроллере, подобно тому, как работают коммутаторы Ethernet. Несмотря на существенное отличие по сравнению с параллельной шиной PCI, интерфейс PCI Express программно совместим с PCI, то есть любая операционная система, поддерживающая шину PCI, будет работать и с PCI Express.
Одна линия PCI Express использует две пары соединений, работающих на тактовой частоте 2,5 ГГц. С помощью кодирования 8/10 битов (то есть по шине проходит 10 битов, из которых только 8 используются для передачи полезных данных) одна линия PCI Express обеспечивает чистую пропускную способность 250 Мбайт/с в одном направлении. Поскольку у линии две пары, то такую пропускную способность вы получите как в прямом, так и в обратном направлении. PCI Express может обеспечить и намного большую пропускную способность, используя несколько линий. Так, x8 PCI Express использует восемь линий, которые дают пропускную способность 4 Гбайт/с (сумма по двум направлениям), что в восемь раз больше, чем у одной линии. А интерфейс x16 PCI Express, который стал де-факто стандартом для видеокарт, даёт пропускную способность 8 Гбайт/с (суммарную).
Стандарт PCI Express 2.0 удвоил базовую частоту до 5,0 ГГц, что привело к увеличению пиковой пропускной способности до 16 Гбайт/с у x16 PCI Express (в сумме по двум направлениям). В нашей статье мы найдём ответ на вопрос, нужен или нет новый стандарт для современных видеокарт. Но одно можно сказать точно: PCI Express 2.0 обеспечил производителям большую гибкость. Поскольку четыре линии PCI Express 2.0 дают такую же пропускную способность, как восемь линий PCI Express 1.1, то вполне можно прокладывать такое же количество дорожек, удваивая пропускную способность, или оптимизировать энергопотребление, переходя с PCIe 1.1 на 2.0 и уменьшая число дорожек в два раза. Кроме того, PCI Express 2.0 поддерживает и скорости 1.1, что позволяет ещё больше экономить энергию, понижая рабочую частоту с 5,0 до 2,5 ГГц, когда высокая пропускная способность не требуется. Если PCI Express 2.0 правильно реализован, то он автоматически распознаёт ширину подключения (от одной до 16 линий) и скорость (2,5 или 5 ГГц). Это также означает, что видеокарты PCI Express 2.0 совместимы с материнскими платами PCIe 1.1: они попросту будут использовать скорость интерфейса 2,5 Гбайт/с.
Ещё одно различие между PCI Express 1.1 и 2.0 заключается в максимальной энергии, которую можно подавать на видеокарты PCI Express (PEG). Раньше она составляла 75 Вт плюс 75 Вт через вилку дополнительного питания PCI Express 1.1, но PCIe 2.0 поддерживает вплоть до 300 Вт, если интерфейс правильно реализован на материнской плате. Проектировщики видеокарт по-прежнему предпочитают использовать гнёзда дополнительного питания, но блоки питания, совместимые с PCI Express 2.0, дают дополнительную 8-контактную вилку, помимо обычной 6-контактной, которая появилась в момент выхода PCIe в 2004 году.
Чипсеты PCI Express 2.0
В следующей таблице приведены чипсеты и видеокарты с поддержкой PCI Express 2.0, доступные сегодня.
Производитель чипсета | Название | Число линий | Платформа |
ATI | AMD790FX (65 нм) | 42x PCI Express 2.0 | AMD Socket AM2+ HyperTransport 3.0 |
ATI | AMD790FX (65 нм) | 32x PCI Express 2.0 | AMD Socket AM2+ HyperTransport 3.0 |
ATI | AMD770FX (65 нм) | 20x PCI Express 2.0 | AMD Socket AM2+ HyperTransport 3.0 |
Intel | X38 (65 нм, FSB1333) | 40x PCI Express 2.0 | Socket 775 |
Intel | X48 (65 нм, FSB1600) | 40x PCI Express 2.0 | Socket 775 |
Nvidia | nForce 780a SLI | 48x PCI Express 2.0 | AMD Socket AM2+ HyperTransport 3.0 |
Nvidia | nForce 780i SLI (65 нм) | 40x PCI Express 2.0 | Socket 775, FSB1333 |
Nvidia | nForce 790i SLI (65 nm) | 48x PCI Express 2.0 | Socket 775, FSB1600 |
Производитель GPU | Название | Категория |
ATI | Radeon HD3450 (55 нм) | Начальный уровень |
ATI | Radeon HD3470 (55 нм) | Начальный уровень |
ATI | Radeon HD3650 (55 нм) | Массовый сегмент |
ATI | Radeon HD3850 (55 нм) | Массовый сегмент |
ATI | Radeon HD3870 (55 нм) | High-End |
ATI | Radeon HD3870 (55 нм) | Для энтузиастов |
Nvidia | GeForce 8800 GT (65 нм) | Массовый сегмент |
Nvidia | GeForce 8800 GTS 512 MB (65 нм) | High-end |
Nvidia | GeForce 9600 GT (65 нм) | Массовый сегмент |
Nvidia | GeForce 9800 GTX (65 нм) | High End |
Nvidia | GeForce 9800 GX2 (65 нм) | Для энтузиастов |
Все материнские платы PCI Express 2.0 совместимы с видеокартами PCI Express 1.1 и наоборот, но для автоматической регулировки ширины и частоты вам потребуется совместимость с PCI Express 2.0. Наши тесты посвящены решениям PCI Express 2.0 на всех возможных сочетаниях линий.
Тесты x16, x8, x4, x1
Число линий PCI Express можно уменьшить, просто заклеив скотчем контакты, которые не требуются. Но будьте аккуратны. Нажмите на картинку для увеличения.
Мы вновь использовали заклейку контактов скотчем, чтобы уменьшить число используемых линий PCI Express 2.0. Для x16 PCIe 2.0 заклейки не требовалось, но затем нам приходилось заклеивать всё больше и больше из 164 контактов, чтобы уменьшить пропускную способность. Будьте аккуратны и заклеивайте только нужные контакты.
PCIe 2.0 x16
Нажмите на картинку для увеличения.
16 линий PCI Express 2.0 обеспечивают максимальную пропускную способность для современных видеокарт PCI Express 2.0. Пропускная способность составляет 8 Гбайт/с в каждом направлении (16 Гбайт/с в сумме).
ATI Radeon HD 3850, работающий на 16 линиях PCI Express 2.0.
PCIe 2.0 x8
Нажмите на картинку для увеличения.
Восемь линий PCI Express 2.0 дают ту же производительность, что и интерфейс x16 PCI Express 1.1, а именно, 4 Гбайт/с в каждом направлении (8 Гбайт/с в сумме). Обычно интерфейсы с 8 линиями PCI Express используют RAID-контроллеры или high-end сетевые карты (с волоконной оптикой). Впрочем, сегодня продуктов на PCIe 2.0 очень мало, и стандартом до сих пор можно считать x8 PCIe 1.1.
GPUZ даёт информацию о сниженном количестве линий PCIe 2.0. Следующим шагом мы протестируем видеокарты ATI Radeon HD3850 и nVidia GeForce 9800 GX2 с восемью линиями PCIe 2.0.
PCIe 2.0 x4
Нажмите на картинку для увеличения.
Четыре линии PCI Express часто используют контроллеры накопителей для массового рынка или такие мультимедийные устройства, как карты захвата видео. Как можно видеть в разделе тестов, многие игры показали вполне достойные результаты, хотя снижение с 16 линий до четырёх уже не даёт достаточную пропускную способность для видеокарты.
Теперь активны всего четыре линии PCI Express.
PCIe 2.0 x1
Нажмите на картинку для увеличения.
Наконец, мы проверили работу обеих видеокарт всего с одной линией PCI Express 2.0. Она обеспечивает пропускную способность 500 Мбайт/с в обоих направлениях (1 Гбайт/с в сумме). Результаты тестов нас не удивили.
Обычно одну линию PCI Express используют сетевые карты начального уровня и коммуникационные устройства. Вполне понятно, что пропускной способности для 3D-графики будет маловато.
Тестовая конфигурация
Системное аппаратное обеспечение | |
Процессоры | Intel Core 2 Extreme QX6850 (65 нм двуядерный, 3,0 ГГц, 8 Мбайт кэша L2) |
Платформа Intel S775 | Asus P5E3 Deluxe, Rev.1.03, Intel X38, BIOS: 1001 |
Память | 2x 1 Гбайт DDR3-1066 |
DVD-ROM | Samsung SH-D163A , SATA150 |
Жёсткий диск | Western Digital WD5000AAKS, 500 Гбайт, 7 200 об/мин, SATA/300, кэш 16 Мбайт |
Видеокарта I | Gigabyte Radeon HD 3850 GV-RX385512H, GPU: 670 МГц, память: 512 Мбайт DDR3 (1 660 МГц, 256 битов) |
Видеокарта II | Gainward Bliss 9800 GX2, GPU: 600 МГц, память: 1 Гбайт DDR3 (1 000 МГц, 256 битов) |
Блок питания | Coolermaster RS-850-EMBA, ATX 12V V2.2, 850 Вт |
Верхний сегмент массового рынка: AMD/ATI Radeon HD 3850
Нажмите на картинку для увеличения.
Мы использовали видеокарту Radeon HD 3850, которая является частью эталонной системы Tom’s Hardware Guide. Графическое ядро RV670 работает на частоте 670 МГц, а 512 Мбайт памяти DDR3 – на 1 660 МГц (эффективная частота). Перед нами вполне приличная видеокарта для верхнего сегмента массового рынка, которая обеспечивает хорошую 3D-производительность, а также поддержку DirectX 10.1 и Shader Model 4.1 при низком энергопотреблении, связанном с 55-нм техпроцессом. Однако она не может конкурировать с картами GeForce 8800 или более производительными моделями.
High-End: nVidia GeForce 9800GX2
Нажмите на картинку для увеличения.
Новая GeForce 9800 GX2 использует два GPU G92 от nVidia (те же, что используются в 8800 GTS 512 MB) для повышения производительности. Поэтому GPU производится по 65-нм техпроцессу, по которому изготовляются современные чипы линеек GeForce 8 и 9, DirectX 10 поддерживается, но Shader Model 4.1 – нет. Впрочем, перед нами всё равно самое быстрое на сегодня графическое решение, и оно будет работать ещё быстрее на новой платформе nForce 790i SLI, если объединить две такие карты в режим SLI. Однако следует обратить внимание, что если для видеокарты ATI указано максимальное энергопотребление ниже 100 Вт, то графический “бегемот” от nVidia потребляет до 200 Вт при тяжёлой нагрузке.
Нажмите на картинку для увеличения.
Нажмите на картинку для увеличения.
Тесты и настройки
Системное ПО и драйверы | |
ОС | Windows Vista Enterprise Version 6.0 (Build 6000) |
DirectX 10 | DirectX 10 (Vista default) |
DirectX 9 | Версия: April 2007 |
Звук | Vista Driver 2.13.0012 (15.03.2007) |
Графический драйвер I | ATI Catalyst 8.3 |
Графический драйвер II | nVidia GeForce 174.74 |
Драйвер чипсета Intel | Версия 8.1.1.1010 (21/11/2006) |
Драйвер подсистемы хранения | Matrix Storage Manager 7.0.0.1020 |
Java | Java Runtime Environment 6.0 Update 1 |
Тесты и настройки | |
3D-игры | |
Warhammer Mark of Chaos | Version: 1.006.000 Video Mode: 1600×1200 Video Quality: game default Multiple CPU/Core Demo: THG Timedemo (1 минута) |
Quake 4 | Version: 1.3 Final Video Mode: 1600×1200 Video Quality: Ultra Antialiasing: 8x Benchmark: THG Timedemo |
Call of Duty | Version: 1.4 Video Mode: 1600×1200 Anisotropic: Max Antialiasing: 4x Benchmark: Coup-Intro |
Crysis | Version: 1.2 Video Mode: Various |
Prey | Version: 1.3 Video Mode: 1600×1200 Video Quality: game default Vsync = off Antialiasing: 4x Anisotropic: 16x Benchmark: THG-Demo |
Microsoft Flight Simulator X | Version: SP2 Graphics: 1600×1200 Target Framerate: Unlimited Antialiasing: On Light Bloom: On Aircraft: Ultra High Scenery: Ultra High Weather: Ultra High Traffic: Ultra High |
Синтетические тесты | |
3DMark06 | Version: 1.10 1600×1200 – 32 bit Antialiasing: 8x Anisotropic: 16x |
PCMark Vantage | Version: 3.14.1.1 Game Tests Antialiasing: 8x Anisotropic: 16x |
Radeon HD 3850
Что интересно, Microsoft Flight Simulator X требует большой пропускной способности от интерфейса видеокарты, чтобы из оперативной памяти ПК своевременно поступали текстуры высокой детализации. Снижение пропускной способности шины PCI Express существенно ухудшает частоту кадров.
Новый PCMark Vantage практически не замечает изменения пропускной способности интерфейса. Похоже, этот тест зависит, в первую очередь, от GPU, работая с локальной памятью видеокарты.
GeForce 9800 GX2
Два GPU у GeForce 9800 GX2 требуют, по меньшей мере, интерфейса x8 PCI Express 2.0, чтобы обеспечивать высокую частоту кадров. Переход на режим x4, как видим, приводит к появлению “узкого места”.
В Crysis заметна разница при запуске игры с уменьшенным числом линий PCI Express 2.0, но только на самом высоком разрешении. Интересно отметить, что вы получите практически полную производительность даже в режиме PICe x4.
Результаты подтверждают то, что мы уже видели в случае видеокарты ATI Radeon HD 3850: Flight Simulator X очень сильно зависит от доступной пропускной способности PCI Express. Снижение линий x16 PCI Express 2.0 приводит к заметному уменьшению частоты кадров в этом симуляторе, поскольку доступ к текстурам в оперативной памяти ПК оказывается слишком медленным.
Относительные результаты тестов
На следующих страницах приведены результаты тестов, нормализованные по производительности x16 PCI Express 2.0 (= 100%).
Radeon HD 3850
GeForce 9800 GX2
Заключение
Нажмите на картинку для увеличения.
PCI Express 2.0 даёт несколько преимуществ производителям аппаратного обеспечения, которые сложно раскрыть в подобном техническом анализе, как эта статья. С помощью программного обеспечения можно управлять энергопотреблением, добавляя или убирая линии PCI Express, а также меняя частоту соединения. Кроме того, PCI Express 2.0 удовлетворяет требованиям современных карт по энергопотреблению. В то же время, PCIe 2.0 полностью совместим с предыдущим оборудованием, так что потребитель не рискует ничем, а переход от одного поколения графических чипов к другому произойдёт прозрачно. С данной точки зрения мы определённо рекомендуем PCIe 2.0 каждому, поскольку недостатков нет.
Но стоит ли гнаться за PCIe 2.0 сегодня? Если графическое решение сможет работать с данными, целиком хранящимися в локальной видеопамяти, будь то Radeon HD 3850 для массового рынка или топовая модель GeForce 9800 GX2, производительность будет близка к максимуму, даже если пропускная способность PCI Express будет снижена до x8 или x4. Но как только требуется доступ к большим текстурам в оперативной памяти ПК, как происходит в случае Crysis или Microsoft Flight Simulator X, то пропускная способность интерфейса становится критической. Любой интерфейс ниже x16 ощутимо снизит частоту кадров в этих играх.
Ответ, следовательно, должен быть “да”: если вам нужна пропускная способность PCI Express 2.0 для “тяжёлых” 3D-приложений. Но другие тесты, такие, как Futuremark 3DMark06, PCMark Vantage, Prey или Quake, говорят нам обратное: они могут уместить все графические данные в память видеокарт с 512 Мбайт (Radeon HD 3850) или 2x 512 Мбайт (GeForce 9800 GX2).