nForce4 Intel Edition наступает на Intel 925XE
Сделав себе неплохое имя в бизнесе чипсетов, nVidia сделала ещё один шаг – наконец-то, анонсировала долгожданный чипсет для платформы Intel.
19 ноября 2004 года nVidia подписала соглашение с Intel о перекрёстном лицензировании, что позволило компаниям обмениваться своими технологиями. Для nVidia этот шаг очень важен, так как он открывает nForce рынок чипсетов для процессоров Intel.
Правильное название чипсета “nForce4 (Intel Edition)” выбрано вполне разумно (в статье мы будем называть чипсет “nForce4 IE”). Название nForce5, насчёт которого ходило много слухов, невольно указывало бы на превосходство чипсета над nForce4 для Athlon. Но это не так, хотя ряд улучшений всё же есть. Фундаментальное отличие заключается в том, что на платформе Intel контроллер памяти входит в логику чипсета. В результате nVidia пришлось отказаться от одночипового дизайна, что, в свою очередь, позволило улучшить ряд отдельных компонентов.
nVidia желает расширить технологию сдвоенной графики SLI на как можно большее число систем, от high-end до массового рынка. Однако nVidia прекрасно знает и о том, что, хотя nForce4 IE нацеливается на high-end, одной разницы в графике будет недостаточно для конкуренции с Intel. В конце концов, чиповый гигант за многие годы прекрасно отработал технологии системной логики и предлагает надёжные и качественные чипсеты. И здесь единственным вариантом остаётся соревнование Intel в тех областях, где эта компания уверенно себя чувствует – в высокоскоростных и гибких интерфейсах памяти и подсистемах хранения.
Впрочем, довольно разглагольствовать – давайте перейдём к деталям.
nForce4 Intel Edition в деталях
nForce4 IE использует классический дизайн чипсета, состоящий из двух чипов: северного и южного мостов. nVidia решила назвать чипы по-другому: System Platform Processor (SPP) и Media and Communications Processor (MCP). SPP использует совершенно новый контроллер памяти DDR2 и поддерживает 19 линий PCI Express. 16 линий отведены для одной графической кары (x16 PCIe) или конфигурации SLI (два разъёма x16, работающих в режиме x8 каждый). Оставшиеся линии зарезервированы для трёх портов x1 PCIe.
MCP поддерживает звуковую систему 7.1 (впрочем, это не SoundStorm), десять портов Hi-Speed USB 2.0, а также интерфейс гигабитного Ethernet nVidia, включающий аппаратный межсетевой экран под названием ActiveArmor. Можно использовать пять 32-битных PCI-слотов. Подсистема хранения поддерживает два канала UltraATA и четыре порта SATA с полной поддержкой очереди команд NCQ и скорости 3 Гбит/с. nVidia объединила подсистему хранения под названием MediaShield.
Что весьма интересно, SPP и MCP не связываются между собой через интерфейс PCI Express, как можно было бы ожидать. nVidia решила использовать протокол HyperTransport, который хорошо усиливал инфраструктуру AMD64. Подобное решение можно считать оправданным, ведь у компании уже есть немалый опыт работы с HyperTransport благодаря чипсету nForce4 для платформы Athlon.
Обратите также внимание, что MCP не имеет компонентов PCI Express, – все они перенесены на SPP. Наконец, nVidia не поддерживает DDR400 SDRAM – только DDR2-533 и DDR2-667. По техническим документам, которые мы получили, поддержка наследственного интерфейса негативно бы сказалась на производительности подсистемы памяти. Прочитав нашу статью, вы почувствуете важность этого решения.
Оптимизации памяти
nForce4 Intel Edition работает с каждым DIMM, используя выделенную адресную шину.
nVidia решила заставить nForce4 IE работать с пакетами меньшего размера, чтобы более эффективно чередовать обращение к памяти. Чипсет использует длину пакета четыре, а не восемь, как у Intel. Кроме того, адресация 1T производится через выделенную адресную шину для каждого DIMM. Подобная схема адресации приводит к четырём командам чтения для получения двух 64-байтовых строчек, в то время как адресация 1T позволяет чипсету чередовать четыре такта памяти с командой чтения.
Длина пакета четыре в комбинации с командой 1T имеет смысл: две 64-байтовые строчки считываются за меньшее число тактов.
Новая система предварительной выборки: DASP 3.0
Подсистема оперативной памяти является одним из самых “узких мест” в современных компьютерах. По этой причине все современные процессоры используют скоростную буферную память (кэш), которая разделена на два (или больше) уровней. Кэш первого уровня (L1) невелик по размеру, но отличается очень высокой скоростью. Кэш второго уровня (L2) работает медленнее, но его объём в современных процессорах намного больше – до 2 Мбайт. Цель кэша заключается в быстром предоставлении процессору данных, которые запрашиваются повторно – либо находятся в тесном соседстве с запрошенной ранее информацией.
Если повезёт, то данные, запрашиваемые процессором, будут находиться в кэше, и тогда мы получим попадание. Процессор практически мгновенно получит нужную страницу памяти. Если же запрашиваемых данных в кэше нет, то мы получаем промах кэша – данные придётся запрашивать из оперативной памяти.
Чтобы избежать подобных промахов, процессоры используют блоки предварительной выборки данных. Они предсказывают, какие страницы памяти потребуются, и запрашивают их предварительно. Технология nVidia Dynamic Adaptive Speculative processor (DASP) построена именно на этом принципе. Впервые она была объявлена в nForce IGP/SPP, а теперь уже достигла версии 3.0. Изменения были необходимы, так как работу нового CPU предсказывать сложнее. Кроме того, всё усложняют функции типа Hyper-Threading и грядущие двуядерные процессоры.
Технология DASP 3.0 способна отслеживать каждое ядро и каждый поток для того, чтобы предсказать данные. Арбитр управляет доступными блоками предсказания и обеспечивает балансировку нагрузки, чтобы другие компоненты тоже получали доступ к памяти. Арбитр управляет приоритетами предварительной выборки, кроме того, блоки предварительной выборки могут использовать различные алгоритмы предсказания и даже их комбинировать.
Южный мост/nForce4 MCP
Как мы уже упомянули выше, MCP поставляется с 10 портами Hi-Speed USB 2.0, пятью слотами 32-битной PCI, классической звуковой системой 7.1 с опцией SP/DIF, а также контроллером гигабитного Ethernet от nVidia, который содержит межсетевой экран с аппаратным ускорением SPI. Кроме того, там же присутствуют два контроллера накопителей: традиционный двухканальный UltraATA/133, а также AHCI-совместимый SATA с поддержкой “родной” очереди команд NCQ, скоростью 3 Гбит/с и поддержкой различных режимов RAID.
MediaShield
nVidia решила разбить контроллер SATA на два логических блока.
В отличие от южного моста Intel ICH6, чип nForce4 MCP использует два независимых контроллера SATA. Они поддерживают “родную” очередь команд NCQ и скорость до 3 Гбит/с. Оба контроллера соответствуют спецификации SATA II.
“Родная” очередь команд позволяет перестроить команды жёсткого диска таким образом, чтобы они выполнялись в наиболее эффективном порядке.
NVRAID: RAID 5 для каждого
Чипсет nForce4 IE поддерживает стандартные режимы RAID: RAID 0 (чередование), RAID 1 (зеркалирование) и RAID 0+1 (комбинация чередования и зеркалирования на четырёх дисках). Кроме того, следует отметить и появление поддержки более “тяжёлого” режима RAID 5. Напомним, что массив RAID 5 работает очень похоже на RAID 0, чередуя запись данных на все доступные приводы. Однако во время записи добавляется ещё и информация избыточности. Таким образом, если один диск выйдет из строя, то данные не потеряются. В случае же RAID 0 сбой одного жёсткого диска приводит к потере всего массива.
Звучит хорошо, но у RAID 5 есть два недостатка. Во-первых, добавляется информация избыточности, которая распределяется по всем жёстким дискам, то есть общая полезная ёмкость массива уменьшается (в точности на объём одного диска). Во-вторых, расчёт информации избыточности в реальном времени требует ощутимых ресурсов процессора. Именно по этой причине все профессиональные RAID-контроллеры оснащены выделенным RISC-процессором, называемым также и XOR-движком, – он позволяет снизить вычислительную нагрузку на центральный процессор.
Так нужен ли RAID 5? Если вам нужна только производительность, то RAID 5 вряд ли имеет смысл. Впрочем, не будем забывать, что Intel вскоре представит двуядерные процессоры Pentium D и Pentium Extreme Edition (см. наше тестирование). Если вы думали, чем же можно занять дополнительную вычислительную мощность второго ядра, то вот вам и один из ответов.
Создание массива
Симуляция сбоя диска
Давайте возьмём наш массив RAID 5 и удалим один жёсткий диск…
NVRAID сразу же определяет отсутствие жёсткого диска.
Преобразование массива RAID
Сначала выберем требуемый режим RAID.
Вот так выглядит наша конфигурация: три 160-Гбайт привода в массиве RAID 5.
А вот и всё готово! Запустилось преобразование массива в RAID 0.
Межсетевой экран ActiveArmor
Окно общей информации позволяет оценить переданный и заблокированный сетевой трафик.
Не пугайтесь: профили позволяют избежать ручной настройки.
Этот профиль подойдёт для большинства ситуаций.
Значок в трее позволяет мгновенно включать/выключать межсетевой экран.
С помощью правил можно разрешать приложениям полный доступ в сеть.
Меню Anti-Hacking позволяет выставить простейшие настройки безопасности.
Эталонная плата nForce 4 Intel Edition
Первая розничная плата: MSI P4N Diamond
Почти одновременно с эталонной платой nVidia в нашу лабораторию потупила P4N Diamond (MS-7160). В отличие от эталонной платы nVidia, эта модель поставляется без механического переключения SLI. Кроме того, эталонная плата не поддерживает двуядерные процессоры, а плата MSI – вполне.
Тестовая конфигурация
Процессоры | |
266-МГц FSB (FSB1066) | Intel Pentium 4 Extreme Edition 3,73 ГГц кэш L2 2 Мбайт, HT включена |
Материнская плата | |
Socket 775 | Эталонная плата nVidia Чипсет: nForce4 Intel Edition BIOS: 4.86 |
Socket 775 | ASUS P5AD2-E Platinum Чипсет: Intel 925XE BIOS: 1004 Final |
Память | |
DDR2-533 | 2x 512 Мбайт Corsair TwinX CM2X512A-5400C4 Задержки: CL 3-3-3-8 |
DDR2-667 | 2x 512 Мбайт Corsair TwinX CM2X512A-5400LU Задержки: CL 3-3-3-8 (533), CL 4-3-3-10 (667) |
Общее аппаратное обеспечение | |
Графические карты | nVidia GeForce 6800 GT GPU: nVidia GeForce 6800 GT Память: 256 Мбайт GDDR3-SDRAM |
Жёсткий диск | Western Digital WD740 Raptor 74 Гбайт, кэш 8 Мбайт, 10 000 об/мин, SATA |
Тестовые приводы RAID | Western Digital WD1600SD 160 Гбайт, кэш 8 Мбайт, 7200 об/мин, SATA |
DVD/CD-ROM | MSI MS-8216 16x DVD |
Программное обеспечение | |
Графический драйвер | nVidia Detonator 71.84 |
Драйвер чипсета | nVidia Forceware 7.02 |
Чипсет Intel | Intel Chipset Installation Utility 6.3.0.1007 |
DirectX | 9.0c |
ОС | Windows XP Professional, 5.1.2600 Service Pack 2 |
Две GeForce 6800 GT.
Память: Corsair XMS2 DIMM.
Тесты и настройки OpenGL |
|
Wolfenstein | Version: 2.56 (Patch V 1.02) |
Enemy Territory | 1280×1024, 32-bit timedemo 1 / demo demo4 Geometric detail = high Texture detail = high |
Doom III | Version: 1.0.1262 1024×768, 32-bit Video Quality = High Quality |
DirectX 8 | |
Unreal Tournament 2004 | Version: 3204 1280×1024, 32-bit, Audio = off THG8-assault-single |
DirectX 9 | |
FarCry | Version 1.1 Build 1256 (Cooler01= 1280×1024, 32-bit Quality Options = Very High |
Видео | |
Pinnacle Studio 9 Plus | Version: 9.1.2 from: 352×288, MPEG-2, 41 MB to: 720×576, MPEG-2, 95 MB Encoding and Transition Rendering to MPEG-2/DVD no Audio |
Auto Gordian Knot DivX 5.2 XviD 1.0.3 |
Version: 1.89 Beta Audio = AC3 6ch Custom size = 100 MB Resolution settings = Fixed width Codec = XviD and DivX 5 Audio = CBR MP3, kbps 192 182 MB VOB MPEG2-source |
Аудио | |
Lame MP3 | Version 3.96 Wave 17:14 minutes (182 MB) to mp3 32 – 320 kbit VBR = level 3 |
Приложения | |
3D Studio Max 6.0 Discreet |
Characters “Dragon_Charater_rig” Pixel: 1024×768 Rendering Single |
Синтетические тесты | |
PCMark 2004 Pro | Version: 1.3.0 CPU Benchmark, Memory Benchmark |
SiSoft Sandra 2005 Pro | MultiMedia / CPU Arithmetic Memory Bandwidth Benchmark |
OpenGL
DirectX 8
Видео
Аудио
Applications
Синтетические тесты
Тесты SLI
Тесты SLI, продолжение
Заключение: nForce4 Intel Edition становится лидером
Мы уделили не слишком много внимания тестированию режима SLI на системе nForce4 Intel Edition, так как преимущество по 3D-производительности после включения SLI уже было оценено нами во время тестов nForce4 для Athlon64. Другими словами: программное обеспечение, получающее преимущество от SLI, будет работать быстрее на обеих системах SLI под AMD и Intel.
Сложно вспомнить, сколько раз производители чипсетов запускали новые продукты, пытающиеся немного опередить стандарт Intel. VIA когда-то смогла обойти 440BX с выходом Apollo Pro 133A, но для этого требовалась более скоростная память. К уровню 845, 865/875 или 915/925 конкурирующие чипсеты приближались вплотную, но обойти так и не могли.
Сегодня nVidia оказалась в очень удачном положении. Компания предложила продукт, который обеспечивает более приятный набор функций и большую производительность, чем любой современный чипсет Intel. Мы провели большой набор тестов на системах nForce4 Intel Edition и 925XE – результаты оказались впечатляющими. При оснащении памятью DDR2-667 система nForce4 Intel Edition становится ощутимо быстрее 925XE. Однако даже с памятью DDR2-533 система nForce4 Intel Edition продолжает обгонять 925XE во всех тестах.
Чипсет nVidia обошёл Intel ещё и по набору функций. Он поддерживает “родную” очередь команд NCQ, скорость SATA 3 Гбит/с, массив RAID 5, включая очень удобную утилиту NVRAID. Кроме того, чипсет предоставляет контроллер гигабитного Ethernet со встроенным аппаратным брандмауэром. Наконец, nForce4 Intel Edition стал первым чипсетом с официальной поддержкой двуядерных процессоров.
Да, конечно, отметим и поддержку SLI. Впрочем, в любом случае, интересны вам преимущества двойной графики SLI или нет, чипсет сегодня является лучшим продуктом системной логики для процессоров Pentium. Можно быть уверенным, что и цена окажется соответствующей.