Clovertown: четырёхядерные процессоры в серверах DP
Вряд ли стоит ещё раз упоминать, что война гигагерц между AMD и Intel осталась в истории. Сравнение тактовых частот уже не даёт представление о производительности процессоров, если только вы не будете сравнивать процессоры одной продуктовой линейки. Уже некоторое время производительность связана с числом ядер в конкретном процессоре, именно поэтому Intel агрессивно рекомендует переходить с двух ядер на четырёхядерные процессоры.
Процессор Core 2 Extreme QX6700 с четырьмя ядрами появился на свет в конце прошлого года, а чуть позже вышла модель для серверов и рабочих станций Clovertown или Xeon 5355.
Есть много причин, по которым AMD и Intel фокусируют внимание на разработке многоядерных процессоров вместо наращивания тактовых частот. С одной стороны, несколько вычислительных ядер могут выполнить большую работу за то же время, если, конечно, у вас современная операционная система, а приложения поддерживают несколько потоков (этим отличаются многие современные приложения). В теории, удвоение числа ядер в одном процессоре может дать почти удвоение производительности. Конечно, общие ресурсы, такие как кэши и интерфейсы, ограничивают прирост производительности, но увеличение количества ядер позволяет достичь лучшего прироста производительности, нежели при росте частот. Кроме того, энергопотребление экспоненциально растёт при увеличении частоты, но линейно увеличивается при увеличении числа вычислительных блоков.
Некоторые полагают, что процессоры с двумя или четырьмя ядрами существенно больше по размеру, чем обычные одноядерные модели. Но это не так. Хотя число транзисторов умножается, размер кремния увеличивается не так сильно. AMD и Intel планируют удвоить число ядер по мере того, как уменьшение техпроцесса сделает подобные чипы выгодными (большие по площади кремниевые чипы производить очень накладно). Многие современные процессоры производятся по 90-нм техпроцессу, который позволил AMD представить двуядерные процессоры Opteron Italy, а Intel – первые двуядерные процессоры Xeon Paxville.
Переход на 65-нм техпроцесс позволил Intel перейти на четырёхядерные процессоры. Core 2 Quad Kentsfield нацелен на настольный рынок, а Xeon 5300 Clovertown является четырёхпроцессорным аналогом для серверов и рабочих станций. Но для ноутбуков в ближайшее время четырёхядерные процессоры не появятся. Пока AMD ещё не готова представить четырёхядерные процессоры Opteron, которые будут использовать четыре ядра на одном кристалле, но Intel уже несколько месяцев предлагает четырёхядерные процессоры Xeon, где в одной упаковке объединены два двуядерных кристалла Woodcrest Xeons. Конечно, подобный подход имеет свои недостатки, но работает хорошо. Intel предлагает версии с частотами от 1,6 до 3,0 ГГц, с 2x кэшем L2 4 Мбайт и шинами FSB1066 или FSB1333. Что ж, посмотрим, на что способен четырёхядерный Xeon.
Так устроены процессоры Xeon 53xx (Clovertown), использующие два ядра Xeon 51xx Woodcrest.
Больше ядер = больше энергопотребление?
Слева направо: Dempsey (3,73 ГГц, два ядра NetBurst), Woodcrest (3,0 ГГц, два ядра Core 2), Clovertown (3,0 ГГц, четыре ядра Core 2).
В целом, верно утверждение: чем больше ядер, тем выше требования к энергопотреблению. Всё же требуется питать большее число транзисторов, на что требуется больше энергии. В то же время, все современные процессоры содержат встроенные механизмы экономии энергопотребления. AMD называет свою технологию Cool and Quiet, а Intel поддерживает SpeedStep в настольных и мобильных ПК и DBS (Demand-Based Switching) в профессиональных решениях.
Механизмы энергосбережения работают одинаково: они требуют поддержки со стороны BIOS и операционной системы, обычно с помощью драйвера процессора. Драйвер отслеживает нагрузку на компьютер и снижает напряжение и тактовую частоту, если нагрузка невысокая. Как только приложениям требуются вычислительные ресурсы, тактовая частота и напряжение увеличиваются. AMD Cool and Quiet поддерживает несколько частотных ступеней, а Intel SpeedStep может переключаться только между двумя уровнями: максимальная частота и SpeedStep. Но вряд ли здесь уместно говорить о том, что одна технология лучше другой, поскольку всё зависит от рабочего окружения. В любом случае, убедитесь, что функция Cool and Quiet или DBS включена в BIOS. Она позволяет экономить энергию, система работает холоднее, а значит и на кондиционирование помещения тратится меньше электричества.
При возрастании числа ядер появляются дополнительные возможности для экономии энергии. Процессоры могут отключать отдельные ядра или неиспользуемые сегменты кэша. 65-нм процессоры Intel, по большей мере, используют для сбережения энергии стробирование или так называемые спящие транзисторы, которые не потребляют энергию в режиме бездействия.
Будьте готовы к тому, что четырёхядерные машины потребляют больше энергии и выделяют больше тепла при высокой нагрузке по сравнению с двуядерными системами. Впрочем, это вполне допустимо, поскольку вы получите немалый прирост производительности. Сами подумайте: если тепловыделение и энергопотребление увеличатся на 15-20%, но время расчётов требовательных приложений уменьшится на 15-40%, система может перейти обратно в состояние с низким энергопотреблением быстрее. То есть в целом потребление энергии получается не больше, чем у двуядерной машины, которая, будучи намного медленнее, будет дольше находиться в состоянии высокого энергопотребления.
Процессоры Xeon обычно имеют тепловой пакет 65 или 80 Вт, и четырёхядерные Xeon (1,6, 1,86 и 2,33 ГГц) не превышают эту спецификацию. Только топовая 3,0-ГГц модель имеет тепловой пакет 120 Вт на процессор.
“Узкие места” многоядерности
Если вы хотите, чтобы высокопроизводительное устройство работало эффективно, нужно обеспечить быстрые интерфейсы данных. В случае 3D-графики, например, используется специализированная графическая память с высокими частотами. Если перейти к процессорам, то “узким местом” является интерфейс, особенно у архитектуры Intel. Все процессоры AMD, доступные сегодня, имеют встроенный контроллер памяти DDR или DDR2, то есть данные располагаются очень близко к процессору. Решение же Intel опирается на отдельный контроллер памяти, входящий в чипсет. И хотя Intel обновила платформу Xeon двумя независимыми шинами FSB для каждого процессорного сокета и четырёхканальным контроллером DDR2, интерфейс процессора всё равно является общим для всех ядер.
Ситуация в итоге усложняется: представьте себе два четырёхядерных процессора, бьющихся за доступ к памяти. У AMD такого не происходит, поскольку каждый процессор имеет собственную память. Да, возникают проблемы когерентности, если нужные данные расположены в памяти или кэше L2 другого процессора, но финальный результат всё равно оказывается достойным. Кроме того, современные операционные системы знают о количестве физических процессоров (Windows Vista Ultimate Edition), поэтому они могут привязывать рабочие данные потока или приложения к определённому процессору, обеспечивая разумное распределение нагрузки. Это относится к платформам и Opteron, и Xeon, но больше всего выигрывает решение AMD.
Intel Xeon 5300 (Clovertown)
Линейка 5000 обозначила появление двуядерных процессоров Xeon в ассортименте Intel. 5000 соответствует первому поколению двуядерных процессоров (Paxville), а 5100 – первым 90-нм двуядерным процессорам (Dempsey), которые всё ещё базируются на архитектуре NetBurst. Процессоры Xeon Woodcrest, построенные на последней микро-архитектуре Core 2, отнесены к линейке 5200. Следовательно, четырёхядерные Xeon Clovertown получили линейку 5300. Две последние цифры обозначают частоту процессора и шины. В следующей таблице перечислены доступные процессоры Xeon.
Обзор моделей Xeon
Номер процессора | Техпр. | Кэш | Такт. частота | Частота FSB | Тепл. пакет | Тип системы | 4 ядра | 2 ядра | HT |
X5355 | 65 нм | 8 Мбайт L2 | 2,66 ГГц | FSB1333 | 120 Вт | DP | X | ||
E5345 | 65 нм | 8 Мбайт L2 | 2,33 ГГц | FSB1333 | 80 Вт | DP | X | ||
E5320 | 65 нм | 8 Мбайт L2 | 1,86 ГГц | FSB1066 | 80 Вт | DP | X | ||
E5310 | 65 нм | 8 Мбайт L2 | 1,60 ГГц | FSB1066 | 80 Вт | DP | X | ||
5160 | 65 нм | 4 Мбайт L2 | 3,0 ГГц | FSB1333 | 80 Вт | DP | X | ||
5150 | 65 нм | 4 Мбайт L2 | 2,66 ГГц | FSB1333 | 65 Вт | DP | X | ||
5148 LV | 65 нм | 4 Мбайт L2 | 2,33 ГГц | FSB1333 | 40 Вт | DP | |||
5140 | 65 нм | 4 Мбайт L2 | 2,33 ГГц | FSB1333 | 65 Вт | DP | X | ||
5130 | 65 нм | 4 Мбайт L2 | 2,00 ГГц | FSB1333 | 65 Вт | DP | X | ||
5120 | 65 нм | 4 Мбайт L2 | 1,87 ГГц | FSB1066 | 65 Вт | DP | X | ||
5110 | 65 нм | 4 MB | 1,6 ГГц | FSB1066 | 65 Вт | DP | X | ||
5080 | 65 нм | 2×2 Мбайт L2 | 3,73 ГГц | FSB1066 | 130 Вт | DP | X | X | |
5063 | 65 нм | 2×2 Мбайт L2 | 3,20 ГГц | FSB1066 | 95 Вт | DP | X | X | |
5060 | 65 нм | 2×2 Мбайт L2 | 3,20 ГГц | FSB1066 | 130 Вт | DP | X | X | |
5050 | 65 нм | 2×2 Мбайт L2 | 3,00 ГГц | FSB667 | 95 Вт | DP | X | X | |
5030 | 65 нм | 2×2 Мбайт L2 | 2,67 ГГц | FSB667 | 95 Вт | DP | X | X |
Intel решила совместить два кристалла Woodcrest Xeon 5200 в одной упаковке, чтобы получить процессор с четырьмя ядрами под названием Clovertown. То есть, по сути, перед нами два двуядерных процессора, оба из которых оснащены собственным 4-Мбайт кэшем L2.
Socket 771, FSB1333 или FSB1066
Все процессоры Xeon 5300 предназначены для установки в Socket LGA 771, который доминирует в современных серверных системах Intel. Доступны четыре версии: 1,6 и 1,86 ГГц для платформ FSB1066 и 2,33 и 3,0 ГГц для FSB1333. Конечно, для максимальной эффективности лучше взять одну из последних платформ Intel, в частности, на чипсете Intel 5000, которая поддерживает FSB1066 или FSB1333.
Процессорная шина Intel использует технологию учетверённой передачи данных (QDR), то есть за один такт по линии передаются четыре бита вместо одного. Таким образом, FSB1333 соответствует 333-МГц шине, а FSB1066 – 266-МГц, если указать физические частоты. Очень хорошо, что Intel перешла на более скоростную 333-МГц процессорную шину для двуядерных процессоров, поскольку именно FSB являлась “узким местом”.
Архитектура Xeon Clovertown
Если вам интересно узнать детали о микро-архитектуре Core 2, которая лежит в основе Xeon, мы рекомендуем обратиться к статье с весеннего форума IDF 2006.
Чипсет Intel 5000 Chipset Platform (Blackford)
Чипсет 5000 для платформы Xeon 5300 доступен в трех разных видах. 5000V – “бюджетная” версия, поддерживающая только 32 Гбайт памяти. Две другие версии поддерживают до 64 Гбайт полностью буферизованной памяти DDR2 (FB-DIMM DDR2-533 или 667), как с коррекцией ошибок ECC, так и без, в двухканальном или четырёхканальном режимах. Северный и южный мосты связаны между собой интерфейсом x4 PCI Express, а линейка 5000 обеспечивает 20 линий PCI Express, которые сконфигурированы по-разному, в зависимости от модели чипсета.
Главное отличие между линейкой E7500 и последними чипсетами 5000 заключается в поддержке двух независимых шин FSB (Dual Independent Bus, DIB). Процессорам на старой платформе Xeon приходилось использовать одну шину FSB, что являлось “узким местом”. Теперь у каждого сокета есть свой интерфейс. Благодаря повышению частоты FSB до 333 МГц, каждый процессор получил пропускную способность 10,66 Гбайт/с. У 266-МГц шины она составляла 8,33 Гбайт/с.
Набор функций
Чипсет Intel 5000X | Чипсет Intel 5000P | Чипсет Intel 5000V | |
Целевой сегмент | Серверы | Серверы | Серверы |
Процессор | 2/4-ядерный Intel Xeon семейства 5000 | 2/4-ядерный Intel Xeon семейства 5000 | 2/4-ядерный Intel Xeon семейства 5000 |
Число процессоров | 1-2 | 1-2 | 1-2 |
Шина процессоров | FSB1066/1333 | FSB1066/1333 | FSB1066/1333 |
Северный мост (MCH) | Чипсет 5000X | Чипсет 5000P | Чипсет 5000V |
Тип MCH | 5000X MCH | 5000P MCH | 5000V MCH |
Упаковка MCH | 1432 FC-BGA | 1432 FC-BGA | 1432 FC-BGA |
Модули памяти | FB DIMM | FB DIMM | FB DIMM |
Тип памяти | DDR2 FB DIMM | DDR2 FB DIMM | DDR2 FB DIMM |
Макс. объём | 64 Гбайт | 64 Гбайт | 32 Гбайт |
Число банков | До 8 физических банков, 2 – 8 DIMM на XMB (макс. до 4 XMB) | До 8 физических банков, 2 – 8 DIMM на XMB (макс. до 4 XMB) | До 8 физических банков, 2 – 8 DIMM на XMB (макс. до 4 XMB) |
Поддержка модулей по объёму | 256 Мбайт, 512 Мбайт, 1 Гбайт и 2 Гбайт | 256 Мбайт, 512 Мбайт, 1 Гбайт и 2 Гбайт | 256 Мбайт, 512 Мбайт, 1 Гбайт и 2 Гбайт |
ECC | Да | Да | Да |
Южный мост (ICH) | Чипсет 5000X | Чипсет 5000P | Чипсет 5000V |
Тип ICH | 6321ESB | 6321ESB | 6321ESB |
Упаковка ICH | 1284 FC-BGA | 1284 FC-BGA | 1284 FC-BGA |
Поддержка PCI | Две независимых 64-битных, 133-МГц шины PCI-X | Две независимых 64-битных, 133-МГц шины PCI-X | Две независимых 64-битных, 133-МГц шины PCI-X |
PCI Master | 6 | 6 | 6 |
IDE | Два канала Ultra ATA | Два канала Ultra ATA | Два канала Ultra ATA |
Serial ATA | 6 Serial ATA (SATA) | 6 Serial ATA (SATA) | 6 Serial ATA (SATA) |
USB-порты | 6 портов USB 2.0 | 6 портов USB 2.0 | 6 портов USB 2.0 |
Технологии | Чипсет 5000X | Чипсет 5000P | Чипсет 5000V |
DIMM sparing, Memory RAID, Memory mirroring, x4 SDDC, Memory ECC, HUB interface ECC, DMA | DIMM sparing, Memory RAID, Memory mirroring, x4 SDDC, Memory ECC, HUB interface ECC, DMA | DIMM sparing, Memory RAID, x4 SDDC, Memory ECC, HUB interface ECC, DMA | |
Управление вводом/выводом | SMBus 2.0 /GPIO | SMBus 2.0 /GPIO | SMBus 2.0 /GPIO |
Workstation/Server I/O Expansion | Чипсет 5000X | Чипсет 5000P | Чипсет 5000V |
Тип контроллера PCI | 6700 PXH 64-битный PCI-концентратор | 6700 PXH 64-битный PCI-концентратор | 6700 PXH 64-битный PCI-концентратор |
Упаковка WSE | 567 FC-BGA | 567 FC-BGA | 567 FC-BGA |
Поддержка WSE PCI | До трёх 64-битных концентраторов PXH, каждый с макс. пропускной способностью до 4 Гбайт/с | До трёх 64-битных концентраторов PXH, каждый с макс. пропускной способностью до 4 Гбайт/с | До трёх 64-битных концентраторов PXH, каждый с макс. пропускной способностью до 4 Гбайт/с |
WSE PCI Master | Каждый PXH содержит два независимых 64-битных интерфейса PCI/PCI-X. Максимальная частота интерфейса PCI: 66 МГц. Максимальная частота интерфейса PCI-X: 133 МГц. |
Каждый PXH содержит два независимых 64-битных интерфейса PCI/PCI-X. Максимальная частота интерфейса PCI: 66 МГц. Максимальная частота интерфейса PCI-X: 133 МГц. |
Каждый PXH содержит два независимых 64-битных интерфейса PCI/PCI-X. Максимальная частота интерфейса PCI: 66 МГц. Максимальная частота интерфейса PCI-X: 133 МГц. |
Тестовая система: HP XW8400
Для нашего обзора мы получили рабочую станцию Hewlett Packard 8400. В ней установлены два жёстких диска Fujitsu Fujitsu MAX3073RC SAS на 15 000 об/мин в массиве RAID 0, видеокарта nVidia Quadro FX4500 и 8 Гбайт полностью буферизованной памяти DDR2-667 – не очень роскошно. Материнская плата построена на чипсете 5000X и обеспечивает полноценный слот x16 PCI Express для видеокарты и два слота x4 PCIe. Один из них выведен в виде физического слота x16, второй – x4. Кроме того, мы обнаружили три 64-битных слота PCI-X, которые подводятся к мосту Intel 6700PXH PCI X, а также один 32-битный слот PCI.
На рабочую станцию предустановлена Windows XP x64 Edition, что хорошо подходит для нашего предполагаемого окружения. Мы решили прогнать систему через все наши тесты, а также с процессорами Woodcrest и Dempsey. Подробные спецификации можно посмотреть на странице Hewlett Packard.
Нажмите на картинку для увеличения.
Тестовая система оснащена четырьмя 2-Гбайт FB DIMM DDR2-667.
Тестовая конфигурация
Системное аппаратное обеспечение | |
Процессоры I | 2x Intel Xeon 5355 (Clovertown), 2,66 ГГц, FSB1333, 8 Мбайт кэша L2 |
Процессоры II | 2x Intel Xeon 5160 (Woodcrest), 3,0 ГГц, FSB1333, 4 Мбайт кэша L2 |
Процессоры III | 2x Intel Xeon 5080 (Dempsey), 3,73 ГГц, FSB 1066, 4 Мбайт кэша L2 |
Платформа | HP xw8400 Workstation (LGA 771), чипсет Intel 5000X MCH, BIOS 10/02/2006 R1.19 |
Память | Infineon HYS72T256420HFN-3S-A (DDR2-667 ECC Dual Rank FB), 4x 2 Гбайт, CL5-5-5-10 |
Системные жёсткие диски | RAID0 2x Fujitsu MAX3073RC, 73 Гбайт, 15 000 об/мин, кэш 8 Мбайт, SAS |
Жёсткий диск для данных | Western Digital Raptor 740AD, 74 Гбайт, 10 000 об/мин; кэш 8 Мбайт, SerialATA/150 |
Контроллеры накопителей | Intel ESB-2 I/O Bridge, LSI Logic SAS1064X 4 порта SAS RAID 0/1 |
Видеокарта | nVidia Quadro FX4500 |
Системное ПО и драйверы | |
ОС | Microsoft Windows XP Professional x64 Edition, Service Pack 1 |
Драйвер платформы | Intel Chipset Installation Utility 7.3.1.1011 |
Графический драйвер | nVidia Forceware 84.80 |
Тесты и настройки
Видео | |
TMPEG 3.0 Express | Version: 3.0.4.24 (no Audio) 182 MB VOB MPEG2-source (704×576) 16:9 |
DivX 6.4 | Version: 6.4 (4-8 Logical CPUs) Certification Profile: High Definition Profile Multipass, 3000 kb/s Encoding mode: Insane Quality |
XviD 1.2.0 | Version: 1.2.0 SMP Beta Encoding type: Twopass – Single pass Profile @ Level: DXN HT PAL Target size (kB): 570000 |
MainConcept H.264 Encoder v2 | Version: 2.1 2:19 min MPEG2-source 1920×1080 to H.264 Profile: High Audio: AAC Stream: Program |
Аудио | |
Lame MP3 | Version 3.97 Beta 2 (11-29-2005) Audio CD “Terminator II SE”, 74 min wave to mp3 160 kbps |
OGG | Version 1.1.2 (Intel P4 MOD) Version 1.1.2 (Intel AMD MOD) Audio CD “Terminator II SE”, 74 min wave to ogg Quality: 5 |
Приложения | |
Winrar | Version 3.61 (Dual-Core) (303 MB, 47 Files, 2 Folders) Compression = Best Dictionary = 4096 kB |
Autodesk 3D Studio Max | Version: 8.0 Characters “Dragon_Charater_rig” rendering 1280×1024 Frames 1,3,5-12 |
Cinebench | Version 9.5 64 Bit nCPU, 1 CPU |
SPECviewperf 9 | Version: 9.03 All Tests |
Синтетические тесты | |
Everest | Version 3.01.652 Cache & Memory Benchmark |
SiSoftware Sandra 2007 | Version 2007.5.10.98 CPU Test = CPU Arithmetic / MultiMedia Memory Test = Bandwidth Benchmark Memory Latency Test = ns |
Linpack | Version 3.5 64 Bit |
SunGard | Adaptive Credit Risk Calculation Version 3.5 |
PCMark05 Pro | Version: 1.1 CPU and Memory Tests |
Прочие | |
Intel C++ Compiler | Version 9.1.030 |
Intel Fortran Compiler | Version 9.1.029 |
Видео
Аудио
Приложения
Синтетические тесты
Энергопотребление систем
Заключение
Кое-кому преимущества четырёхядерного Intel Clovertown покажутся не такими очевидными, как предполагалось, поскольку в ряде тестов процессор не смог обойти двуядерные Xeon 5200 Woodcrest. Впрочем, другим результаты тестов покажутся достаточно впечатляющими, чтобы купить четырёхядерный сервер или рабочую станцию.
Intel прекрасно поработала над тем, чтобы улучшить существующую технологию и представить более мощный продукт. Энергопотребление новых четырёхядерных процессоров под максимальной нагрузкой высокое, но в режиме бездействия оно заметно снижается. Покупатели процессоров Xeon 5300 получат два физических двуядерных кристалла в одной упаковке, 2x 4-Мбайт кэша L2 и, очевидно, лучший процессор из семейства Xeon для рабочих станций и серверов на сегодня.
Итак, если покупать двухпроцессорные серверы или рабочие станции на Xeon, следует ли брать четырёхядерные процессоры? Определённо да, если вы сможете улучшить ваш бизнес, сократив время расчёта требовательных задач. Но вам потребуются последние версии ПО, полностью оптимизированные под многопоточность, да и на более мощные блоки питания придётся раскошелиться. Следует аккуратно подойти и к выбору компонентов.
Всем остальным мы настоятельно рекомендуем придерживаться двуядерных процессоров по следующим причинам.
- Загрузка рабочих станций может заметно меняться, но типичная серверная система работает со средней максимальной загрузкой 20-30% в день, максимум. Так что четырёхядерные системы здесь сильно не повлияют.
- Почти все текущие модели систем Xeon используют чипсет 5000, который позволяет выполнять модернизацию до четырёхядерных процессоров. Подобный шаг можно выполнить позднее, вы получите даже ещё более скоростные процессоры за меньшие деньги.
- AMD работает над собственным четырёхядерным решением, которое должно скоро выйти на рынок. С выделенными кэшами L2 на ядро и общим кэшем L3 оно представляет собой любопытную альтернативу.
Статьи по теме.
- “Core 2 Quad (Kentsfield): тесты первого четырёхядерного процессора Intel“;
- “Весенний Форум Intel для разработчиков: вся надежда на новую микро-архитектуру Core“.