Xeon Woodcrest против Opteron
За последние годы Intel и AMD достаточно горячо конкурировали друг с другом, пытаясь выйти вперёд по части производительности и заполучить рыночную долю, постоянно анонсировали новые, “более скоростные” процессоры. Конкуренция привела к непрерывному потоку инноваций, а также и к ценовым войнам, которые благоприятно сказываются на кошельке покупателя. Сегодня ни один из производителей не может монополизировать рынок.
Нынешняя статья посвящена процессорам двух упомянутых компаний, нацеленных на серверный рынок. Линейка серверных процессоров Intel носит название Xeon, а у AMD – Opteron. Процессоры AMD Opteron за последние годы довольно хорошо проявили себя на серверном рынке, что явилось следствием хорошей архитектуры, которая обеспечила не только высокую производительность, но и низкое энергопотребление (то есть лучшее соотношение производительности на ватт). Учась на своих ошибках и понимая, что существующая архитектура не может состязаться с Opteron, Intel анонсировала полностью новый процессор Xeon, базирующийся на микро-архитектуре Core 2.
Intel Xeon “Dempsey”
Двуядерный Intel Xeon с кодовым названием “Dempsey” был выпущен в мае 2006 года в линейке 5000. Как и все процессоры Xeon, перед нами настольный вариант процессора с добавленной поддержкой многопроцессорности (SMP). В данном случае процессор аналогичен Presler Pentium Extreme Edition (EE), финальной версии двуядерного процессора Pentium D (Netburst) на двух 65-нм ядрах Cedar Mill.
Dempsey Xeon работает на частотах от 2,67 до 3,73 ГГц, а соответствующие модельные номера меняются от 5030 до 5080. Вместе с Dempsey Intel анонсировала платформу Bensley (чипсет линейки 5000) под Socket 771 (также известен как Socket J). Процессоры Dempsey, Woodcrest и готовящийся к выходу Clovertown (четыре ядра) используют новую платформу. Для наших тестов мы решили взять топовую модель Xeon 5080, которая работает на 3,73 ГГц с 1066-МГц шиной и оснащена 2 Мбайт кэша L2 на ядро (4 Мбайт в сумме).
Intel Xeon “Woodcrest”
“Woodcrest” – кодовое название нового процессора Intel для серверов и рабочих станций. Он был объявлен в июне 2006 – всего через месяц после выхода Xeon Dempsey и базируется на микро-архитектуре Core 2. По информации Intel, новый дизайн увеличивает производительность на 80% параллельно со снижением энергопотребления на 20% по сравнению со старыми процессорами Xeon на микро-архитектуре Netburst.
Woodcrest Xeon работает на тактовой частоте от 1,6 до 3,0 ГГц, а модельные номера идут от 5110 до 5160. Как и в случае Dempsey Xeon, процессор Woodcrest тоже использует новую платформу Bensley и Socket 771. Для более глубокого знакомства с линейкой Xeon 5100 мы рекомендуем ознакомиться с обзором Xeon Woodcrest против Opteron: первые тесты. Для наших тестов мы взяли самую быструю модель Xeon 5160. Она отличается тактовыми частотами 3,0 ГГц, шиной 1333 МГц и 4-Мбайт общим кэшем L2.
AMD Opteron “Italy”
Opteron – это ответ AMD на процессор Intel Xeon, нацеленный на конкуренцию на рынке серверов и рабочих станций. Первый многоядерный Opteron был выпущен в мае 2005 и после этого стал просто хитом на серверном рынке.
Для нашего сравнения мы взяли линейку Opteron 200 под кодовым названием “Italy”. Она использует 940-контактный сокет, специально предназначенный для серверных платформ, которые поддерживают только регистровую память ECC. Линейка 200 изготавливается по 90-нм архитектуре, работает на частотах от 1,8 до 2,6 ГГц и имеет модельные номера от 265 до 285. Для нашего тестирования мы взяли топовую модель Opteron 285, которая работает на частоте 2,6 ГГц и оснащена 1 Мбайт кэша L2 на ядро (2 Мбайт в сумме).
Интерфейс памяти
Наша тестовая система Intel оснащена четырьмя 1-Гбайт FB-DIMM DDR2-667. Теоретическая пропускная способность памяти составляет 21,4 Гбайт/с для Woodcrest с 1333-МГц FSB и 17,4 Гбайт/с для Dempsey с 1066-МГц FSB.
Модули FB-DIMM в системе Intel потребляют 11 Вт каждый, и им нужен радиатор для охлаждения.
Наша система AMD оснащена четырьмя 1-Гбайт модулями DDR-400, поэтому её пропускная способность памяти составляет 2x 6,4 Гбайт/с из-за встроенных в процессор контроллеров памяти. Процессоры Opteron следующего поколения ориентированы на платформу AM2 и используют память DDR2-800, что теоретически удваивает пропускную способность.
Модули DDR-400 системы AMD.
Встроенные контроллеры памяти Opteron дают намного меньшие задержки, но процессоры Intel используют общий кэш L2 большего размера – 4 Мбайт, что тоже значительно снижает задержки памяти. Какой метод лучше – вопрос спорный. Преимущество подхода Intel заключается в том, что находящийся в чипсете контроллер памяти даёт большую гибкость по типу используемой памяти, поскольку встроенный в процессор контроллер памяти требует в этом случае изменения дизайна ядра CPU. Учитывая, что процессоры Intel Xeon построены на той же архитектуре, что и настольные процессоры, намного эффективнее использовать единую архитектуру ядра, которая может работать как со стандартными модулями DDR2, так и с серверными FB-DIMM. Наконец, кэш использует меньше энергии, чем встроенный контроллер памяти, что является плюсом на серверном рынке. Конечно, встроенный контроллер памяти даёт прирост производительности, но оправдывает ли он дополнительные издержки и увеличение энергопотребления CPU? Intel считает, что нет.
Тестовые системы
Мы взяли два сервера 1U от Supermicro, одного из производителей high-end серверов. Одна из серверных систем базируется на платформе Intel Bensley, поддерживающей два процессора из линейки Xeon 5000/5100 (Dempsey/Woodcrest), а вторая платформа AMD поддерживает два процессора из линейки Opteron 200. Обе системы подходят для серьёзных центров обработки данных и могут быть расширены с помощью карт удалённого управления (Remote Management Card).
Из-за форм-фактора 1U и ограниченной высоты обеим системам приходится использовать небольшие вентиляторы. Для компенсации небольшого размера вентиляторы вращаются на высоких скоростях. А при скорости вращения выше 10 000 об/мин уровень шума от нескольких вентиляторов очень высок. Если нужно, то скорость может быть увеличена до 15 000 об/мин! Система AMD может также оснащаться опциональными избыточными блоками питания.
Вентиляторы серверной системы работают очень громко.
Мы выбрали следующие системы.
1. Система Intel.
2. Система AMD.
A+ Server AS1020P-T
Мы протестировали систему Intel в двух конфигурациях. Первая конфигурация использует пару процессоров Woodcrest Xeon 5160, а вторая – пару процессоров Dempsey Xeon 5080. В результате мы можем сравнить производительность новых процессоров Woodcrest со старыми Dempsey Xeon.
Тестовая конфигурация
Система I | |
Процессоры I | 2x Intel Xeon (ядро Woodcrest), 3,0 ГГц, FSB1333, 4 Мбайт кэша L2 |
Процессоры II | 2x Intel Xeon (ядро Dempsey), 3,73 ГГц, FSB 1066, 4 Мбайт кэша L2 |
Платформа | Supermicro X7DBR-E (LGA 771), чипсет Intel Blackford MCH, BIOS 07/07/2006 |
Память | Hynix HYMP512F72BP8N2-Y5 (DDR2-667 FB), 4x 1 Гбайт, задержки CL5-5-5-11 |
Системный жёсткий диск | Western Digital Raptor X WD1500ADFD, 150 Гбайт, 10 000 об/мин, кэш 16 Мбайт, SerialATA/150 |
Жёсткий диск с данными | Western Digital Raptor 740AD, 74 Гбайт, 10 000 об/мин, кэш 8 Мбайт, SerialATA/150 |
Контроллеры накопителей | Мост ввода/вывода Intel ESB-2 |
Видеокарта | Встроенная графика ATi ES1000, 16 Мбайт |
Система II | |
Процессоры | 2x AMD Opteron (ядро Italy), 2,6 ГГц, FSB800, кэш L2 2 Мбайт |
Платформа | Supermicro H8DSP-I (Socket 940), чипсет ServerWorks HT2000, BIOS 06/30/2006 |
Память | Hynix HYMD512G726CFP4N (DDR-400 ECC Reg), 4x 1 Гбайт, задержки CL3-3-3-8 |
Системный жёсткий диск | Western Digital Raptor X WD1500ADFD, 150 Гбайт, 10 000 об/мин, кэш 16 Мбайт, SerialATA/150 |
Жёсткий диск с данными | Western Digital Raptor 740AD, 74 Гбайт, 10 000 об/мин, кэш 8 Мбайт, SerialATA/150 |
Контроллеры накопителей | ServerWorks HT1000 |
Видеокарта | Встроенная графика ATi Rage XL, 8 Мбайт |
Системное ПО и драйверы | |
ОС | Microsoft Windows Server 2003 Enterprise Edition, Service Pack 1 |
Драйвер процессора AMD | Версия 1.3.2.16 |
Драйвер платформы | Intel Chipset Installation Utility 8.1.1.1001 |
Графический драйвер | Драйвер Windows по умолчанию |
Тесты и настройки
Видео | |
TMPEG 3.0 Express | Version: 3.0.4.24 (no Audio) 182 MB VOB MPEG2-source (704×576) 16:9 |
DivX 6.25 | Version: 6.25 (4 Logical CPUs) Definition Profile: High Definition Profile Multipass, 3000 kbit/s Encoding mode: Insane Quality |
XviD 1.2.0 | Version: 1.2.0 SMP Beta Encoding type: Twopass – Single pass Profile @ Level: DXN HT PAL Target size (kbytes): 570000 |
Аудио | |
Lame MP3 | Version 3.97 Beta 2 (11-29-2005) Audio CD “Terminator II SE”, 74 min wave to mp3 160 kbps |
OGG | Version 1.1.2 (Intel P4 MOD) Version 1.1.2 (Intel AMD MOD) Audio CD “Terminator II SE”, 74 min wave to ogg Quality: 5 |
Приложения | |
WinRAR | Version 3.61 (Dual-Core) (303 MB, 47 Files, 2 Folders) Compression = Best Dictionary = 4096 kB |
Autodesk 3D Studio Max | Version: 8.0 Characters “Dragon_Charater_rig” rendering 1280×1024 Frames 1,3,5-12 |
Cinebench | Version 9.5 64 Bit X CPU |
Синтетические тесты | |
Everest | Version 3.01.652 Cache & Memory Benchmark |
SiSoftware Sandra 2007 | Version 2007.5.10.98 CPU Test = CPU Arithmetic / MultiMedia Memory Test = Bandwidth Benchmark Memory Latency Test = ns |
Linpack | Version 3.0 64 Bit |
SunGard | Adaptiv Credit Risk Version 3.0 |
Другие | |
Intel C++ Compiler | Version 9.1.030 |
Intel Fortran Compiler | Version 9.1.029 |
Видео
Кодирование видео отличается высокой вычислительной нагрузкой. По результатам тестов Opteron 285 не может сравниться с Xeon 5160, уступая ему на 20-30%. Подобный отрыв в производительности связан с усиленным блоком SSE в микро-архитектуре Core 2, который даёт прекрасные результаты по кодированию медиа-данных. Кстати, в этих тестах Opteron даже чуть медленнее Xeon 5080.
Аудио
В тестах кодирования аудио мы опять видим, как Xeon 5160 существенно обходит Opteron 285, где-то на 30-35%. Но в этом тесте Opteron всё же показал более высокие результаты, чем Xeon 5080. Как мы уже упоминали раньше, причиной столь высокой производительности Xeon 5160 является усиленный блок SSE.
Приложения
В наших тестах приложений мы можем видеть, как Opteron встаёт на второе место. Хотя, надо сказать, результаты всё же ближе к Xeon 5080. В первых двух тестах Xeon 5160 на 16-22% быстрее Opteron. Малое время сжатия WinRAR, опять же, является следствием усиленного блока SSE в Woodcrest.
Синтетические тесты
Как можно видеть, Opteron обгоняет процессор Xeon в тестах памяти и отличается намного меньшими задержками. Связано это с собственным контроллером памяти в каждом процессоре Opteron, а также и с его интегрированным характером. Процессоры Xeon, с другой стороны, лучше показывают себя в вычислениях с целыми числами и числами с плавающей запятой.
Linpack представляет собой программную библиотеку, которая содержит всё необходимое для расчётов линейной алгебры на компьютерах. Тест Linpack позволяет оценить производительность системы при вычислениях с плавающей запятой. Тест оптимизирован под Intel, а при решении 22 000 наборов линейных уравнений он использует более 3 Гбайт памяти, получая преимущество от четырёх полностью буферизованных каналов DIMM платформы Intel Bensley. Версия 3.0 также использует 16 новых инструкций, появившихся в Woodcrest.
SunGard ACR – приложение для финансовых расчётов. Оно анализирует большой набор клиентских данных и вычисляет кредитные риски. Приложение требует немалой вычислительной мощности, поскольку опирается на сложные математические расчёты в разных сценариях. В данном тесте Xeon 5160 оказался на 22% быстрее Opteron.
Энергопотребление
Системы не полностью идентичные, но они относятся к одному классу, так что сравнение делать можно. Как можно видеть, с включёнными опциями энергопотребления в режиме бездействия Opteron и Xeon Woodcrest потребляют энергию на одном уровне. Но под нагрузкой Woodcrest использует меньше энергии, что можно связать с механизмом слияния макро- и микро-операций архитектуры Core 2, что существенно увеличивает эффективность каждого ядра.
Xeon 5160 потребляет на 17% меньше энергии по сравнению с Opteron под нагрузкой, а Xeon 5080 потребляет энергии на 30% больше. При сравнении с энергопотреблением двух процессоров Xeon мы видим, что новая архитектура Core 2 у Xeon 5160 потребляет на 25-35% меньше энергии, чем Xeon 5080 на Pentium D (Netburst). Результаты совпадают с заявлением Intel о снижении энергопотребления на 20%.
Следует отметить, что в системах Intel каждый FB-DIMM потребляет 11 Вт и использует собственные радиаторы для охлаждения. В сумме мы получаем тепловыделение памяти более 40 Вт, что несколько снижает преимущество процессоров Xeon Woodcrest по низкому энергопотреблению.
Заключение
Платформа Woodcrest показала себя очень хорошо, соответствуя нашим ожиданиям. Она оказалась самой быстрой в тестировании и, в целом, лидером во всех тестах. Новая линейка Xeon 5100 помогла процессорам Intel для серверов и рабочих станций вернуться на прежний высокий уровень. Теперь уже старая линейка Xeon 5000 (Dempsey), построенная на архитектуре Netburst, часто оказывалась в тестах на последних местах. Собственно, мы привели результаты Dempsey только для сравнения.
Intel отобрала трон у AMD на секторе серверов и рабочих станций. И теперь AMD приходится думать над ответными шагами. Уже в этом месяце Intel выпустит четырёхядерный процессор Clovertown на основе двух кристаллов Woodcrest. AMD будет встречать это событие во всеоружии: выпуском X4 Opteron, который будет оснащён кэшем L3. Серверы от четырёхядерных процессоров выиграют больше, чем настольные системы, так как среди них, в отличие от серверов, до сих пор слишком мало многопоточных приложений.
В середине 2007 года AMD должна ответить на удар Intel новой линейкой быстрых процессоров Opteron под Socket F, а также с памятью DDR2. Будет ли этого достаточно, чтобы вернуть корону производительности, нам ещё предстоит увидеть. Но если AMD не сделает серьёзных архитектурных улучшений, то Intel, как нам кажется, продолжит лидировать по соотношению производительности на ватт.
В целом, обе платформы показали себя довольно хорошо, но мы всё же склоняемся в сторону линейки Xeon 5100 из-за превосходной производительности и высокой эффективности.
Мнение редактора
При покупке серверов обычно принимают во внимание стоимость, производительность и энергопотребление. Как показали тесты, Intel Xeon 5160 лидирует в последних двух категориях по сравнению с другими топовыми двуядерными процессорами. Учитывая, что Xeon 5080, 5160 и Opteron 285 стоят около $870, выбор Xeon 5160 кажется нам вполне логичным.
Решение Intel выпустить линейку Woodcrest Xeon 5100 всего через месяц после объявления Dempsey Xeon 5000 оказалось весьма неожиданным. Но тому есть много причин. На проект “Dempsey” были потрачены огромные силы и деньги, и прерывать его было бы слишком дорого. С другой стороны, разработка и производство Woodcrest явно пошли быстрее, чем планировалось. А учитывая существенно лучшую производительность и энергопотребление, Intel решила подпортить рынок AMD Socket F и взять обратно корону производительности. Конечно, всё это слухи, но всё же приятно, что Intel решила выпустить Woodcrest на рынок раньше, а не позже.