Сравнение производительности VMware на серверах Opteron и Xeon
Для мира процессоров минувший 2005 год оказался весьма переломным, как для AMD, так и для Intel. Компании-потребители ИТ-ресурсов пытались выжать максимум из своих технологических процессов, чтобы оставаться на конкурентоспособном уровне. То есть они покупали системы, которые бы работали максимально долго, требовали минимального сервисного обслуживания, предлагали приличные функции управления и обеспечивали наилучшее соотношение цена/производительность. Поиск оптимальных решений может потребовать немало времени и денег, если осуществлять его неправильно. К сожалению, если по системам потребительского уровня сегодня выпущено немало материалов, то с бизнес-сегментом дела обстоят хуже.
Данная статья посвящена сравнению производительности современных платформ AMD и Intel в тяжело нагруженном многопоточном серверном окружении. Кроме того, мы хотели посмотреть, насколько хорошо будет масштабироваться каждая платформа. Поскольку все системы были предоставлены нам на небольшое время, проверить все типы предложений мы бы не успели. Впрочем, из нашего тестового пакета мы хотели бы выделить ESX Server, который сегодня является весьма актуальной темой, ведь операционная система VMware может любой сервер с лёгкостью “поставить на колени”, если вы запустите множество логических серверов на виртуальных машинах.
В качестве аппаратной части мы взяли две серверные системы HP: Proliant DL385 с процессорами AMD Opteron и Proliant DL380 G4 с процессорами Intel Xeon. Обе из них можно найти на сайте www.hp.com в разделе серверов. Dell выслала нам сервер PowerEdge 2850 на основе процессоров Intel Xeon. Кроме того, мы получили машину Transport GX28 от Tyan, оснащённую двуядерными процессорами Opteron.
Все платформы поддерживали двуядерные процессоры на момент выхода статьи, но в нашем тестировании двуядерные процессоры были доступны только для систем AMD. Машины AMD были оснащены Opteron 275 (HP) или Opteron 280 (Tyan) с 1 Мбайт кэша L2 на каждое ядро. Для дополнительных тестов у нас под рукой были по два процессора из линеек Opteron 248 и 254, поскольку сравнивать двуядерные Opteron с одноядерными Xeon было бы не очень честно. Системы на процессорах Intel 3,6 и 3,8 ГГц тестировались с включённой технологией Hyper-Threading (HT) и без неё.
Специально отобранные Opteron
Мы были удивлены тому, что купленные в рознице Opteron не захотели работать на сервере HP DL385, и мы решили узнать, почему. Как оказалось, AMD поставляет специальные процессоры своим партнёрам для стоечных и blade-серверов. Эти специально отобранные процессоры обладают меньшими тепловыми спецификациями, в отличие от обычных розничных версий, которые имеют тепловой пакет TDP 90 Вт. Процессоры Opteron 275, которые были установлены в тестовую систему HP, имели модельный номер OST275FAA6CB с тепловым пакетом всего 68 Вт. 95-Вт вариант можно найти здесь.
Довольно странно, но на страницах спецификаций HP DL385 мы не смогли найти какую-либо информацию о специально отобранных процессорах. Кроме того, мы не смогли протестировать систему HP с другими процессорами. Впрочем, процессоры с уменьшенным энергопотреблением очень даже важны. Представьте стойку 24U с 24 1U-серверами, использующими двуядерные процессоры. Серверы от HP будут суммарно выделять на 1296 Вт тепла меньше, чем конкурирующие модели с обычными процессорами. Как мы считаем, это очень весомое преимущество.
Комментарии к тестированию
3,8-ГГц процессоры Xeon прибыли в нашу лабораторию после того, как мы уже отослали сервер HP DL380, поэтому мы протестировали их только на Dell PE2850. Впрочем, поскольку эти системы очень похожи, можно ожидать примерно такую же производительность с 3,8-ГГц процессорами от системы HP DL380, что и от Dell PE2850. В принципе, сравнение результатов 3,6-ГГц процессоров демонстрирует различие между двумя машинами, и его довольно легко экстраполировать до 3,8 ГГц.
Мы проводили только серверные тесты, ориентированные на корпоративное окружение, поэтому разгон нас не интересовал. Кроме того, уровень шума в серверной комнате не особо важен, поэтому его мы тоже не измеряли. В то же время, энергопотребление можно считать весомым фактором, особенно если в вашем центре обработки данных работают сотни серверов. Поэтому мы измеряли энергопотребление при полной нагрузке и в режиме бездействия. Обратите внимание, что режим бездействия не всегда означает экономию энергии, ведь сегодня VMware ESX не поддерживает ни технологию AMD Cool & Quiet, ни Intel Demand Based Switching. По этой причине мы оценивали энергосбережение только в окружении Windows.
Не забывайте, что, кроме повышения энергопотребления, лишние ватты приводят и к увеличению тепловыделения. А лишнее тепло придётся отводить. И на его отвод тоже требуется энергия. Вообще, расходы на охлаждение серверной комнаты могут быть в два раза выше, чем расходы на энергопотребление непосредственно самих серверов. И итоговый счёт за электричество может оказаться очень даже приличным. Так что вы экономите стоимость примерно трёх ватт энергии на каждый лишний ватт.
Установку VMware мы проводили как можно ближе к настройкам по умолчанию, хотя объём дисковых буферов мы всё же увеличили. Установка производилась на два жёстких диска Ultra320 SCSI на 10 000 об/мин, заключённых в массив RAID 0 для получения максимальной производительности. Мы не выполняли каких-либо специфических аппаратных оптимизаций для платформ.
Конечно, для сохранения конкурентоспособности важна цена решений, поэтому мы добавили сравнение соотношения цена/производительность. Впрочем, даже до получения результатов мы уже предполагали, что платформа AMD выйдет на первое место. Двуядерные процессоры AMD поставляются уже давно, а аналогичные модели Xeon от Intel появились лишь несколько недель назад. Да и то не везде и не для всех.
Встречаем участников: процессоры AMD Opteron
Процессор Opteron 254 работает на частоте 2,8 ГГц и оснащён 1 Мбайт кэша L2. Собственно, этот процессор технически ближе всего соотносится с Intel Xeon 3,8 ГГц с 2 Мбайт кэша L2, так как обе модели предназначены для двухпроцессорных серверов и являются топовыми в своём классе.
Opteron 275 и 280 по гигагерцам находятся в той же категории, что и модели Opteron 248 и 250, но у них есть существенное преимущество: два ядра, что позволяет получить 4-ядерную машину в двухпроцессорном сервере. Мы решили добавить в тестирование Opteron 248, чтобы показать, как один двуядерный процессор покажет себя в сравнении с двумя одноядерными процессорами с такой же тактовой частотой.
Opteron 248: одноядерная модель на 2,2 ГГц с 1 Мбайт кэша L2.
Opteron 254 работает на 2,8 ГГц и, опять же, является одноядерной моделью с 1 Мбайт кэша L2. Все процессоры производятся по 90-нм технологии, в то время как процессоры с меньшей частотой по-прежнему могут использовать 130-нм техпроцесс.
Все модели Opteron, заканчивающиеся на число “65” или выше, являются двуядерными. Opteron 275 работает на частоте 2,2 ГГц и использует кэш L2 1 Мбайт для каждого ядра.
Opteron 280 является топовым двуядерным процессором Opteron. С частотой 2,4 ГГц и 1-Мбайт кэшем L2 для каждого ядра он оказывается достаточно скоростным, чтобы обойти процессоры Intel Xeon в большинстве приложений.
Встречаем участников: процессоры Intel Xeon
Сторону Intel защищает процессор Xeon 3,6 ГГц с 2 Мбайт кэша L2 и его 3,8-ГГц аналог, тоже имеющий 2 Мбайт кэша L2. Если процессоры Opteron 275 и 280 с двумя физическими ядрами на чипе вышли уже достаточно давно, то двуядерные Xeon появились только несколько недель назад, да и их частота не превышает 2,8 ГГц. С другой стороны, Intel предлагает технологию Hyper-Threading (HT), которая была объявлена ещё с выпуском Pentium 4 на 3,06 ГГц. Включение HT превращает чип в два логических процессора, способных выполнять потоки параллельно. Мы проводили тесты как с включённым, так и с выключенным Hyper-Threading, чтобы посмотреть, имеет ли какое-либо значение эта технология в окружении VMware.
Процессор Intel Xeon на 3,6 ГГц с 2 Мбайт кэша L2. Он имеет только одно ядро, но зато поддерживает технологию Hyper-Threading, которая должна в серверном пространстве обеспечить больше преимуществ, чем в сфере настольных ПК.
3,8-ГГц Xeon является самым быстрым одноядерным процессором. Опять же, он поддерживает Hyper-Threading, поэтому выглядит как два виртуальных процессора на одном физическом ядре. Недавно объявленный двуядерный Xeon работает на частоте 2,8 ГГц и требует действительно тяжёлых многопоточных нагрузок, чтобы показать преимущество в производительности по сравнению с более скоростными 3,8-ГГц ядрами. К сожалению, на момент выхода статьи наша лаборатория не смогла получить двуядерные процессоры.
Hewlett Packard Proliant DL380 (Intel Xeon)
Hewlett Packard позиционирует этот сервер в качестве флагманского для массового рынка. Как нам сказали, ни один другой сервер HP не продаётся лучше. Сервер упакован в прекрасно собранный корпус 2U. Внутри расположены два 604-контактных сокета для процессоров Intel Xeon, шесть слотов памяти DDR2 (12 Гбайт макс. объём), RAID-контроллер Smart Array 6i, два чипа гигабитного Ethernet (NC7782 от HP), три слота PCI-X, шесть отсеков для жёстких дисков, различные аксессуары управления, вентиляторы и блок питания с опциональной избыточностью. Доступны отсеки PCI-X и PCI Express с “горячим подключением”, если обычные PCI-X вас не устраивают.
HP использует DDR2-память Micron с задержками CL3-3-3 и скоростью DDR2-400.
Hewlett Packard Proliant DL385 (AMD Opteron)
Как известно, AMD сегодня даёт наилучшую производительность в общих серверных приложениях. DL385 является альтернативой HP на Opteron в классе 2U. Подобно модели 380, вы получаете замечательно упакованный корпус 2U. В нём присутствуют два сокета для процессоров AMD Opteron, шесть слотов для памяти DDR400/PC3200 (макс. 16 Гбайт), контроллер Smart Array 6i RAID, два чипа гигабитного Ethernet, три слота PCI-X, шесть отсеков для жёстких дисков, аксессуары управления и блок питания/вентиляторы с опциональной избыточностью. Пока для этой модели нет отсеков PCI-X или PCI Express с избыточностью. Как мы думаем, для этого придётся дождаться будущей модели DL385 G2.
HP решила чуть подогнать частоты процессора у этой модели. Как сообщила консоль ESX, процессоры работают на 5-6 МГц быстрее спецификации AMD. Немного, но на результаты тестов всё равно чуть заметно влияет.
HP использовала Micron DIMM: DDR400 и CL3,0.
Dell Power Edge 2850 (Intel Xeon)
Dell поставляет системы только на Intel, и перед нами самая популярная модель 2U. Хотя мы не тестировали другие серверы Dell, следует отметить ещё одну хорошую модель 1U с номером 1850. Сервер 2850 солидно собран, на том же уровне качества, что и HP DL380. Внутри находятся два 604-контактных сокета для процессоров Intel Xeon и шесть сокетов для памяти DDR2/PC2-3200, причём максимальный объём составляет 12 Гбайт. Также отметим RAID-контроллер PERC 4ei, два гигабитных контроллера Ethernet (Intel), три слота PCI-X, шесть отсеков для жёстких дисков и вентиляторы/блоки питания с избыточностью. Доступны отсеки PCI-X и PCI Express с “горячей заменой”.
Процессоры сервера работают немного ниже (10 МГц) спецификаций Intel.
Dell использует серверную память Hynix (CL3-3-3 и DDR2-400).
Tyan Transport GX28 (AMD Opteron)
Tyan является широко известным поставщиком профессиональных материнских плат и barebone-серверов. В линейке продуктов есть модели на всех процессорах AMD и Intel, и вы можете выбирать тот тип сервера, который вам нужен, после чего можно закупать процессоры, память и диски. Устанавливаете аппаратное обеспечение, кулеры – и всё готово.
Корпус 1U отличается качественным изготовлением и хорошей доступностью аксессуаров. К сожалению, в него можно устанавливать карты PCI-X только половинной высоты, а кабель SCSI в комплекте поставки может оказаться немного коротким, если вы выберите сторонний RAID-контроллер, скажем, из линейки LSI MegaRAID 320. Внутри располагаются два сокета для процессоров AMD Opteron, восемь слотов памяти DDR400/PC3200 (максимум 16 Гбайт), RAID-контроллер Adaptec, два контроллера гигабитного Ethernet, два слота PCI-X, четыре отсека для жёстких дисков с “горячей заменой” и блок питания без избыточности. У другой разновидности GX28 с модельным номером TA26 присутствует восемь отсеков для приводов SCSI и имеется избыточный блок питания. Но за неё придётся доплатить $285. Кроме того, за разумную доплату можно включить приличный набор аксессуаров управления.
В отличие от Hewlett Packard, процессоры сервера Tyan работают на 10-11 МГц ниже спецификаций AMD. С другой стороны, память Tyan работает на полной тактовой частоте 200 МГц (DDR400) даже с восемью DIMM. Это выше рекомендованного HP значения DDR333 для DL385. Разница видна по тестам, поскольку мы использовали конфигурации как с четырьмя, так и с восемью DIMM. Впрочем, всё это легко решается через обновление BIOS.
Corsair активна не только в сфере продуктов для энтузиастов. Не так давно мы получили несколько серверных DIMM, и сейчас представилась возможность их попробовать в деле.
Замечания по тестированию
Мы решили использовать VMware ESX Server, на котором запускали четыре и восемь виртуальных машин (Virtual Machine, VM) параллельно. Все они получили достаточные процессорные ресурсы, поскольку наши системы позволяют запускать такое число VM без особой конкуренции за CPU. Если добавить число виртуальных машин, то общая производительность распределится между ними или даже снизится.
Виртуальные машины не могут магически получить мощность по причине того, что мы запустим столько VM параллельно, сколько захотим. Поэтому одна VM на 100% ядра – это вполне даже хорошая конфигурация. Большинство серверных процессоров сегодня по-прежнему оснащены одним физическим ядром, а AMD является лидером по продвижению двуядерных процессоров на серверный рынок. HT, по идее, может ускорить производительность серверов Xeon, но эту технологию нельзя считать прямым конкурентом двуядерным чипам Opteron.
Впрочем, пока число виртуальных ядер HT не ниже числа VM, процессоры Xeon выглядят неплохо. Если число VM начнёт превышать количество логических процессоров HT, то производительность, по нашему опыту, падает ниже идентичной системы без HT. Именно поэтому в данном случае сообщество VMware рекомендует отключать HT у серверов.
Методика тестирования
Все тесты проводились с RAM-диска, чтобы производительность жёстких дисков не влияла на результат. Каждый тест повторялся три раза, чтобы обеспечить максимально точный результат. Мы использовали средний результат во всех трёх тестах. Как мы думаем, подобное решение весьма справедливо, поскольку сложно узнать, не повлияла ли виртуализация на производительность каким-либо нечестным образом в каком-либо тестовом прогоне. Поэтому сложно сказать, является ли наиболее быстрый результат на самом деле самым быстрым, который даст система.
В каждом прогоне мы складывали время выполнения задачи всех четырёх VM. Например, VM1 завершила работу за 2:02, VM2 – за 2:04, VM3 – за 1:59 и VM4 – за 2:03. Сумма составляет 8:08, её мы и выносим в результаты. Затем, предположим, три прогона дали суммы 8:05, 8:10 и 8:08. Среднее значение 8:08 попадает в финальный результат.
Во время тестовых прогонов с восемью VM мы пытались определить, какие получаются потери виртуализации при запуске большего числа VM, чем имеется ядер CPU. К сожалению, сравнивать двуядерные процессоры AMD с одноядерными (пусть и с HT) процессорами Intel – всё равно, что сравнивать тёплое и пушистое, но данные конфигурации отражают современные реалии. Мы добавим результаты с двуядерными Xeon, когда получим системы в нашу лабораторию.
Мы решили запустить по однопоточному приложению на VM. Впрочем, поскольку все VM работают параллельно, тестовые системы должны оптимально распределять потоки между всеми CPU. Поэтому данный тест показывает, насколько процессоры справляются с многопоточностью в масштабе.
Измерить время выполнения задач оказалось не так-то просто, поэтому мы использовали скрипты, которые записывали время запуска и завершения после синхронизации с часами Windows.
Из-за сложности подобного тестирования мы решили использовать самые простые приложения. Мы выбрали WinRAR 3.50, Lame MP3 Encoder 3.97.1 и Mencoder 1.0 с бета-версией кодека XviD 1.10. Мы также добавили Cplex: “тяжёлое” математическое приложение с вычислениями с плавающей запятой, отражающее научные, финансовые и прочие вычисления.
Мы посчитали важным использовать настройки VMware по умолчанию, поскольку какие-либо доводки и оптимизации приведут к нечестным результатам. Все тестовые системы использовали одинаковые настройки для памяти, файла подкачки и т.д. Впрочем, ни в одном тесте не использовался такой объём памяти, который привёл бы к подкачке на жёсткий диск.
Рабочие данные считывались несколько раз, чтобы убрать все “шероховатости”, связанные с задержками памяти. Поскольку все данные находились на RAM-диске, то с кэшированием проблем не было. Иначе мы бы обнаружили меньшие результаты первого прогона из-за считывания данных с жёсткого диска.
Результаты Windows были получены с помощью параллельного запуска одного теста четыре раза, что соответствует, примерно, четырём параллельно работающим VM. Конечно, эти результаты следует воспринимать скептически. Они были добавлены в тестирование только для того, чтобы показать накладные расходы на виртуализацию сервера ESX, а не для сравнения производительности.
Установка VMware ESX Server
Сервер VMware ESX устанавливать довольно просто, но при этом легко выбрать конфигурацию, которая снизит производительность. Спланируйте установку заранее. Мы не будем глубоко погружаться в процесс установки ESX, но покажем несколько экранов с использованными нами параметрами.
Тестовая конфигурация
Системное аппаратное обеспечение | |
Процессоры | Два процессора Intel Xeon Irwindale, одно ядро (3,6 ГГц, FSB800, 2 Мбайт кэша L2) Два процессора Intel Xeon Irwindale, одно ядро (3,8 ГГц, FSB800, 2 Мбайт кэша L2) Два процессора AMD Opteron 248, одно ядро (2,2 ГГц, 1 Мбайт кэша L2, 1 Гбайт/с HTT) Два процессора AMD Opteron 254, одно ядро (2,6 ГГц, 1 Мбайт кэша L2, 1 Гбайт/с HTT) Два процессора AMD Opteron 275, два ядра (2,4 ГГц, 2x 1 Мбайт кэша L2, 1 Гбайт/с HTT) Два процессора AMD Opteron 280, два ядра (2,6 ГГц, 2x 1 Мбайт кэша L2, 1 Гбайт/с HTT) |
Платформы | Dell PowerEdge (чипсет Intel, материнская плата Socket 604) HP Proliant DL380 (чипсет Intel, материнская плата Socket 604) HP Proliant DL385 (чипсет AMD8000, материнская плата Socket 940) Tyan Transport GX28 (чипсет AMD8000, Tyan Thunder K8SR) |
Память | См. соответствующие страницы статьи на системах AMD мы использовали 8 DIMM, на системах Intel – 6 |
Жёсткие диски | Seagate Barracuda ST373207LC 73 Гбайт, 10 000 об/мин, кэш 8 Мбайт, Ultra320 SCSI RAID-контроллер HP Smart 6i RAID (196 Мбайт кэша) для серверов HP или LSI MegaRAID 320-1 (64 Мбайт кэша) |
Сеть | Встроенные контроллеры гигабитного Ethernet (первичные) |
Графическая карта | Встроенные графические решения |
Системное ПО и драйверы | |
ОС | VMware ESX Server 2.52 Build 16390, на VM работал Windows Server 2003 32 Bit SP2 |
Драйвер платформы | Драйверы по умолчанию Buslogic VM SCSI Driver 1.2.0.2 Сетевой драйвер VMXNet по умолчанию |
Графический драйвер | Драйвер по умолчанию |
На системах AMD мы использовали 8 DIMM, чтобы дать обоим CPU одинаковые ресурсы памяти и максимально избежать передач NUMA (на CPU с меньшим объёмом памяти). В то же время, это обеспечило сервер Intel небольшим преимуществом по энергопотреблению, поскольку там мы устанавливали только 6 DIMM.
Всем VM выдавался 1 Гбайт памяти, чтобы избежать конкуренции из-за памяти. Серверу ESX памяти всегда хватало. В тестах с восемью VM на машинах Intel нам пришлось выделить по 900 Мбайт памяти, что связано с ограничениями систем. Впрочем, это не повлияло на результаты, поскольку каждая VM использовала намного меньше 900 Мбайт.
Чтобы сравнение энергопотребления было честным, мы включили встроенные SCSI-контроллеры на системах Dell и Tyan, а в два сервера HP установили контроллер LSI Megaraid 320-1 без нагрузки. К сожалению, системы HP не смогли загрузиться с контроллером LSI, так что подобное решение было единственным (мы использовали встроенные контроллеры серверов HP).
Тесты и настройки
WinRAR 3.50
Data files: 11 large text files (575 MB total) and 48 binary files (645 MB total)
Compression = Best
Dictionary = 4096kb
Options: a -m5 -md4096 -r
Ilog Cplex 8.00
Custom test suite, 6094 kB input file
Lame MP3 Encoder Version 3.97.1 Multi-threaded (Alpha 12)
WAV files: 1:17:20 minutes total (783 MB) to mp3
32 – 320 kbit VBR = level 3
Options: -v -b32 -B320
Mencoder 1.0 Pre7-3.4.2 Xvid 1.10-Beta2 encoding Xvid
Data files: PAL DV avi files (total 27:50 or 5,953 MB)
Options: -ovc xvid -xvidencopts bitrate=740 -oac mp3lame -lameopts br=192
Результаты тестирования
Помните, что результаты Windows добавлены только для того, чтобы вы смогли оценить влияние накладных расходов на виртуализацию сервера ESX. Результаты Windows не следует напрямую сравнивать с результатами ESX в каких-либо других целях.
WinRAR 3.50
Hyper-Threading не помогает результатам Intel под Windows, но с восемью виртуальными машинами разница вполне даже ощутима. Tyan и HP DL385 с одним CPU запускают память на DDR400, но система HP AMD обходит Tyan на несколько процентов. Скорее всего, это связано с тем, что процессор HP DL385 работает на 5 МГц выше спецификаций и на целых 15 МГц быстрее, чем у сервера Tyan. С двумя процессорами Tyan Opteron побеждает HP из-за того, что Tyan использует память в режиме DDR400 даже с восемью DIMM. Системы Intel отстают при выключении HT, но практически догоняют одноядерный Opteron 254 при активации HT. Двуядерные системы AMD можно назвать очевидным победителем, причём Opteron 280 работает почти в два раза быстрее, чем Intel Xeon 3,8 ГГц с включённым HT.
Ilog Cplex
Опять же, DL 385 обходит Tyan с одним CPU, но ненамного, и только под Windows. Hyper-Threading постоянно ухудшает результаты под Windows, хотя и не сильно. С восемью VM технология HT помогает незначительно. Cplex интенсивно использует вычисления с плавающей точкой, поэтому подобные результаты с увеличением VM можно было вполне ожидать. Обратите внимание на результаты с восемью VM, одним 3,8-ГГц Xeon и включённой HT: они всего на 30 минут медленнее, чем значение с двумя CPU. Вполне понятно, что Cplex не очень-то хорошо масштабируется при добавлении CPU.
Кодирование Lame MP3
С Lame сервер Tyan не смог получить какое-либо преимущество от более скоростного интерфейса DDR. Кроме того, система HP AMD так же быстра, как и Tyan с одним CPU. Системы Intel при включённой HT выигрывают в сравнении одноядерных двухпроцессорных систем в тесте ESX, но они ощутимо проигрывают двуядерным Opteron.
Кодирование видео Mencoder
В этом тесте сервер Tyan обходит HP DL385, особенно в прогонах ESX Server. Кроме того, одноядерные Xeon обгоняют одноядерные Opteron, но, опять же, уступают двуядерным AMD Opteron.
Тесты энергопотребления
Мы проводили тесты энергопотребления по следующим критериям. Во-первых, во всех серверах использовался только один блок питания, даже если все из них (кроме Tyan Transport GX28) оснащены избыточными блоками питания. Все серверы тестировали с RAID-контроллером PCI-X для того, чтобы сравнение было честным. Все банки памяти были заполнены двухсторонними модулями по 1 Гбайт. Под Windows мы оснащали системы 4 Гбайт памяти с помощью 1-Гбайт DIMM. Мы использовали два CPU, при этом включали HT на серверах Intel, поскольку именно так поступает большинство администраторов.
По энергопотреблению Intel ощутимо теряет. Системы AMD часто потребляют, как минимум, на 30% меньше энергии при 100% нагрузке, чем сходные системы Intel с включённой HT. Что касается двуядерных Opteron, то вы можете сэкономить более чем 50% на счёте за энергию по сравнению с двухпроцессорной системой Intel (при максимальной нагрузке).
Что ещё более впечатляет, в данном случае в системе Intel было установлено 6 DIMM, в то время как в серверах AMD – 8 DIMM. Ещё 10% можно сэкономить, включив функции энергосбережения на тех системах, которые их поддерживают (сегодня это и AMD, и Intel), как в режиме бездействия, так и при 100% нагрузке под Windows. Обратите внимание, что сервер ESX не поддерживает функции энергосбережения в версии 3, данная функция должна появиться в первом квартале 2006 года.
Также обратите внимание на меньшее энергопотребление 95-Вт Opteron 254 по сравнению с 68-Вт Opteron, оба с включённым PowerNow. 95-Вт процессор оказался лучше при полной нагрузке.
Сравнение цена/производительность
Мы создали рейтинг ESXMark, состоящий из среднего времени во всех наших тестах с четырьмя VM и двумя физическими CPU. Двухпроцессорные системы покупают чаще всего, причём для ESX это самая распространённая конфигурация. Мы использовали следующую формулу (поскольку в тестах производительности чем меньше, тем лучше):
(1/общее время в секундах*1^8) / цену.
Цены брались на декабрь 2005 года. Так что мы смогли получить довольно честное сравнение систем.
Использованные системные конфигурации
Мы брали самую дешёвую память из возможной, причём учитывали одинаковый объём для всех серверов. Конечно же, обязательным было стоечное решение, но без всего лишнего, в том числе и без операционной системы. Мы выбирали встроенный RAID-контроллер и привод CD-ROM, но без дисковода. Также требовалось встроенное простое решение управления, но без дополнительных функций. Мы не учитывали какие-либо скидки. Другими словами, старались быть максимально ближе к стандартной конфигурации.
Мы начинали с самой дешёвой альтернативы и модернизировали её до нужных спецификаций. Что касается серверов Tyan, то мы обнаружили только одну норвежскую компанию Nextron.no, которая продавала системы с нужными опциями. Для преобразования валюты использовался коэффициент $1 = 6,75 NOK.
www.dell.com:
Dell PE 2850, 2x 3,6 ГГц 2x 300 Гбайт SCSI, 6 Гбайт RAM, один блок питания, 3 года гарантии: $ 6105;
Dell PE 2850 2x 3,8 ГГц, 2x 300 Гбайт SCSI, 6 Гбайт RAM, один блок питания, 3 года гарантии: $ 6605.
www.hp.com:
HP DL 385 2x Opteron 275, 2x 300 Гбайт SCSI, 6 Гбайт RAM, один блок питания, 3 года гарантии: $ 8553;
HP DL 385 2x Opteron 254, 2x 300 Гбайт SCSI, 6 Гбайт RAM, один блок питания, 3 года гарантии: $ 7953;
HP DL 380 2x 3,6 ГГц Xeon 2 Мбайт, 2x 300 Гбайт SCSI, 6 Гбайт RAM, один блок питания, 3 года гарантии: $ 7790.
www.nextron.no:
Tyan GX28 2881, 2x Opteron 275, 2x 300 Гбайт SCSI, 6 Гбайт RAM, один блок питания, 3 года гарантии: $ 7270;
Tyan GX28 2881, 2x Opteron 280, 2x 300 Гбайт SCSI, 6 Гбайт RAM, один блок питания, 3 года гарантии: $ 7883;
Tyan GX28 2881 2x Opteron 254, 2×300 Гбайт SCSI, 6 Гбайт RAM, один блок питания, 3 года гарантии: $ 6583;
Tyan GX28 2881, 2x Opteron 248, 2x 300 Гбайт SCSI, 6 Гбайт RAM, один блок питания, 3 года гарантии: $ 5506.
High-end Opteron в серверах Tyan обладают определённо лучшим соотношением цена/качество, в то время как 275 выходят вперёд. Dell здесь тоже выглядит неплохо из-за декабрьского снижения цен. Серверы HP кажутся слишком дорогими по причине других ограничений, связанных с серверной инфраструктурой. Например, HP предлагает лучшее решение управления, но будьте готовы выложить за него дополнительные средства.
Заключение
Виртуализация позволяет неплохо сэкономить средства. Благодаря ей можно консолидировать старую серверную площадку. Причём подойдут любые области с относительно невысокой загрузкой процессора и с адекватным числом операций ввода/вывода.
Новые двуядерные процессоры оказываются очень выгодной альтернативой для blade-серверов или дешёвых стоечных вариантов. Кроме того, учитывайте лёгкость модернизации и консолидации в дальнейшем, поскольку вы будете добавлять аппаратное обеспечение к виртуальной инфраструктуре.
Производительность
Из двух систем AMD сервер Tyan выходит на первое место. Частично это связано с тем, что интерфейс AMD работает быстрее рекомендаций AMD при установке восьми DIMM. HP смогла бы выйти вперёд благодаря разгону процессоров в сервере Proliant DL385 на 5 МГц, если оба сервера работали бы в рекомендованном режиме DDR333 с установленными восемью DIMM. Впрочем, никакой критикой по этому поводу мы не занимаемся.
Что касается систем Intel, то HP немного обходит сервер Dell везде, кроме теста RAR, где Dell выходит вперёд (при равных тактовых частотах). Вообще, как нам кажется, в этом можно винить то, что сервер Dell работает на 10 МГц ниже спецификаций.
В данном тестировании Intel немало бы выиграла от двуядерных процессоров, так что мы надеемся в ближайшем будущем добавить и их результаты. Но Intel, похоже, пока нечем отбить атаки AMD, тем более что двуядерный Xeon имеет частоту 2,8 ГГц. Одноядерные процессоры Intel не могут угнаться за двуядерными Opteron, в то же время оставаясь на одном уровне с одноядерными процессорами AMD.
В целом, решение AMD Opteron можно назвать очевидным победителем, а двуядерные Xeon помогут Intel уменьшить отставание. Кроме того, следует признать, что планы Intel на 2006 год очень даже привлекательны, а от AMD существенных новостей пока нет.
Энергопотребление
Многие из вас прекрасно знают о том, что на потребительском рынке AMD обходит Intel по энергопотреблению. Но даже в серверной среде платформа AMD оказывается победителем. Сервер Tyan прекрасно себя показывает по экономии энергии. Серверы HP на AMD потребляют больше энергии, чем Tyan, но всё равно оказываются лучше конкурентов Intel. Такое явное отличие между платформами можно легко связать с разницей в гигагерцах между процессорами, поскольку все они производятся по 90-нм техпроцессу. Два сервера HP практически идентичны за исключением того, что версия AMD имеет на два слота DIMM больше, да и сервер AMD потребляет на 20-30% меньше энергии при установке сравнимых CPU.
Цена/производительность
Здесь ситуация неоднозначная. Сервер Tyan с AMD Opteron 275 легко обходит сервер HP на AMD, но лишь ненамного превосходит сервер Dell на 3,6-ГГц процессорах Intel.
Что удивляет, сервер Tyan 2U TA26 с поддержкой двух блоков питания стоит всего на $285 дороже, чем с одним. Сервер Transport GX28 обладает практически теми же функциями, что и конкуренты, за исключением лишь четырёх отсеков SCSI с “горячей заменой”, по сравнению с шестью, да и отсутствием избыточного блока питания. По сравнению с конкурентами, TA26 обладает рейтингом цена/производительность 151 с процессорами Opteron 275, если мы предположим, что он даёт ту же производительность.
В принципе, здесь могут наблюдаться различные расхождения, связанные со скидками, налогами и другими факторами.
Общее заключение
Как показывают наши тесты, процессоры Intel с технологией Hyper-Threading могут дать существенный прирост производительности, даже если число активных VM превышает количество логических ядер HT. Дело в том, что с виртуализацией повышаются шансы обработать две инструкции одновременно (с целыми числами и с плавающей запятой), в отличие от простого окружения Windows. Можно даже назвать технологию NetBurst (которая и поддерживает Hyper-Threading) своего рода VMBurst, причём она снижает накладные расходы на виртуализацию. Как мы думаем, четырёхпроцессорный сервер Intel с двуядерными CPU и 16 виртуальными ядрами HT может неплохо себя показать в сравнении со схожим четырёхпроцессорным двуядерными сервером AMD Opteron, даже если частота Xeon составит всего 2,8 ГГц. Мы с нетерпением ждём возможности протестировать эти серверы и сравнить их друг с другом.
Вообще, нас удивила эффективность технологии Hyper-Threading, тем более что многие специалисты по VMware рекомендуют её выключать. Вполне возможно, что с меньшей нагрузкой на CPU и большим числом VM результаты будут иными.
Как можно видеть по результатам, для выбора более скоростной альтернативы следует тестировать ваши приложения на платформах AMD и Intel, причём результаты могут оказаться весьма удивительными. Перед началом тестирования мы полагали, что приложение Cplex, чувствительное к скорости выполнения вычислений с плавающей запятой, будет намного быстрее на платформе AMD, но мы ошибались. Хотя новые двуядерные процессоры Intel Xeon могут и не обойти AMD Opteron в обычном серверном окружении, в области виртуализации AMD может оказаться позади.