Сможет ли Bensley устранить недостатки Xeon?
Причиной, почему Intel не согласится на сравнительный тест двуядерных процессоров, является их производительность. Хотя новые двуядерные Xeon не играют в этом отношении заметной роли, будущее таит более радужные перспективы, поскольку платформа Bensley станет серьёзным отходом от архитектуры Xeon.
Архитектура Intel по-прежнему доминирует на серверном рынке x86, но AMD Opteron уже представляет собой нечто большее, чем мелкую неприятность для Intel, какой он оказался в момент выхода в апреле 2003 года. По сути, Opteron предлагает большую вычислительную мощность и лучшее соотношение между энергопотреблением и производительностью примерно по той же цене, что и Intel. При этом производительность Opteron намного лучше масштабируется при переходе от одного к двум или даже четырём процессорам. Лидерство AMD оказалось не меньшим и по отношению к новым двуядерным процессорам Intel Xeon.
Новый двуядерный процессор Xeon, работающий на 2,8 ГГц, производится по 90-нм техпроцессу и, как можно было ожидать, построен на NetBurst, включая поддержку Hyper-Threading. Конечно, производительность двуядерного процессора, оснащённого кэшем L2 2×2 Мбайт, достаточна для целевого рынка. В то же время, двуядерная дуэль, на которую AMD пытается склонить Intel, может стать потенциальным кошмаром для Intel.
Линейка чипсетов Lindenhurst (E7520/E7320) для процессоров Xeon отличается двумя основными недостатками. Во-первых, оба двуядерных процессора используют одну и ту же шину FSB и шину памяти. Во-вторых, регистровая память DDR2 для серверов не даёт какого-либо преимущества по сравнению с DD1. Наконец, зачем нужно покупать сервер, который устареет через несколько месяцев?
Впрочем, на решение о покупке сервера влияют такие факторы, как надёжность, доступность и качество сервисных услуг. А максимальная производительность не всегда стоит на первом месте. С этой точки зрения AMD ещё работать и работать, поскольку крупные OEM вроде Dell, Fujitsu-Siemens, HP/Compaq, IBM и Toshiba слишком тесно связаны с Intel.
Но ситуация меняется. Скажем, те же фермы рендеринга компаний Джорджа Лукаса построены на процессорах Opteron. Поэтому Intel должна защищать прибыльный бизнес серверов. Если до спасения в виде серверного процессора Woodcrest осталось ещё около года, то платформа Bensley готова появиться уже через пару-тройку месяцев. Здесь есть хорошие новости: платформа Bensley не только будет обладать рядом архитектурных улучшений вроде нового контроллера памяти, независимых шин для каждого процессора и хороших возможностей модернизации. Платформа будет поддерживать грядущий 65-нм двуядерный процессор Xeon (кодовое название Dempsey), а также процессор Woodcrest следующего поколения.
Новая двуядерная архитектура Intel Xeon действительно обеспечивает превосходную производительность, если сравнивать её с одноядерными процессорами. Однако AMD предлагает более скоростные чипы как на одном, так и на двух ядрах.
Исследуем серверные планы Intel
За событиями, происходящими в Intel, очень интересно наблюдать. Если раньше кодовые названия хранились в строжайшей тайне, то сегодня Intel готова на ранних этапах поделиться ими с публикой. В то же время, увеличилось число кодовых названий процессоров и чипсетов, а также и число платформ. В результате в планах Intel (см. иллюстрацию выше) присутствует более 30 кодовых названий.
Мы решили детально рассмотреть следующее поколение Xeon, которое обведено красной пунктирной линией. Под Bensley скрывается новая платформа, которая включает как чипсет, так и процессор Xeon. Bensley нацелена на корпоративный сегмент начального уровня. Многопроцессорная платформа названа Truland, но пока из-за отсутствия подробностей мы не будем её рассматривать.
Платформа Bensley будет базироваться либо на чипсете Green Creek (рабочие станции), либо Blackford (серверы). При этом для платформы можно будет выбрать три модели 65-нм процессоров: Dempsey, урезанную версию современных двуядерных Xeon; Sossaman, версию с уменьшенным энергопотреблением для серверов малого форм-фактора; а также грядущий процессор Woodcrest. Последний вариант построен на основе новой микро-архитектуры Intel и, по нашим инсайдерским сведениям, выдержит состязание по производительности на ватт с AMD.
Dempsey представляет собой двуядерный процессор Xeon следующего поколения, основанный на технологиях, которые появятся вместе с Cedar Mill и Presler. Чип, по сути, будет последней моделью на основе NetBurst. Но Woodcrest не появится раньше второй половины 2006 года. Он тоже будет 65-нм чипом, но на основе микро-архитектуры следующего поколения с 4 или 8 Мбайт кэша L2.
У платформы Dempsey есть приятная особенность: материнские платы на её основе будут работать как с процессорами Dempsey, так и с Woodcrest (Socket 771), обеспечивая пользователей хорошими возможностями для модернизации. Мы пока ещё не упоминали Sossaman, поскольку этот процессор, опять же, будет совершенно иным. Sossaman представляет собой ничто иное, как редизайн мобильного двуядерного процессора Yonah, нацеленный на серверные системы с низким энергопотреблением. Платформы Sossaman будут достаточно сильно отличаться от систем Dempsey и Woodcrest, так как процессор будет использовать Socket 479.
Следует сделать ещё одну важную добавку: сегодняшние двуядерные процессоры Xeon можно использовать только в паре с сегодняшней платформой Lindenhurst. Все будущие версии двуядерных процессоров предназначены для платформы Bensley.
Двуядерные серверные процессоры
Как мы уже отмечали в нашем предварительном тестировании линейки Pentium D 900, последнее поколение двуядерных процессоров на основе NetBurst будет использовать “сдвоенное” ядро.
Если двуядерные процессоры AMD Athlon 64 X2 и Opteron, а также новые двуядерные Intel Xeon используют два ядра на едином физическом кристалле, то 65-нм двуядерный процессор на NetBurst (линейки Pentium D 900 и Xeon 5000) основан на двух физически раздельных ядрах в единой процессорной упаковке. Поэтому точнее будет их называть процессорами со сдвоенным ядром.
Sossaman
Sossaman является одним из самых интересных процессоров, который выйдет в начале следующего года. Он построен на базе того же кристалла, который Intel будет использовать для двуядерного процессора Yonah для ноутбуков, но процессор будет валидирован для серверов. Причиной подобного шага является низкое тепловыделение – пакет всего 31 Вт, максимум, и это при частоте 2 ГГц.
По предварительным результатам некоторых тестов, которые мы смогли прогнать в серверной лаборатории Intel, двухпроцессорная система на основе 2-ГГц Sossaman обеспечивает примерно такую же производительность, что и двухпроцессорная машина на текущих двуядерных Xeon. Конечно, при намного меньшем тепловыделении.
Инновации в платформах в 2006 году. Наконец-то!
С платформой 2006 года Bensley Intel намерена улучшить ряд факторов, включая надёжность (reliability), доступность (availability) и качество обслуживания (serviceability). Хотя, конечно, на первом месте будет стоять производительность.
На втором месте находится пункт “Эффективность и использование” (Efficiency and Utilization). Что ж, некоторые улучшения эффективности можно назвать запоздалыми, а под использованием Intel подразумевает, в основном, технологию виртуализации VT, которая появится вместе с 65-нм процессорами. Если у Intel эта технология называется VT, то у AMD – Pacifica. Обе технологии упрощают поддержку функционирования виртуальных машин (VM) и повышают эффективность их реализации (то есть и без VT виртуализация работает, но не так эффективно). Кроме того, на обеих технологиях можно реализовать Hypervisor – способ поддержки VM, отличающийся от традиционного VMM архитектурой (первым его реализовал Xen, но, по нашей информации, Microsoft решила двигаться в том же направлении).
Скажем, на настольных компьютерах вы можете установить Windows XP Professional и Windows XP Media Center Edition, причём обе системы будут работать одновременно. Первая позволяет выполнять офисные/домашние задачи, в то время как вторая работает в качестве мультимедийного центра для вашей квартиры – и всё это на одном компьютере.
В серверном окружении виртуальные машины могут использоваться для упрощения кластеризации, для обеспечения группы программных разработчиков “новым сервером” за считанные минуты, для переноса программных средств виртуализации (VMWare) ещё на один уровень вниз к “железу” или просто для уменьшения числа одновременно используемых машин.
Существует множество потенциальных применений для технологии виртуализации, о которых многие из нас даже не задумываются.
Наконец, под третьим пунктом подразумевается надёжность, доступность и качество обслуживания. В 2006 году Intel намерена добавить к своим платформам поддержку RAID 6. В отличие от RAID 5, RAID 6 обеспечивает двойную избыточность. То есть данные массива не потеряются, даже если из строя выйдут два жёстких диска.
Под четвёртым пунктом находится управляемость (Manageability). Здесь Intel продолжит продвигать технологию iAMT (Active Management Technology) на серверный рынок.
Что нас ждёт завтра?
Сегодняшняя платформа Lindenhurst позволяет одному или двум процессорам работать по общей 200-МГц шине с учетверённой передачей данных (FSB800). Пиковая пропускная способность составляет 6,4 Гбайт/с, однако она разделяется между двумя процессорами.
Ещё одним “узким местом” является шина памяти DDR2-400, поскольку она даёт ту же самую максимальную пропускную способность 6,4 Гбайт/, которая, опять же, разделяется между двумя процессорами. Платформа же AMD, напротив, использует встроенные в процессоры контроллеры памяти, в результате чего каждый процессор получает полную пропускную способность памяти DDR400 – 6,4 Гбайт/с (два канала).
Тяжело нагруженная шина с тремя узловыми точками в Bensley будет заменена на дизайн DIB (Dual Independent Bus), наконец-то обеспечивающий подключение каждого процессора через индивидуальную шину FSB. Скорость шины будет увеличена до 266 МГц (FSB1066), что даст прирост пропускной способности до 8,5 Гбайт на процессор.
А контроллер памяти будет поддерживать не только двухканальную память DDR2-400, но и четырёхканальную DDR2-533. В итоге пропускная способность интерфейса памяти возрастёт с 6,4 Гбайт/с до, примерно, 17 Гбайт/с.
Хотя изменения выглядят обещающе, нам ещё предстоит увидеть, как они отразятся на реальной производительности. Особенно сложно прикинуть эффективность работы четырёхканального контроллера памяти. Однако, посмотрев на некоторые ранние образцы систем, мы можем сказать, что самым важным в ускорении серверов Xeon являются две независимые процессорные шины.
Fully Buffered DIMM – ахиллесова пята!
А вот с памятью могут возникнуть проблемы. И дело не только в том, что буферные чипы FB-DIMM нагреваются сильнее, чем предполагала Intel, Но и в том, что потребителям вновь придётся менять технологию памяти.
В Lindenhurst используется ECC-память DDR2-400, которая, по сути, даёт производительность не выше DDR333. Сегодня поставляется большое число систем с памятью DDR2. Однако если серверу требуется большие объёмы памяти, то приходится обращаться к низкоскоростной памяти DDR, – слишком уж сложно оправдать DDR2.
Возможно FB-DIMM и станут стандартом в обозримом будущем, но пока весьма сомнительно, готов ли рынок к FB-DIMM в такой степени, как это полагает Intel.
Серверный чипсет Blackford (платформа Bensley)
Если для серверов предлагается чипсет Blackford, который будет доступен как в полнофункциональной, так и урезанной, дешёвой версии, то Green Creek построен на модифицированном дизайне для рынка рабочих станций. То есть в борьбе с AMD Intel акцентирует внимание не только на улучшении производительности новой платформы, но и на расширении возможных сфер применения.
Blackford поставляется с тремя портами x8 PCI Express, которые можно использовать для сетевых чипов, контроллеров накопителей или мостов PCI-X. Урезанный вариант Blackford VS (Value Server) будет оснащён всего двумя конфигурируемыми портами x4 PCIe. Кроме того, он не будет поддерживать четырёхканальную память. Intel объявила новые южные мосты ESB-2 (контроллеры ввода/вывода), которые будут обладать всеми необходимыми интерфейсами, включая встроенные SATA2 и USB 2.0.
Чипсет Green Creek для рабочих станций (платформа Glidewell)
Кроме 16 линий PCIe, которые можно конфигурировать как один порт x16 или два порта x8 для поддержки двух графических карт, особых отличий между Green Creek и Blackford нет.
Четыре канала памяти с FB-DIMM
С чипсетами Blackford и Green Creek впервые будут объявлены Fully Buffered DIMM. Каждый модуль оснащён так называемым буферным чипом, который обеспечивает последовательную связь “точка-точка” между контроллером памяти и каждым установленным модулем. Если в традиционных системах нагрузка на контроллер памяти с установкой каждого нового банка памяти увеличивалась, то FB-DIMM позволяют организовать более глубокую очередь. Кроме того, прокладка линий для FB-DIMM на материнских платах будет очень простой.
Ещё одна любопытная особенность кроется в возможности “зеркалировать” оперативную память. Хотя контроллер памяти чипсетов Blackford и Green Creek поддерживает четырёхканальную работу, каналы можно разбить две пары, причём вторая будет “зеркалировать” первую. Таким образом, мы получаем некое подобие массива RAID 1 в оперативной памяти.
Отметим функцию Intel “posted CAS”, которая позволяет активировать импульс CAS раньше положенного времени в традиционных конфигурациях. Добавится функция теплового мониторинга, которая будет включать троттлинг памяти после достижения определённого температурного порога чипа.
Blackford также поддерживает “горячую замену” DIMM. В результате администраторы могут заменять модули DIMM, если сервер использует зеркалирование. Если один из модулей выйдет из строя, заменить его труда не составит. Однако все эти функции, а также возможность работы с 64 Гбайт памяти требуют большого числа разъёмов DIMM. Вряд ли на стандартных конфигурациях мы увидим столь большое их количество.
Технология ускорения ввода/вывода I/OAT
Технология ускорения ввода/вывода (I/OAT, I/O Acceleration Technology) является ещё одной “изюминкой” новых серверных платформ Intel. Технология включает в себя функцию разгрузки процессора при работе с протоколом TCP (TCP Offloading) и оптимизированное прохождение данных (optimized data movement) через платформу – во всех смыслах. Если посмотреть на представленный слайд, технология I/OAT позволяет сетевому контроллеру записывать данные напрямую в оперативную память.
На слайде видна строка “best price performance solution to layer 4/5 acceleration” – “лучшее решение по соотношению цена/производительность для ускорения 4 и 5 уровней”. Здесь Intel подразумевает модель OSI, в которой уровень 4 является транспортным (здесь работает протокол TCP, Transmission Control Protocol) а уровень 5 – сеансовым (протоколы вроде HTTP или FTP).
Конечно же, сетевые карты с аппаратной поддержкой просчёта TCP очень важны для серверов, которым нужно справляться как с высокой вычислительной нагрузкой, так и с большим сетевым трафиком. На просчёт TCP требуется немало процессорных ресурсов, особенно это будет заметно с переходом на сети 10 Гбит/с. Intel, похоже, нашла хорошее и недорогое решение, разделив сетевую нагрузку между интеллектуальным сетевым чипом и многоядерным процессором.
Заключение
Со слов Intel, новая микро-архитектура позволит вернуть “корону производительности” и обойти AMD к концу 2006 года по соотношению производительности на ватт. В настоящее время у нас нет достаточной информации о процессорах на новой микро-архитектуре, чтобы подтвердить обещания Intel. Но нам известно достаточно деталей, позволяющих обсудить грядущую серверную платформу.
Во-первых, следует заметить, что будущие процессоры Xeon на архитектуре NetBurst с 65-нм техпроцессом не слишком изменят расстановку сил. В основных индустриальных тестах вроде SPEC JBB, WEB2005 или TPC-C процессоры Opteron по-прежнему будут намного впереди.
Для справки мы рекомендуем проверять информационные страницы серверов крупных OEM – там обычно всегда публикуются результаты стандартных тестов в целях сравнения.
Впрочем, новая платформа определённо сделает серверы более надёжными, более целостными, более гибкими и, в итоге, более привлекательными, хотя преимущество по производительности в мире двухпроцессорных серверов по-прежнему останется за AMD.
С выходом Bensley мы получим ряд функций, которые конкурент либо выпустит позже (виртуализация), либо отдаст на откуп третьим компаниям (Active Management, I/OAT). Наконец, отметим четыре канала памяти, хотя подобная конфигурация может работать не так быстро, как может показаться.