Введение
Когда-то давно серверные процессоры Intel кардинально отличались от десктопных собратьев. Помните Pentium Pro, который был оснащён передовой архитектурой P6, не соответствовавшей остальной линейке Intel тех лет? Этот процессор существовал в то время, когда десктопные CPU Intel всё ещё имели более старую архитектуру P5. Затем был Pentium II Xeon, оснащённый кэш-памятью L2 настолько большого объёма, какой был возможен на специфическом интерфейсе Slot 2.
Но в последующее время процессоры для десктопов и для однопроцессорных серверов, рабочих станций стали всё более сближаться. К счастью, Intel с умом обыграл это обстоятельство, существенно снизив отпускную цену серверных процессоров. В настоящий момент, отпускная стоимость Xeon лишь на 10-20 долларов выше соответствующих по характеристикам декстопных процессоров.
Когда десктоп находится не на своём месте
Как результат, довольно часто можно столкнуться с таким подходом, когда сервер начального уровня собирается на базе десктопного процессора, что позволяет немного съэкономить. Идеология здесь такова: “Это только название, и ничего больше”. Мы уверены, что среди наших читателей найдётся немало тех, кому даже доводилось видеть серверы на процессорах Celeron!
Такой подход однозначно неправильный, и в данном случае лучше прямо и сразу сказать об этом, так как смягчение, иной раз, не отвечает интересам потребителей.
Неважно, идёт ли речь об Intel или AMD — мы решительно настаиваем на том, что сервер должен быть собран на базе серверной платформы. Компании не должны использовать процессоры для десктопов в серверах, на которые возложено выполнение ответственных задач. Даже если отличие от десктопной платформы заключается только в поддержке памяти с коррекцией ошибок, либо просто более надёжной материнской плате, более высокие затраты на покупку процессоров Opteron или Xeon оправданны.
К данному выводу очень просто прийти, когда речь идёт о двухпроцессорных конфигурациях вроде той, что мы описывали в обзоре 5600-й серии Xeon. В данном случае ничто не изменит тот факт, что два процессора Core i7 под сокет LGA 1366 не могут совместно работать на плате с серверным чипсетом Intel 5520. Действительно, в этом случае Xeon просто не имеет альтернативы.
Но Intel также продаёт и версии Xeon для однопроцессорных конфигураций.
Именно в том случае, когда серверный CPU для однопроцессорных конфигураций и его десктопный собрат имеют одну и ту же архитектуру, наиболее велик соблазн использовать менее дорогой декстопный процессор, рассчитывая, что в конечном счёте производительность будет такой же. Тот же объём кэша, число ядер и тактовая частота — и, как результат, такая же производительность. Возможно даже, что сервер на Xeon будет чуть медленнее соответствующей десктопной конфигурации по причине использования ECC-памяти.
Вот почему Intel по-прежнему приходится старательно убеждать потребителей, что даже в однопроцессорных серверах Xeon — главный и единственный претендент.
Структура рынка однопроцессорных решений
Однопроцессорные конфигурации для корпоративного применения можно разделить на два дифференцированных класса: сервера начального уровня и рабочие станции.
Чипсет Intel C200 похож на P67 и H67
Потенциальный потребитель сервера начального уровня или находится в поиске недорогой “рабочей лошадки” для использования в среде SMB или планирует использовать данный сервер как один из узлов в серверной стойке. Для таких задач энергопотребление и тепловыделение являются достаточно важными критериями. Более того, становится обязательным наличие системы удалённого управления, такой как Intel vPro/AMT. Специфика сервера базы данных не предполагает необходимости установки нескольких графических карт. 16 линий на шине PCI-E, которые обеспечивают современные процессоры Intel, более чем достаточно для любой серверной машины.
Что касается рабочих станций, то их основной целью является обеспечение максимальной производительности. Рабочие станции, как правило, собирают в нормальных корпусах с продуманной системой вентиляции. Температура и энергопотребление не являются ключевыми характеристиками. Не критичны и функции удалённого управления системой. Но поскольку дискретные видеокарты в рабочих станциях используются намного чаще, то на плате должен быть хотя бы один полноценный слот PCI-E x16.
До нынешнего дня линейка однопроцессорных решений от Intel включала серии процессоров для рабочих станций – Xeon W3500 и W3600, а также серию Xeon W3400. Несмотря на разные названия, все три серии базируются на одной и той же архитектуре, общей с десктопными CPU. Xeon W3500 основан на ядре Bloomfield c энергопотреблением 130 Вт для сокета LGA 1366. Xeon W3600 использует дизайн Gulftown с шестью ядрами, который, конечно, по-прежнему подразумевает тот же уровень тепловыделения и имеет то же исполнение под LGA 1366. Большинство представителей серии Xeon W3400 основаны на 45-нм ядре Lynnfield, хотя есть несколько разновидностей с 32-нм ядром Clarkdale.
Серия Xeon E3-1200 значительно меняет данный ландшафт, так как на место серий W3400 и W3500 приходят несколько моделей на архитектуре Sandy Bridge. Серия W3600 остаётся, предлагая многоядерную и многопоточную функциональность, которую не могут обеспечить новые процессоры E3, в которых имеется всего четыре физических ядра.
Рассмотрим новую серию Xeon более подробно.
Процессоры Intel Xeon E3-1200
Серия E3-1200 включает 11 новых процессоров, пять из которых предназначены для серверов, четыре — для рабочих станций, а ещё две low-voltage модели не будут продаваться в розничных сетях. Все 11 процессоров очень близки, так как основаны на одной и той же архитектуре Sandy Bridge, представленной для десктопных CPU в начале текущего года.
Это значит, что процессоры произведены по 32-нм техпроцессу, имеют до четырёх физических ядер и 8 Мбайт кэш-памяти L3. В зависимости от модели, технологии Hyper-Threading и Turbo Boost включены или отключены, что используется для дифференциации внутри линейки. Все процессоры имеют двухканальный контроллер памяти с поддержкой до 32 Гбайт DDR3-1333. Также процессор оснащён графическом ядром Intel HD Graphics 3000 и контроллером шины PCI-Express.
Тем не менее, есть несколько заметных отличий между семейством десктопных процессоров Core и новыми процессорами Xeon.
Во-первых, контроллер памяти поддерживает модули памяти с коррекцией ошибок. Это ничего не значит для десктопов, но является важным дополнением для серверов и рабочих станций, которые служат для решения коммерческих задач.
Многих вполне устраивает надёжность десктопного “железа”. Но практически у каждого пользователя есть несколько неприятных воспоминаний о том, как после долгой работы за компьютером появляется “синий экран” и приходится выполнять всю работу с самого начала. Всё это — ситуации, которых память ECC помогает избежать. Поэтому для серверов и рабочих станций поддержка ECC-памяти является необходимым условием.
Во-вторых, процессоры новой линейки Xeon E3 имеют более широкие возможности по использованию слотов PCI-E. Многие считали, что все процессоры Sandy Bridge, включая серверные модели, ограничены 16 линиями и 3 контроллерами. Тем не менее, новая линейка Xeon обеспечивает 20 линий и 4 контроллера. Как это можно объяснить?
На домашнем ПК 16 линий, которые даёт контроллер процессора Sandy Bridge или монополизируются одной графической картой (в режиме х16), или распределяются несколькими видеокартами в конфигурациях SLI/CrossFire. Но для серверов и рабочих станций список возможных сценариев загрузки шины PCI-E значительно шире. Это могут быть 10-гигабитные сетевые контроллеры, карты SAS или хабы Fibre Channel, для работы которых необходимы слоты PCI-E x8 и x4. И дополнительные 4 линии могут оказаться весьма полезным дополнением.
Наконец, третьей особенностью процессоров Xeon E3 является встроенная графика. В серверных процессорах Xeon графическое ядро отключено. Один из процессоров low-voltage оснащён графическим ядром HD Graphics 2000. Четыре процессора Xeon для рабочих станций имеют более продвинутое графическое ядро HD Graphics P3000, которое мы подробно рассмотрим в данном обзоре.
Базовая частота, ГГц | Макс. частота (Turbo Boost), ГГц | Кэш L3, Мбайт | Ядра/Потоки | Частота DDR3 | Hyper-Threading | Turbo Boost | TDP, Вт | |
Xeon E3-1280 | 3,5 | 3,9 | 8 | 4/8 | 1333/1066 | Есть | Есть | 95 |
Xeon E3-1275 | 3,4 | 3,8 | 8 | 4/8 | 1333/1066 | Есть | Есть | 95 |
Xeon E3-1270 | 3,4 | 3,8 | 8 | 4/8 | 1333/1066 | Есть | Есть | 80 |
Xeon E3-1260L | 2,4 | 3,3 | 8 | 4/8 | 1333/1066 | Есть | Есть | 45 |
Xeon E3-1245 | 3,3 | 3,7 | 8 | 4/8 | 1333/1066 | Есть | Есть | 95 |
Xeon E3-1240 | 3,3 | 3,7 | 8 | 4/8 | 1333/1066 | Есть | Есть | 80 |
Xeon E3-1235 | 3,2 | 3,6 | 8 | 4/8 | 1333/1066 | Есть | Есть | 95 |
Xeon E3-1230 | 3,2 | 3,6 | 8 | 4/8 | 1333/1066 | Есть | Есть | 80 |
Xeon E3-1225 | 3,1 | 3,4 | 6 | 4/4 | 1333/1066 | Нет | Есть | 95 |
Xeon E3-1220 | 3,1 | 3,4 | 8 | 4/4 | 1333/1066 | Нет | Есть | 80 |
Xeon E3-1220L | 2,2 | 3,4 | 3 | 2/4 | 1333/1066 | Есть | Есть | 20 |
Как видим, линейка Xeon E3 предлагает более широкий выбор, чем все процессоры Core второго поколения (i7, i5 и i3). За исключением одной модели low-voltage, все модели Xeon имеют четыре физических ядра. Почти все оснащены 8 Мбайт кэша L3 и поддерживают Hyper-Threading.
Процессоры серверного класса имеют уровень энергопотребления 80 Вт, что соответствует более высоким требованиям к данному параметру для машин, устанавливаемых в серверных стойках. Процессоры для рабочих станций имеют тот же уровень TDP в 95 Вт, как и десктопные процессоры Intel. Две модели low-voltage имеют TDP 45 Вт и 20 Вт, соответственно.
Просматривая линейку Xeon E3 можно обнаружить некоторые возможности, которые мы ранее затрагивали в описании процессоров второго поколения Core: Turbo Boost, Demand-Based Switching (режим энергосбережения, аналогичный SpeedStep), поддержку аппаратного ускорения шифрования AES-NI (Advanced Encryption Standard New Instructions).
Присутствует и уникальная функция FlexMigration, расширяющая возможности использования этих процессоров в среде виртуализации. Если максимально упростить суть данной технологии, то она сводится к исключению сбоев в работе виртуальных машин. При использовании виртуализации потенциальный риск существует при наличии в сетевой инфраструктуре нескольких хостов, различающихся с точки зрения процессорной архитектуры. Проблемы возникают при миграции виртуальных машин между хостами с разными поколениями процессоров. Технология FlexMigration позволяет настроить сетевую инфраструктуру с несколькими хостами, используя сервера на основе новых Xeon наряду с более старыми серверами. FlexMigration распознаёт каждое поколонение “железа” на хостах и позволяет подвести их под “общий знаменатель” – самую слабую конфигурацию, скрывая от виртуальной машины функции, специфичные для новых процессоров, что предотвращает проблемы с совместимостью. Конечно, отключать новые функции – не идеальное решение проблемы, но если их отключают с целью избежание сбоев, такой подход себя оправдывает.
Системная логика Intel C20х
11 процессоров новой линейки дополняются тремя различными наборами системной логики. Но здесь отличия могут быть несколько более серьёзными. Все три чипсета являются модифицированной версией Cougar Point, напоминающей H67 Express. Чипсеты имеют следующие наименования: C202 (базовая модель, самая простая из трёх), C204 (стандартный вариант для серверов), C206 (продвинутая модификация с расширенным набором функций – актуальна для рабочих станций).
C202 позиционируется как решение для малого бизнеса. По идее, платформа на чипсете C202 должна составить конкуренцию серверу на основе десктопного процессора. Набор функций минимален и должен привлечь потенциального покупателя, прежде всего, за счёт относительно низкой цены.
В частности, контроллер чипсета обеспечивает шесть портов SATA2, но ни одного SATA3. Чипсет задействует 16 из 20 линий PCI-E, которые предоставляет процессор, обеспечивая работу трёх контроллеров из четырёх. При этом сам чипсет обеспечивает ещё 8 линий, так что с проблемой нехватки линий по шине PCI-E x16 вы вряд ли столкнётесь (для сторонних контроллеров такой функциональности более чем достаточно). Платформа C202 не поддерживает встроенную графику, не оснащена аудиокодеком, но имеет 12 портов USB 2.0, слот Legacy PCI и встроенный MAC-контроллер. Чипсет C202 не имеет поддержки удалённого управления AMT/vPro, а также не поддерживает технологию управления энергопотребления сервером Intelligent Power Node Manager.
Intel C202 | Intel C204 | Intel C206 | |
Линии PCI-E 2.0 на базе CPU | 16 линий/3 контроллера | 20 линий/4 контроллера | 20 линий/4 контроллера |
Линии PCI-E 2.0 на базе контроллера чипсета (PCH) | 8 | 8 | 8 |
Порты SATA2 (3 Гбит/с) | 6 | 4 | 4 |
Порты SATA3 (6 Гбит/с) | Нет | 2 | 2 |
Технология Rapid Storage | Есть | Есть | Есть |
Порты USB 2.0 | 12 | 12 | 14 |
Удалённое управление | Нет | Нет | AMT 7.0/vPro |
Управление энергопотреблением (Node Manager) | Нет | Да | Нет |
Legacy PCI | Да | Да | Да |
Встроенный MAC | Да | Да | Да |
Встроенная графика | Нет | Нет | Да |
Встроенный звук | Нет | Нет | Да |
В отличие от своего младшего собрата, чипсет С204 имеет поддержку Node Manager. Эта функция может быть полезна, в частности, для серверов баз данных, где загрузка постоянно меняется, и возможность распределять энергию и тепловыделение весьма желательна. Эта платформа для серверов лишилась двух портов SATA2, на их место пришли два выхода SATA3. Кроме того, поддерживается все 20 линий PCI-E 2.0, которые предоставляет процессор (наряду с 8 дополнительными линиями, которые обеспечивает чипсет). Так что платформа С204 предполагает отличные возможности по установке карт расширения.
Если вы собираете однопроцессорный сервер, то C204 – старший чипсет для Xeon E3, на который вы можете обратить внимание. Здесь нет поддержки встроенной графики и звука, но есть всё, что нужно для серверной платформы.
Собственная плата Intel на базе C204 оснащена подключённой по шине PCI-E картой SAS, которая не монополизирует слоты расширения. Кроме того, плата оснащена небольшим устройством под названием Remote Management Module 4, который обеспечивает возможности KVM через протокол TCP/IP. Это позволяет удалённо управлять системой. Также предусмотрена поддержка виртуального носителя, что позволяет подключить локальный привод оптических дисков, находящийся на вашем рабочем ПК для удалённой установки, к примеру, Windows Server 2008 R2 на данном сервере. Очень полезная функция!
C206, в целом, напоминает полнофункциональный чипсет H67 Express, за исключением 20 линий PCI-E 2.0, которые обеспечивает процессор Xeon. Ещё 8 линий даёт сам чипсет. Набор портов почти не отличается от C204 (четыре SATA2, два SATA3, но 14 USB 2.0 вместо 12). Кроме того, С206 имеет встроенный звук и поддерживает вывод графики встроенного в процессор графического ядра.
Asus P8B WS
В то время, как системные платы на основе чипсетов C202 и C204 широко представлены такими крупными производителями серверных платформ, как Intel, Supermicro и Tyan, существует всего одна плата на С206 и её производит Asus. Так как мы тестируем процессор Intel Xeon E3-1275, ориентированный на рабочие станции, выбор платы для рабочих станций — Asus P8B WS — был для нас очевидным решением.
Плата оснащена сокетом LGA 1155, способным принять любой из четырёх процессоров Xeon E3 для рабочих станций. Также в наличии четыре слота памяти с возможностью установки до 32 Гбайт DDR3-1333 с коррекцией ошибок, либо без неё. Asus обеспечила на плате всего один выход для монитора — стандартный разъём DVI с поддержкой разрешения до 1920х1200. Мы рассматривали это как ограничение данной платы, но дело оказалось не в компоновке платы Asus, а в неудачной реализации самой встроенной графики Intel.
P8B WS имеет четыре слота PCI-E x16, способные работать с четырьмя двухслотовыми видеокартами. Плата в принципе не поддерживает режим SLI и ограничена режимом CrossFireX с поддержкой одновременной работы до четырёх карт AMD. Используя 20 линий, обеспечиваемые CPU, слоты PCI-E x16 могут работать в режимах x16/x4/x4 или x8/x8/x4/x4, забирая дополнительно 4 линии от контроллера чипсета. В том случае, если вы не будете занимать все слоты PCI-E x16 видеокартами, вы также сможете пользоваться одним слотом PCI-E x1 и Legacy PCI.
Набор возможностей P8B WS завершают два сетевых выхода Gigabit Ethernet, добавочный контроллер USB 3.0, два порта IEEE 1394 и восьмиканальный аудиокодек.
Intel HD Graphics P3000
Мы уже достаточно подробно останавливались на возможностях графического ядра в процессорах Sandy Bridge для десктопов в статье “Sandy Bridge: Intel Core второго поколения”. Тогда нас немного озадачил тот факт, что процессоры с разблокированным множителем серии К оснащены встроенной графикой HD 3000 (с 12 потоковыми процессорами), а процессоры с заблокированным множителем ограничены более скромной встроенной графикой HD 2000 с шестью потоковыми процессорами. Действительно, вряд ли того, кто тратит дополнительные средства на процессоры с разблокированным множителем, вообще интересует встроенная графика. Вместе с тем, в более дешёвых процессорах производительность встроенной графики более важна.
К счастью, процессоры для рабочих станций не унаследовали данную особенность. Все четыре процессора для рабочих станций Xeon E3-12x5s оснащены разновидностью той же самой встроенной графики GT2, как и “продвинутые” десктопные процессоры на архитектуре Sandy Bridge.
От десктопных процессоров графика Xeon отличается индексом “P” в названии (судя по всему, это означает “Professional”). Тем не менее, с точки зрения архитектуры GPU между HD 3000 и HD P3000 нет никакой разницы. Согласно информации от Intel, P3000 имеет специфические оптимизации драйвера видеокарты, которые обеспечивают повышение производительности в некоторых приложениях, запускающихся на рабочих станциях.
Действительно, AMD и nVidia делают нечто похожее в дискретных видеокартах профессионального класса. Обе компании, доминирующие на рынке дискретных видеокарт, фокусируются на какой-то определённой архитектуре GPU, которая объединяет десктопы, мобильные ПК и рабочие станции. Но затем данная архитектура “тюнингуется” в зависимости от специфики применения. Таким образом, именно драйверы AMD FibrePro и nVidia Quadro – это то, что делает уникальными профессиональные карты для рабочих станций.
Сейчас Intel выделила группу программистов для реализации аналогичного подхода. Как результат, Intel утверждает, что рабочая станция с процессором Xeon E3-12×5, использующая встроенный GPU, имеет все возможности, чтобы конкурировать с дискретными видеокартами начального уровня, такими как nVidia Quadro FX 580 ($150). Если это действительно так, то встроенная графика Intel HD P3000 приобретает огромное значение, помогая снизить конечную стоимость рабочей станции.
HD Graphics P3000 имеет расширенные параметры настройки, хотя дискретные видеоадаптеры предлагают более широкие возможности
AMD и nVidia имеют здесь намного больше опыта и наработок. Эти компании знают, что оптимизации в драйверах и сертификация драйвера разработчиками ПО должна быть прозрачной, чтобы покупатель видеокарты заранее знал, на что он может рассчитывать. Обе компании поддерживают постоянные контакты с разработчиками ПО. Например, если вы профессионально работаете в Maya, можно зайти на соответствующую страницу сайта nVidia либо AMD и одним кликом мыши загрузить сертифицированный драйвер, одобренный компанией Autodesk, использование которого обеспечит реальный прирост производительности в данном приложении.
Компания Intel впервые оказалась на этом поле битвы. На сайте Intel отсутствует аналогичный список сертифицированных драйверов, оптимизированных для тяжёлых графических приложений.
Наибольшая функциональность, в которой мы смогли убедиться, было наличие оптимизаций для САПР Autodesk AutoCAD 2011, Bentley MicroStation, а также Adobe Photoshop. Очевидно, существуют и другие приложения, над которыми команда Intel ведёт работу, но мы не знаем ни одного из них, которое можно было бы здесь указать.
Без чёткого, прозрачного списка сертифицированных драйверов, с точки зрения применения в профессиональных приложениях, невозможно определить, обеспечивает ли встроенная графика HD P3000 что-то помимо того, что даёт десктопная HD Graphics 3000. По нашим тестам вы сможете убедиться, что встроенная графика Core i7 и Xeon E3 обеспечивает одинаковую производительность в любом из приложений, которое не фигурирует в нынешнем драйвере для HD P3000.
Drawing Test Name | |||
Intel HD Graphics P3000 | Intel HD Graphics 3000 | nVidia Quadro FX 580 | |
B-Spline Surfaces | 97,3 | 96,6 | 103,6 |
Filled Hidden Line | 26,1 | 25,4 | 121,2 |
Geometric Primitives | 56,5 | 57,2 | 88,7 |
Geometric Primitives (Anti-Aliased) | 48,2 | 48,6 | 52,9 |
Pattern Fill | 45,9 | 42,8 | 75,7 |
Raster | 19,1 | 19 | 44,4 |
Shaded Mesh | 36,8 | 23,9 | 36,3 |
Text | 102,7 | 103 | 111,3 |
Shadows Comparison | |||
Intel HD Graphics P3000 | Intel HD Graphics 3000 | nVidia Quadro FX 580 | |
Shadows Disabled | 321,8 | 323,1 | 977,7 |
Shadows Enabled | 86,3 | 85,9 | 172,4 |
Buffer Tests | |||
Intel HD Graphics P3000 | Intel HD Graphics 3000 | nVidia Quadro FX 580 | |
Copy Buffer | 348,4 | 350,8 | 1607,8 |
Element Dynamics | 8760,5 | 8639,3 | 14812,4 |
Walkthrough Diagnostic | |||
Intel HD Graphics P3000 | Intel HD Graphics 3000 | nVidia Quadro FX 580 | |
Occlusion Testing Disabled | 24,2 | 17 | 38,9 |
Occlusion Testing Enabled | 29,9 | 17,8 | 34,9 |
Перед нами результаты бенчмарка Bentley MicroStation, запускавшегося на трёх конфигурациях. Как вы видим, есть три подгруппы теста, где HD P3000 превосходит HD 3000. Но пока Intel не начнёт внедрять оптимизации для приложений, сомнительно, что профессионалы будут всерьёз воспринимать HD Graphics P3000. Люди, которые тратят дополнительные средства на покупку системы с ECC-памятью хотят иметь гарантии, что экономия $150 на покупке дискретной видеокарты PRO-класса не обернётся расходами в тысячи долларов на потерянной в будущем работе.
Тестовая конфигурация и бенчмарки
Аппаратное обеспечение | |
Процессоры | Intel Xeon E3-1275 (Sandy Bridge) 3,4 ГГц, LGA 1155, 8 Мбайт общего кэша L3, режим Hyper-Threading включен, функции энергосбережения включены Intel Core i7-2600K (Sandy Bridge) 3.4 ГГц, LGA 1155, 8 Мбайт общего кэша L3, режим Hyper-Threading включен, функции энергосбережения включены |
Материнская плата | Asus P8B WS (LGA 1155) на чипсете Intel C206, версия BIOS 0401 |
Оперативная память | Crucial 8 Гбайт (2 x 4 Гбайт) DDR3-1333 ECC небуферезированная, CT51264BA1339.16FD |
Накопитель | SSD-накопитель Samsung MZ-5PA2560/000 SATA2 256 Гбайт |
Видеокарта | Intel HD Graphics P3000 Intel HD Graphics 3000 nVidia Quadro FX 580 |
Блок питания | Seasonic X760 760 W 80 PLUS Gold PSU |
Системное ПО и драйверы | |
Операционная система | Windows 7 Ultimate 64-bit |
Версия DirectX | DirectX 11 |
Драйвер видеокарты | Intel Driver: 8.15.10.2345 nVidia Driver: 270.61 |
Кодирование видео | |
MainConcept 2.0 | Version: 2.0.0.1555 MPEG-2 to H.264, MainConcept H.264/AVC Codec, 28 sec HDTV 1920×1080 (MPEG-2), Audio: MPEG-2 (44.1 kHz, 2 Channel, 16-Bit, 224 kb/s), Codec: H.264 Pro, Mode: PAL 50i (25 FPS), Profile: H.264 BD HDMV |
HandBrake 0.9.4 | Version 0.9.4, convert first .vob file from The Last Samurai to .mp4, High Profile |
Приложения | |
WinRAR | Version 4.0 RAR, Syntax “winrar a -r -m3”, Benchmark: 2010-THG-Workload |
Visual Studio 2010 | Miranda IM Compile |
Blender | Version: 2.54 beta Syntax blender -b thg.blend -f 1, Resolution: 1920×1080, Anti-Aliasing: 8x, Render: THG.blend frame 1 |
ABBYY FineReader | Version: 10 Professional Build (10.0.102.82) Read PDF save to Doc, Source: Political Economy (J. Broadhurst 1842) 111 Pages |
Adobe After Effects | CS5 10.0.2; Custom Workload, SD project with three picture-in-picture frames, source video at 720p |
Adobe Photoshop CS5 | 12.0.3; Custom Workload, Radial Blur, Shape Blur, Median, Polar Coordinates filters |
Adobe Premiere Pro | CS5 5.0.3; Paladin Workload |
e-on Software Vue 8 PLE | 1920×1080 landscape render, Global Illumination enabled |
Euler3D | CFD simulation over NACA 445.6 aeroelastic test wing at Mach .5 |
Autodesk MatchMover 2011 | Custom workload, 720p camera footage tracked in 3D space |
Синтетические тесты и настройки | |
SPECapc 3ds Max 9 | Default Run, Hardware Shaders, Graphics, and CPU Render scores |
SPECapc LightWave 9.6 | LightWave 3D Discovery Edition, Render and MT benchmark scores |
SPECviewperf 10 | Multi-threaded x64 (four-threads); Workloads: 3ds Max, CATIA, Maya, Pro/E, SolidWorks, Teamcenter Visualization Mockup |
Cinebench 11.5 | CPU and GPU tests, Built-in benchmark |
Профессиональное 3D-моделирование
Начнём с бенчмарка SPECapc. Прежде всего, необходимо отметить, что мы запускаем тестовый набор viewperf 10, так как более новый SPECviewperf 11 должным образом не распознаётся встроенной графикой HD P3000/3000. В результате, при использовании нового бенчмарка обе конфигурации со встроенной графикой проваливают несколько подтестов.
Даже использование viewperf 10 демонстрирует очень близкие результаты HD 3000 и P3000. Intel говорит о том, что P3000 имеет оптимизации для реальной работы и бенчмарки в этом отношении не показательны. Что же, у нас будет возможность убедиться, вдруг какой-нибудь другой из тестов, ориентированных на работу с графикой, покажет иные результаты, позволив HD P3000 вырваться вперёд.
Между тем, nVidia Quadro FX 580 обеспечивает значительно лучшие результаты во всех шести подтестах, причём в пяти из них отрыв столь велик, что покупка дискретной карты за $150 кажется неизбежной.
Встроенная графика Intel неплохо показала себя в подтесте Maya, даже несмотря на то, что Maya не входит в число программ, о наличии оптимизаций для которых заявляет Intel.
Последняя (десятая) версия LightWave заметно отличается от LightWave 3D 9.6 — наиболее свежей сборки, для которой у нас имелся заготовленный тестовый сценарий. К сожалению, нам вновь приходится использовать не самую последнюю версию ПО, чтобы тестировать современное графическое оборудование. С другой стороны, такой подход позволяет сравнить производительность в LightWave с предыдущим тестом.
Тест на рендеринг OpenGL фактически показывает, что все три конфигурации имеют близкую производительность. В тестах Interactive и Multi-Task дискретная карта Quadro FX 580 отрывается от HD P3000/3000. То, что дискретная карта превосходит по производительности встроенную графику, вряд ли кого-то удивит. Более интересно, что HD P3000 и 3000 снова показали близкий результат. Судя по всему, перед нами ещё одно приложение, где профессиональная встроенная графика Intel не имеет специфических оптимизаций.
Процессоры Core i7-2600K и Xeon E3-1275 имеют одинаковую базовую тактовую частоту и частоту в режиме Turbo Boost. Поэтому близкие показатели CPU Render в 3D Max 9 были предсказуемы. Намного более удивительно, что реализация встроенной графики Intel превосходит Quadro FX 580 в тесте Hardware Shaders. Однако в финальном тесте — Graphics — карта nVidia восстанавливает своё лидерство.
В данном подтесте мы видим результат, заметно отличный от полученного ранее. Почти в каждой категории дискретная графика nVidia превосходит Intel. Исключением стал только тест Hardware Shaders.
Тем не менее, встроенная графика Intel HD P3000 имеет одно серьёзное преимущество — она ничего не стоит, а дискретная карта nVidia стоит $150. Что же касается сравнения “профессиональной” встроенной графики с HD 3000, то каких-либо существенных отличий в их производительности до сих пор выявить не удалось.
Adobe CS5 Suite
Первым в списке идёт Premiere Pro CS5.
Мы использовали ролик Paladin для измерения производительности кодирования графики. Для некоторых карт Premiere Pro CS5 позволяет использовать технологию nVidia CUDA с целью повышения производительности, но Quadro FX 580 не входит в их число. Как известно, существует метод обеспечить работу CUDA для карт, которые не распознаёт Premiere Pro CS5. Но всё равно есть минимальные требования к объёму памяти видеокарты — 750 Мбайт и плата с 512 Мбайт здесь не сможет нам помочь.
В результате, все три конфигурации запускались в software-режиме — вся специфическая нагрузка легла на CPU. И хотя результаты немного отличаются друг от друга, существенной разницы мы не видим. Разница была бы при использовании дискретной карты nVidia с большим объёмом памяти.
After Effects — приложение, в котором основная нагрузка ложится на CPU. Разница в графических ускорителях в данном тесте не влияет на результат.
То же можно сказать в отношении Photoshop CS5 – приложении, оптимизированном для многоядерной, многопоточной архитектуры, но не получившим выигрыша от более мощного GPU.
Если основная цель, стоящая перед рабочей станцией, сводится к работе в After Effects или Photoshop, то полезно знать, что вложение денег в быструю видеокарту не принесёт столь заметного выигрыша в производительности, как покупка более мощного CPU или вложения в быструю дисковую подсистему. С другой стороны, если вы делаете тяжёлую работу в Premiere Pro, вам точно нужна карта с поддержкой CUDA.
Кодирование мультимедиа
Большинство тестов на перекодирование видео в нашем обзоре показывают чистые результаты производительности процессоров, причём некоторые из этих тестов содержат оптимизации под многопоточность, а другие — нет. В этом контексте MainConcept 2.0 не смог продемонстрировать сколь-нибудь интересный результат.
Возможно, было бы разумно поинтересоваться, почему мы не противопоставили технологии CUDA программы с поддержкой Quick Sync. К сожалению, хотя Intel утверждает, что Xeon E3 имеет полноценную поддержку Quick Sync, мы не смогли заставить работать эту функцию. Запустив последнюю версию CyberLink MediaEspresso 6.5, мы обнаружили, что работает только аппаратное ускорение декодирования, тогда как аппаратная поддержка кодирования отсутствует. Было бы честно отметить, что если вы планируете выполнять работу по перекодированию, десктопный процессор Core i7-2600K в данный момент имеет лучшую поддержку Quick Sync, чем Xeon. Тем не менее, результат мог быть и хуже: тест на перекодировку был выполнен за 38 сек вместо 22 секунд, что мы видели в обзоре Sandy Bridge. Это всё же лучше, чем CUDA или другие приложения, использующие для аппаратного ускорения процессор видеокарты.
HandBrake является очередным приложением, зависящим только от CPU и результат всех трёх конфигураций достаточно близок.
Технология “match moving” позволяет добавлять компьютерную графику в обычный фильм, при этом она синхронизируется с расположением, масштабом, ориентацией и движениями снятых объектов в кадре. Первым шагом при использовании “match moving” является определение и отслеживание объектов – а именно это и делает тест MatchMover 2011. В качестве тестового задания используется ролик, снятый Джоном Кэрролом (Jon Carroll) на “Аллее славы” в Голливуде.
Мы обнаружили, что это приложение почти не использует многопоточность, либо вообще не использует её. При этом создаётся впечатление, что данный тест отдаёт предпочтение новой архитектуре Sandy Bridge. Сравните результаты с соответствующей таблицей в тесте линейки Xeon 5600, где двухпроцессорной конфигурации на базе Xeon 5600 потребовалось более семи минут на выполнение точно такой же задачи.
Учитывая пожелания читателей, мы добавили Blender в тестовый пакет, посвящённый рендерингу изображений.
Рендеринг в Blender – ещё одна из задач, ориентированных на производительность CPU. И тесты вновь не показательны с точки зрения оценки производительности видеоподсистемы. С другой стороны это хорошая новость: если вы не планируете запускать другие 3D-приложения, можно смело использовать “бесплатную” встроенную графику HD P3000.
Компонент Cinebench, оценивающий производительность CPU, выявил небольшие отличия между тремя конфигурациями: лидирует Xeon E3-1275, на втором месте — Intel Core i7-2600K. Как ни странно, система с дискретной видеокартой Quadro FX 580 финишировала на последнем месте. Но не меньше удивляет тест рендеринга OpenGL, где нагрузка гораздо меньше зависит от процессора, но все три системы имеют близкие результаты.
Программа Vue используется для создания, анимации и рендеринга трёхмерных сцен, поэтому нет ничего удивительного в том, что данное профессиональное приложение хорошо оптимизировано для многоядерной, многопоточной архитектуры рабочей станции. Двухпроцессорная система на Xeon 5600 затратила на этот тест менее 10 минут, Core i7-980X смог выполнить его за 18 минут, а трём конфигурациям на основе SandyBridge потребовалось около 24 минут. И хотя результаты немного отличаются, в данном случае нет принципиальной разницы, какой графический ускоритель вы используете.
Приложения продуктивности
Следующим в нашем тесте идёт ABBYY Fine Reader – программа, использующая для распознавания текста.
Нет ни одной разумной причины, почему в этом тесте какая-либо из трёх конфигураций должна быть быстрее, чем другие. Тем не менее, системы на основе Core i7-2600K в FineReader показали более высокую производительность.
По той же причине, по которой мы не ждали разницы в производительности в FineReader, нет логического объяснения и тому факту, почему при архивировании в WinRAR конфигурация на Xeon на одну секунду опережает системы на Core i7. В этом тесте используется многопоточность и мы ожидали увидеть одинаковые результаты на всех трёх машинах.
В качестве теста на компиляцию мы решили использовать Visual Studio 2010. Данное приложение актуально с учётом специфики рабочей станции. Но и здесь никакой разницы в производительности замечено не было.
Потребление энергии
Измерение энергопотребления в таком обзоре, как нынешний, никогда не может дать точный результат. Если вы запускаете тест, измеряющий производительность CPU, графическая подсистема будет проигнорирована. Тест, нагружающий графическое ядро, может находится под избыточным влиянием остальной платформы и CPU.
Тем не менее, использование бенчмарка SPECapc 3ds Max 9 представляется нам неплохим компромиссом. Мало того, что данный тест имеет собственный компонент, отвечающий за измерение производительности CPU в рендеринге трёхмерной графики, но и в справедливом сбалансированном соотношении показывает производительность встроенного графического ядра HD P3000.
То, что результаты SPECapc не говорят нам, это насколько быстрее Quadro FX 580 завершает этот тест. Полный тест на дискретной графике занимает чуть более 15 минут, а при использовании встроенного GPU в процессорах Xeon E3 или Core i7 на этот же тест уходит более 25 минут.
Если свести каждый из этих трёх графиков в линию, то мы обнаружим, что обе системы, использующие встроенное графическое ядро, обеспечивают средний уровень потребления около 84 Вт под нагрузкой. Установка дискретной видеокарты увеличивает потребление системой энергии примерно до 96 Вт (что также неплохо, правда здесь имеется в виду именно средняя, а не пиковая загрузка GPU).
К сожалению, эти средние показатели значат слишком мало, кроме и так очевидного факта, что установка отдельной графической карты увеличивает потребление энергии. Но необходимо учитывать, что встроенная графика работает медленнее и на выполнение той же задачи может потребовать больше времени. Следовательно, более важен суммарный показатель ватт-часов, который можно получить, умножив затраченную системой энергию на количество времени, которое потребовалось для выполнения теста.
Такой подход приводит к противоположным результатам. Более медленной конфигурации со встроенной графикой потребовалось на выполнение теста около 35 ватт-часов, а система с дискретной графикой выполнила тест, израсходовав 25 ватт-часов.
В данном случае необходимо подчеркнуть, что большая энергоэффективность конфигурации Xeon с дискретной графикой Quadro не отражает любые сценарии использования рабочей станции. Много, если не большинство профессиональных приложений задействуют вычислительные ресурсы только CPU, и наличие дискретной графики не влияет на скорость операций. Отсутствие дискретной графики в такой системе действительно позволит снизить расход энергии.
Например, наличие дискретной видеокарты nVidia Quadro FX 580 на рабочей станции, предназначенной для монтирования видео в Premiere Pro CS5 не будет способствовать повышению энергоэффективности.
Таким образом, наш тест энергопотребления выявил две следующие особенности. Во-первых, мы убедились, что Xeon E3-1275 имеет точно такой же уровень потребления энергии, как и Core i7-2600K — соответствующий по характеристикам процессор для настольных ПК. Во-вторых, конфигурация со встроенным графическим ядром потребляет меньше энергии за отрезок времени, но в данном случае на первый план выходит энергоэффективность, при определении которой необходимо учитывать те задачи, для которых используется рабочая станция. В некоторых приложениях добавление дискретной карты позволило бы ускорить выполнение операций и, в конечном итоге, снизило расход энергии.
Выводы
Прежде всего, мы должны определиться, что может дать встроенная графика HD Graphics P3000?
Многие из тестов, результаты которых мы приводим в данной статье и которые регулярно можно видеть в обзорах процессоров на нашем сайте, совершенно разочаровывают. И хотя это выглядит как плохие новости для компании, которая утверждает, что использует дополнительные оптимизации встроенной графики в процессорах для рабочих станций линейки Xeon E3-1200, фактически это не так.
Для любого сценария нагрузки, не требующего мощного графического процессора, HD Graphics P3000 выглядит очень хорошо, обеспечивая в данных приложениях производительность на уровне дискретной видеокарты. Как мы видели, к таковым приложениям относится большинство наших тестов. Если вам не требуется тратить средства на дискретную карту, их можно вложить во что-то более полезное для рабочей станции начального уровня. Например, если вы работаете в VisualStudio или на рабочую станцию ложится нагрузка по рендерингу, съэкономленные средства разумно потратить на покупку твердотельного диска и пользоваться встроенной графикой HD P3000. Почему бы и нет? Графика уже есть, вы уже заплатили за неё при покупке процессора и соответствующей системной платы и её скромные результаты вполне достаточны.
Существует несколько ситуаций, где оптимизации на уровне драйвера помогают Intel HD Graphics P3000 конкурировать с профессиональными видеокартами начального уровня, например, Quadro FX 580. Хотя не будет ошибкой сказать, что на данный момент мало приложений, для которых драйвер Intel имеет оптимизации. Мы не смогли получить официальный перечень приложений, которые в данный момент работают лучше на встроенной в Xeon графике HD P3000, относительно встроенной в десктопные процессоры Core i7 графики HD 3000. Также отсутствует и список приложений, для которых Intel планирует сделать оптимизации в будущем. Без этой критичной информации для профессионалов невозможно принять обоснованное решение, подходит ли для них встроенная графика Intel HD P3000 или им необходима дискретная видеокарта, для которой имеется официальная сертификация. По этой причине, если приносящее вам прибыль приложение зависит от производительности в 3D, не стоит даже думать — покупайте дискретную карту. nVidia находится на рынке профессиональных графических карт уже долгое время и имеет соответствующую страницу сертифицированных драйверов, догнать которую Intel было бы трудной задачей. Примерно то же можно сказать и о компании AMD, на сайте которой есть соответствующая страница со списком сертифицированных драйверов. Intel нуждается в большей прозрачности процесса сертификации, если рассчитывает привлечь потребителей возможностями встроенной графики.
Перейдём к другим возможностям линейки процессоров Xeon E3.
Есть функции, которые новой линейке Xeon не достались от десктопных процессоров Sandy Bridge. Например, оверклокинг: если на Core i7-2600K за $317 вы получаете разблокированный множитель с возможностью разгона (этот процессор легко разогнать до 4,5 ГГц), то Xeon E3-1275 за $339 имеет заблокированный множитель. В добавок, хотя Intel и заявляет о том, что Quick Sync работает на процессорах линейки Xeon E3, ни одно из приложений, которые мы запускали для тестирования Quick Sync на десктопной конфигурации, не смогло распознать наличие этой функции на Xeon. Возможно, что проблема заключается в отсутствии поддержки программного обеспечения и со временем будет решена.
С другой стороны, Xeon позволяет использовать память с коррекцией ошибок. Платформа имеет дополнительные (по сравнению с платформой на Core) линии PCI-E. Чипсеты для Xeon E3 предполагают поддержку встроенного RAID для ОС на базе Linux. Другими словами, для бизнес-применения есть реальные причины потратить на $20 больше на процессор Xeon вместо покупки аналогичного Core i7.
И для потребителей, которым нужны эти специфические для рабочей станции возможности, которые ранее не были доступны по причине высокой стоимости серверных процессоров, покупка Xeon E3 действительно имеет смысл.
Здесь необходимо подчеркнуть, что мы рассмотрели лишь флагманский процессор Xeon E3-1275. Если снизить планку до процессора более низкого уровня, вроде E3-1225, который имеет четыре ядра, 6 Мбайт кэш-памяти L3, то же самое встроенное графическое ядро HD P3000 – то его цена $194 заставляет вести сравнение уже с процессором Core i5-2400 из десктопной линейки. Последний предлагает те же возможности за $184, но ограничен графикой HD Graphics 2000. Таким образом, лучшая встроенная графика и более профессиональный набор функций делают в этой паре Xeon очевидным выбором для рабочей станции начального уровня, не имеющей потребности в дискретной графике.
Интересно, что Intel предпочла не выпускать собственную системную плату на C206, поручив это компании Asus. С учётом сказанного, P8B WS становится основной платформой для рабочих станций. Конечно, внешне она весьма похожа на другие платы, основанные на чипсете P67 (несмотря на поддержку встроенной графики), что объясняется сходством двух чипсетов на базе Cougar Point. Учитывая основательную работу Asus, можно понять отсутствие на рынке системных плат для рабочих станций на C206 от других вендоров. Гораздо более широким является выбор серверной платы на чипсете C204 или C202.