Sandy Bridge: Intel Core второго поколения
Редакция THG,  12 января 2011


Sandy Bridge | Введение

В гордом одиночестве топовым сегментом рынка процессоров для десктопов правят чипы Intel Core i7 серии 900 для LGA-1366, противопоставить производительности которых никто и ничего не может. Если у вас есть средства, и вы собираете компьютер с прицелом на максимум производительности, сложно выбрать решение более мощное, чем разгонанный Core i7-950. Энтузиасты, которым реально необходимы возможности шести ядер, могут использовать Core i7-970, но придётся заплатить немало за право обладать таким процессором.

В то же время, в массовом сегменте рынка разворачиваются интереснейшие битвы. Не правда ли, забавно следить за тем, как здоровая конкуренция стимулирует агрессивную ценовую политику? Например, четырёхъядерные процессоры Intel Core i5-760, которые мы рекомендовали читателям в статье о новогодних подарках, предлагаются по неотразимой цене порядка $200, и столько же просит AMD за шестиядерные Phemon II X6 1075T. Или взять другой случай – процессоры AMD Black Edition, за счёт разблокированного множителя, покорили умы оверклокеров довольно давно, но вот и Intel, в начале 2010 года, представила линейку чипов K-серии, сломав тем самым собственную традицию продавать разблокированные процессоры только в виде моделей Extreme Edition, стоимостью в тысячу долларов.

5-го января, как раз в канун российских новогодних каникул, была официально представлена микроархитектура Sandy Bridge. Мы получили последние пресс-релизы и материалы по Sandy Bridge после полудня, с традиционным напоминанием, что завеса секретности снимается после девяти вечера по Москве. Интересно отметить, что выпуск Sandy Bridge идёт в обход привычных канонов - в прошлый раз, представляя новый дизайн процессоров, Intel запустила вначале топовые чипы Core i7 девятисотой серии, а затем уже, на основе этой архитектуры, появились более дешёвые модели для массового и бюджетного сегментов. В отличие от тех чипов, Sandy Bridge пришёл на рынок снизу-вверх, и в результате, мы увидим флагманские решения для LGA 2011, ориентированные на сегмент настоящих рабочих станций, только во второй половине 2011 года.

Sandy Bridge | Intel здесь и сейчас

До второй половины 2011 года ещё нужно дожить, а пока LGA 1366 продолжит занимать топовую позицию в линейке, в то время как чипы под LGA 1155, с центровым нападающим в виде Sandy Bridge, должны захватить все остальные сегменты, благодаря заявленному Intel тридцатипроцентному приросту производительности над чипами на основе Lynnfield и Clarkdale.

Конечно, это создаст проблемы AMD, которой нечем парировать подобный прирост производительности, и которая продолжает выпускать более быстрые версии процессоров лишь на текущей архитектуре. Единственным способом нанести ответный удар для неё будет снижение цен, и можно предположить, что именно этот путь AMD выбирать ой как не хотела бы. Конечно, мы ожидаем выпуска процессоров Bulldozer, на основе собственной архитектуры AMD следующего поколения, где-то в 2011 году, но их ещё дождаться нужно.

Впрочем, достанется не только AMD. Достаточно мощное ускорение, заложенное в микроархитектуре Sandy Bridge, сделает уязвимым и собственные чипы Intel Core i7 девятисотой серии. В настоящий момент, как минимум, пострадают решения в ценовой категории порядка $300 (например, Core i7-950), которые приходится устанавливать в заметно более дорогие матплаты с трёхканальной памятью. В целом, платформа X58 продолжит восседать на троне лидера в сегменте десктопов, но проанализировав результаты тестов Sandy Bridge, проведённых в Tom's Hardware, мы не удивимся, если дни X58 окажутся сочтены несколько ранее запланированного.

Sandy Bridge приготовил нам и другие сюрпризы, и не все будут смаковать их также, как ледяную водочку под хрустящий огурчик за новогодним столом. Например, разгон Intel-овских платформ стал совершенно другим, что заставит рвать на себе волосы экстремальных любителей жидкого азота. И ещё Intel делает большой упор на интегрированную графику, заранее называя её конкурентом дискретных решений начального уровня но, реалистично ли это в сегменте настольных ПК?


На другой чаше весов поддержка в Sandy Bridge блока логики с фиксированными функциями, предназначенного для ускорения кодирования видео. AMD и nVidia не смогут выставить достойного соперника, они отстают по технологии на год, следовательно сегодня, в задачах обработки видео, они окажутся повержены. Наконец, у нас есть несколько моделей чипов с разблокированным множителем, которые позволят процессорам Sandy Bridge, производимым по 32-нанометровой технологии, поиграть мускулами.

Sandy Bridge | Тест

Intel заранее прислала в тестлаб Tom’s Hardware четыре модели процессоров из будущей линейки: Core i7-2600K, Core i5-2500K, Core i5-2400 и Core i3-2100. Мы прогнали все эти чипы через обновлённый тестовый процесс 2011 года, вместе с чипами на базе Bloomfield, Clarkdale и Yorkfield. Также, в тестировании приняли участие решения на основе Thuban и Deneb от AMD. Так что, пока россияне уходили в творческие отпуска, в самый канун праздников, наша калифорнийская тестовая лаборатория вовсю тестировала новые Sandy Bridge. Готовы взглянуть на эти результаты?

Если мельком взглянуть на приведённые выше схемы, микроархитектура Sandy Bridge выглядит как полный отход от конструкции предыдущих моделей процессоров Intel. Так, процессоры предыдущего поколения Core на основе Clarkdale состоят из двух физических чипов – первый, это двухядерный процессор, изготовленный по 32-нанометровому процессу, а второй - графическое ядро, интегрированный контроллер памяти и контроллер PCI Express, производимые по 45-нанометровому процессу. Глядя на схему Sandy Bridge мы видим процессор, целиком и полностью изготовленный по 32-нанометровым нормам, со всеми теми же компонентами, совмещёнными в едином кристалле кремния. Но если вглядеться получше, в глаза начинает бросаться много подобного в "конструкции", что приводит нас к мысли - изменения в архитектуре, всё же, правильнее называть эволюционными.

Интеграция – именно это слово нужно держать в голове, глядя на устройство Sandy Bridge. Intel стремится получить максимальную отдачу от каждого из почти 1 миллиарда транзисторов (если быть совсем точными, их в Sandy Bridge 995 миллионов).

Стоит отметить, что к моменту анонса Intel приготовила три разновидности кристалла Sandy Bridge. Отличаются они количеством ядер и сложностью графического чипа. Самый мощный четырёхъядерный вариант как раз и состоит из 995 миллионов транзисторов, имеет размер кристалла 216 мм2. Двуядерный чип с 12 исполнительными блоками, формирующими графическое ядро – в нём 624 миллиона транзисторов на кристалле размером 149 мм2. Наконец, самый простой вариант с двумя процессорными ядрами и шестью исполнительными блоками графической системы – всего 504 миллиона транзисторов на 131 квадратном миллиметре кремния. Чтобы было понятнее, следующая таблица:

Размеры кристаллов
Размер кристалла, мм2 Число транзисторов (миллионов)
Sandy Bridge (4 ядра) 216 995
Sandy Bridge (2 ядра, HD Graphics 3000) 149 624
Sandy Bridge (2 ядра, HD Graphics 2000) 131 504
Bloomfield (4 ядра) 263 731
Lynnfield (4 ядра) 296 774
Westmere (2 ядра) 81 383
Gulftown (6 ядра) 248 1168

Для сравнения, в микроархитектуре Lynnfield, послужившей основой для семейства серий Core i7-800 и i5-700, при 45-нанометровом технологическом процессе удалось вместить всего 774 миллиона транзисторов в кристалл площадью 296 квадратных миллиметров. Разработчики архитектур в Intel должны быть благодарны инженерам, которые отладили 32-нанометровое производство на Westmere, чтобы оно заработало в полную силу с Sandy Bridge, за то что им удалось столько всего втиснуть в маленький кристалл.

Sandy Bridge | Ядра

Текущее поколение процессоров Sandy Bridge, в общих чертах, бывает трёх видов: четыре ядра с поддержкой Hyper-Threading (итого восемь потоков для операционной системы), четыре ядра без HT или два ядра с Hyper-Threading. Наши тесты показывают, что каждое из этих ядер, при равной частоте, мощнее ядер в процессорах Core на базе архитектуры Nehalem.

В процессоре по-прежнему есть 32 килобайта кэша инструкций и данных первого уровня (L1), вместе с 256 килобайтами кэша второго уровня (L2) у каждого ядра, хотя Sandy Bridge включает теперь и то, что Intel назвала кэшем инструкций нулевого уровня (L0), содержащим до 1500 декодированных микро-операций. Последнее обеспечивает двойной эффект – позволяет экономить энергию и улучшает пропускную способность инструкций. Если блок выборки обнаруживает нужную инструкцию в кэше, он может выключить декодеры до момента, когда они вновь не понадобятся. Intel также переработала блок предсказания ветвлений в Sandy Bridge, улучшив его точность.


Мы использовали в роли синтетического теста кодирование звука в iTunes и Lame как пример работы однопоточных приложений, чтобы сравнить Sandy Bridge с Nehalem на базе Lynnfield при равной частоте. Конечно, для чистоты эксперимента технологии Turbo Boost и EIST были выключены. На графиках видно, что только одно изменение архитектуры уже оказывает существенное влияние на производительность Sandy Bridge в сравнении с предыдущим поколением процессоров.

Процессоры на базе Sandy Bridge являются первыми решениями с поддержкой улучшенных векторных расширений (Advandec Vector Extensions, AVX) – 256-битного набора инструкций к SSE. AMD также введёт поддержку AVX в будущих процессорах на базе микроархитектуры Bulldozer. Появление AVX стимулировал рынок высокопроизводительных вычислений, где приложениям, производящим интенсивный рассчёт с плавающей запятой требуется как никогда много мощи. По этой же причине влияние AVX именно на успешность массового Sandy Bridge, скорее всего, будет ограниченным. Intel, впрочем, ожидает, что приложения для обработки звука и видео будут, в конечном итоге, оптимизированы для использования AVX, равно как и сервисы финансового анализа, инженерное и производственное ПО – на которые эта технология и рассчитана. К несчастью, сейчас не существует реальных приложений, оптимизированных для AVX, и нам не на чем было провести замеры, чтобы оценить потенциал технологии.

Конечно, потребовалось немало проделать работы, чтобы включит поддержку AVX, и, в том числе, произвести переход к физическим регистрам. Во-первых, это позволило операндам храниться в регистровом файле, вместо того, чтобы путешествовать с микро-операциями сквозь блок внеочередного исполнения. Во-вторых, Intel удалось использовать обеспеченный новым физическим регистром уменьшенный размер кристалла и улучшенное энергосбережение для значительно увеличения буферов, более эффективно "питающих" данными усиленный движок рассчёта плавающей запятой.

Sandy Bridge | Кэш

В результате усиления интеграции, Intel пришлось изменить работу с кэшем третьего, последнего, уровня. Во времена, когда потолком были четырёхядерные Bloomfield, Lynnfield и Clarkdale (и даже шестиядерные Westmere), каждому физическому ядру можно было обеспечить собственное соединение с этим общим кэшем. Технических проблем это не вызывало. Но уже чипы из серии Xeon 7500, продаваемые сегодня, и спроектированные как более масштабируемые, содержат до восьми физических ядер на процессор и будь они построены по прежнему принципу, возникало бы непомерное количество обращений между основным и последним уровнями кэш-памяти. Поэтому, Intel адаптировала и для новой микроархитектуры кольцевую шину (ring bus), что в промышленных решениях позволит наращивать количество ядер в процессоре и дальше, избегая выхода логистики обмена данными из под контроля.

Ранее специалистам THG удалось пообщаться с Сайлешем Коттапали, старшим ведущим инженером Intel, который утверждал, что ему удалось получить устойчивую полосу пропускания данных до 300 гигабайт в секунду на процессорах Intel серии Xeon 7500, поддерживающих кольцевую шину. К тому же, на Intel Developer Forum (IDF) представители компании подтвердили, что все разрабатывающиеся в настоящий момент процессоры будут использовать кольцевую шину. Можно достаточно смело предположить, что в будущем мы увидим развитие тенденции увеличения количества ядер в процессоре, а также, интеграции других компонентов прямо в кристалл.

Вот только мы не думаем, что Intel в этот раз сильно переживала насчёт количества ядер в массовых версиях процессоров на архитектуре Sandy Bridge - скорее, её инженеров волновало интегрированное графическое ядро, также сдвинутое в сторону архитектуры кольцевой шины, которая теперь соединяет графику, до четырёх ядер и системный агент (system agent, ранее известный как uncore) с остановкой в каждом домене. При такой архитектуре величина задержек плавает, поскольку каждый компонент работает по кратчайшему пути к шине, но в целом, они всегда должны быть ниже, чем у процессоров на базе Westmere. В общем, наибольшее влияние кольцевая шина должна будет оказывать на производительность в графических приложениях.

Sandy Bridge | System Agent и Turbo Boost 2.0

Изменившись главным образом в названии, "системный агент" (system agent), ранее называвшийся uncore, объединяет в себе подсистемы, которые не могут быть сгруппированы с исполнительными ядрами (и включает в себя графическое ядро).

В списке компонентов "системного агента" - двухканальный контроллер памяти (официально поддерживающий скорость передачи до 1333 МТ/с), 16 линий PCI Express второго поколения, DMI и улучшенный блок управления энергопотреблением, отвечающий за работу Turbo Boost и некоторые другие процессы.

Sandy Bridge поддерживает технологию Turbo Boost второго поколения. Напомним, исторически принято считать временем появления Turbo Boost момент анонса процессоров Intel Core i7 девятисотой серии на базе Bloomfield, два года назад, но в них технология TB работала скорее на троттлинг, то есть не очень хорошо, а фактически, проявила себя в процессорах на базе Lynnfield только год спустя.

Предпосылкой для появления технологии Turbo Boost 1.0 в процессорах является тот факт, что в многоядерных чипах далеко не все имеющиеся ресурсы используются даже современными версиями приложений. Программы не слишком оптимизированные под многоядерность, такие как iTunes, например, могут использовать единовременно лишь одно ядро из множества доступных. Поскольку тепловой потолок чипа рассчитывается для ситуации наихудшего сценария, когда все ядра загружены под завязку, технология Turbo Boost может использовать возникающий "тепловой резерв". В таком случае, когда процессор исполняет однозадачное приложение, типа того же iTunes, для увеличения производительности активного ядра его частота увеличивается.

Turbo Boost первого поколения довольно умная технология – умеет поднимать частоту ядер, оперируя данными о температуре, токе, энергопотреблении чипа и состоянии операционной системы. Но она не сможет превысить заданный уровень энергопотребления, даже если остаётся изрядный тепловой резерв, чтобы разгонать ядра ещё сильнее.

На практике, процессор разгоревается не сразу же. Чтобы дойти из состояния покоя до ограничения теплового уровня, ему потребуется время. Технология Turbo Boost 2.0 позволяет чипу превышать заданный уровень энергопотребления до тех пор, пока не достигнут потолок температурного режима, после чего чип снижает энергопотребление для возвращения в запрограммированные пределы.

Но всё сказанное выше не означает, что процессор с Turbo Boost 2.0 будет превышать частоту ядер сверх указанной как максимальная для Turbo Boost. Если у вас, например, процессор Intel Core i7-2600K с базовой частотой 3.4ГГц и максимальной в режиме Turbo Boost 3.8 ГГц, то именно планка в 3.8 ГГц будет максимально достижимой в штатных условиях. Он просто будет оставаться на этой частоте дольше – до тех пор, пока процессор не превысит свой тепловой лимит, и только затем снизит частоту.

К сожалению, не так то просто оценить преимущества новой технологии. Лучшее что нам удалось выжать из Intel – это должно улучшать отзывчивость системы. В нашей калифорнийской лаборатории, на настольком компьютере, просто не удавалось почувствовать разницу, и как результат, Turbo Boost второго поколения показался нам больше рекламным шагом.

Справедливости ради, в ноутбуках, где базовые частоты намного ниже для экономии энергии, эта технология будет оказывать большее влияние, за счёт более высокой планки увеличения частоты. У нас есть ноутбук на базе Sandy Bridge в офисе и в этом месяце мы планируем выпустить его обзор.

Также, в сегменте мобильных решений, больше влияния на производительность будет оказывать возможность технологии Turbo Boost распределять термальный бюджет между графическим и процессорными ядрами. Чипы предыдущего поколения, на основе Arrandale, также умели это делать, применяя Turbo Boost к обеим компонентам. Процессоры с микроархитектурой Sandy Bridge позволяют делать то же самое на десктопных чипах. Intel отмечает, что в ресурсоёмких 3D-приложениях, блок контроля энергопотребления будет выделять больше ресурсов графическому ядру, так как именно его ускорение больше влияет на общую производительность, нежели разгон процессорных ядер.

Sandy Bridge | Quick Sync - секретное оружие

Вы когда-нибудь слышали, чтобы Intel застала AMD и nVidia врасплох на рынке графики? И всё же, движок Quick Sync оставался тайной, сокрытой в стенах Intel, вплоть до IDF 2010. Можете ли вы поверить, что впервые эта концепция появилась пять лет назад? В то время, первые Blu-ray приводы только начинали продаваться, знаменуя переход от видео низкого разрешения к контенту высокой чёткости (HD), а рынок мобильных систем рос быстрее сегмента настольных компьютеров.

В Intel поняли, что ПК был и остаётся единственной платформой для создания контента, и что неприемлемо, если редактирование видео отнимает все выходные. Именно тогда инженеры в Intel решили повысить производительность кодирования и декодирования в Sandy Bridge – решив, тем самым, проблемы создателей контента. Они создали конвейер обработки видео в формате выделенной логики с фиксированными функциями, которая служит двум целям - во-первых, обеспечивает достойную производительность, во-вторых, сохраняет энергопотребление на минимальном уровне.

Название Quick Sync логика с фиксированными функциями получила позднее. Это чисто маркетинговое название для функции ускорения кодирования и декодирования видео.

Наши постоянные читатели могут возразить, указав что AMD и nVidia уже ускоряют эти вещи при помощи CUDA и Stream (нынче именуемой APP). Это действительно так. Но обе компании используют общецелевое, в каком-то смысле стандартное, железо для увеличения производительности за пределы того, что может быть достигнуто чисто программным путём. И пока нам прививали привычку думать, что вычисления на общецелевом GPU и есть будущее, по крайней мере, альтернативное ограниченному параллелизму, реализуемому на центральном процессоре, мы забывали о том, что задачи о которых мы говорим здесь не могут исполняться также быстро или также эффективно (с точки зрения энергопотребления) в общецелевых блоках, если сравнивать их со специализированными.

Итак, в чём же суть? Мы знаем что видео – не важно, идёт ли речь о воспроизведении или о кодировании, по сути обыденная вещь. Выделение ядер процессора для этих целей их нагружает и требует большого количества энергии. Мы долгие годы наблюдали как много нужно для этого ресурсов в многочисленных обзорах процессоров, опубликованных на THG (достаточно вспомнить результаты замеров в MainConcept и HandBrake). Разработчикам программ приходилось колдовать над параллелизмом своих приложений, чтобы обработка видео в них происходила быстрее. А это означало больше загрузки, больше расходуемой энергии, больше выделяемого тепла, и так далее. Мы имеем ввиду, что обработка видео – один из самых ресурсоёмких сценариев тестирования, которым мы систематически нагружали новые процессоры.

Ответом Intel стало создание специального вычислительного блока в Sandy Bridge, который не занимается ничем другим, кроме видео. По словам доктора Хун Цзян, старшего инженера и главного медиа-архитектора Sandy Bridge, это решение было основано на концепции распространённости видео и связанных с его обработкой задач. Intel буквально поставила на то, что решить вопрос с обработкой видео важнее для большей части её клиентов, нежели потратить транзисторы на увеличение производительности в играх. Конечно, помогло и то, что работа с видео всегда была одним из козырей Intel. Инвестиции в Quick Sync идут гораздо дальше скромного выигрыша в 3D.

Sandy Bridge | Что делает Quick Sync?

QuickSync предназначен для двух основных задач: ускорения кодирования и декодирования видео.

Intel уже имеет достаточный опыт в области реализации ускорения декодирования видео. Существующие процессоры с интегрированной графикой могут справиться с воспроизведением MPEG-2, VC-1 и AVC. Однако, компенсация движения (наиболее сложная часть в конвейере декодирования) и фильтрация артефактов (loop filtering в VC-1 и AVC) происходит у них в блоках общего назначения, что "съедает" больше мощности, чем необходимо. В Sandy Bridge эта проблема решена перемещением всего конвейера декодирования в эффективный многоформатный кодек с фиксированными функциями. Добавлена и поддержка MVC для воспроизведения 3D Blu-ray. Масштабирование видео, подавление шумов, деинтерлейсинг (процесс создания одного кадра из двух полукадров чересстрочного формата для дальнейшего вывода на монитор), улучшение цвета оттенков кожи, управление цветопередачей, улучшение контрастности – за все эти функции отвечают специализированные блоки логики в графическом процессоре.

Для ускорения кодирования предусмотрена логика с фиксированными функциями, которая работает совместно с программируемыми исполнительными блоками. К исполнительным блокам (EU) прикреплён блок медиа-сэмплирования (Intel называет его сопроцессором), обеспечивающий работу алгоритма предсказания движения, дополняя программируемую логику. Задачи декодирования, решаемые в процессе перекодирования, проходят через тот же конвейер с фиксированными функциями, о котором уже шла речь, что приводит к росту производительности. Вы можете подавать на вход поток MPEG-2, VC-1 или AVC, и получать MPEG-2 или AVC на выходе.

Разработчики могут использовать Quick Sync по-разному, в зависимости от поставленных перед приложением задач. Возьмём в качестве примера CyberLink – их продукт PowerDVD 10 опирается только на ускорение конвейером декодирования видео. В отличие от него, приложение MediaEspresso использует больше возможностей – движок будет считывать файл, декодировать его, кодировать и превращать в выходной поток. Наконец, в приложении PowerDirector, предназначенном для видеомонтажа, новый конвейер будет полезен при пост-обработке, то есть при наложении эффектов и компоновке ещё до передачи потока на этап кодирования.

Sandy Bridge | Quick Sync против APP и CUDA

Мы использовали несколько приложений для воспроизведения контента (декодеров) и несколько приложений для конверсии (кодирования/перекодирования) видео для экспериментов.

Приложение CyberLink MediaEspresso может использовать все преимущества технологии AMD Stream (которая теперь называется APP) и nVidia CUDA API. По сравнению с компьютером без аппаратного ускорения, используя CUDA и APP можно получить заметный прирост производительности. Но Sandy Bridge, благодаря оптимизации MediaEspresso под Quick Sync, оказывается в совершенно другой весовой категории. Всего 22 секунды заняло преобразование почти 500 мегабайтного исходного видео в разрешение 1024x768 для проигрывания на планшете Apple iPad.

С MediaConverter 7 всё оказалась сложнее. Пререлизная версия была оптимизирована и под Quick Sync, и поддерживала ускорение с помощью AMD Stream, а вот видеокарту GeForce GTX 570 она не распознала. Тогда мы решили использовать текущую доступную демо-версию, но и в ней не смогли включить CUDA. Однако, полученные результаты показывают, что ускорение действительно включено. У приложения Arcsoft есть дополнительное преимущество в виде индикатора используемых ресурсов.

Полученные результаты очень интересны. Без ускорения, кодирование видео с профилем для Apple iPad прошло за 1:35, при этом загрузка процессора Core i7-2600K составила около 30%. После установки видеокарты nVidia, нагрузка выросла до 50%, но задача была выполнена почти на 20 секунд быстрее. С видеокартой Radeon HD 6870 нагрузка снизилась а производительность возрасла. Но включение оптимизации под Quick Sync впечатляет больше всего: задача была выполнена за 41 секунду, а ядра процессора почти не нагружались.

К сожалению, чтобы в полной мере ощутить преимущество от технологии Quick Sync, вам придётся использовать интегрированное графическое ядро Intel. Ни MediaEspresso, ни MediaConverter не могут определить наличие конвейера Intel после установки в компьютер дискретной видеокарты. Если вы работаете с контентом на игровом компьютере, Quick Sync вам не поможет.

Sandy Bridge | Воспроизведение Blu-ray и функционирование видео

После того, как мы обсудили оптимизацию кодирования и перекодирования (сжатия) видео, давайте разберемся с декодированием (просмотром) и постараемся оценить, какие усилия Arcsoft и CyberLink приложили к поддержке технологии Quick Sync.


Нагрузка менее 10% на мобильном CPU.

Оказалось, что конвейер декодирования Sandy Bridge настолько полный, что даже декодирование AACS перенесено в блок с фиксированными функциями. Алгоритм AACS использует шифрование AES, которое может ускорить большинство процессоров на базе Sandy Bridge.

В идеальном сценарии, по утверждению представителей Arcsoft, когда закодированный поток Dolby TrueHD или DTS-HD Master Audio передаётся на внешний ресивер по HDMI 1.3 или 1.4 (процессор не занимается декодированием звука), загрузка процессора при воспроизведении Blu-ray будет нулевой.


Передача звука DTS HD Master Audio на внешний ресивер.

Мы использовали CyberLink PowerDVD 10 с передачей потокового звука на внешний ресивер и не получили столь ошеломляющих результатов. Однако, на ноутбуке с процессором Core i7-2820Q, при просмотре фильма "Квант милосердия/Quantum of Solace", закодированным в AVC, нагрузка на процессор держалась на уровне 10%.

Sandy Bridge | HD Graphics для настольного ПК - Intel подтягивается

В предварительных обзорах графического ядра Sandy Bridge некоторые журналисты предполагали, что у Intel получится решение, способное заменить в играх дискретные видеокарты начального уровня. И конечно, цитаты из этих публикаций пресс-служба Intel вставила в материалы для продавцов, которые журналисты обычно не видят. Те кто ожидал от Sandy Bridge производительности десктопной видеокарты будут разочарованы по нескольким причинам.

Один гигантский шаг… для Intel

Давайте начнём с самого начала – с примеров графических ядер предыдущего поколения. Как известно, процессоры на основе Clarkdale, представленные год назад, стали первыми, продемонстрировавшими производственное лидерство Intel. Например, сами двухядерные процессоры изготавливались по технологии 32 нм, но в них же Intel использовал 45-нм литографию для второго кристалла в упаковке, содержащего контроллер памяти, контроллер PCI Express и графический движок Ironlake.

Это был очень серьезный шаг к интеграции ещё большего функционала на CPU, но решение не было идеальным. Да, графическая производительность оказалась выше, чем у интегрированных в чипсет ядер предыдущих поколений, но производительность памяти упала по сравнению с Lynnfield и Bloomfield, поскольку контроллер памяти был убран с кристалла.

В Sandy Bridge вся эта логика была "склеена" вместе, что дало Intel возможность более эффективно контролировать её работу. Например, графическое ядро теперь получило доступ к кэшу последнего уровня, и у архитектуры появился механизм, предотвращающий задержки между ядрами и графическим движком. Как уже говорилось, при больших 3D-нагрузках блок управления потребляемой мощностью выделяет графическому ядру больший тепловой бюджет для работы на частотах до 1350 МГц.

Номенклатура, которую использует Intel, аналогична предыдущему поколению. Движок HD Graphics по-прежнему использует 12 скалярных исполнительных блоков (EU) и совместим с DirectX 10.1. Но есть несколько архитектурных улучшений, таких как более крупные регистры, интеграция mathbox и поддержка новых инструкций, которые должны удвоить пропускную способность инструкций по сравнению с GPU Ironlake у Clarkdale. Добавьте к этому серьёзный прирост тактовых частот, и вы получите потенциал для значительного повышения производительности.

История про два GPU

Теперь перейдем к плохим новостям. Есть две версии графического ядра с похожими названиями HD Graphics 3000 (GT2) и HD Graphics 2000 (GT1). У первого – 12 исполнительных блоков, у второго их всего шесть.

Все 15 мобильных процессоров на базе Sandy Bridge используют HD Graphics 3000. Некоторые работают на частоте 1300 МГц, другие – 1100 МГц, и еще два – 950 МГц. Окончательные спецификации, во многом, зависят от теплового пакета TDP.

Настольные ПК – это совсем другая история. Из 14 новых процессоров на базе Sandy Bridge только два оснащаются графическим ядром HD Graphics 3000. Самое смешное, что два этих чипа относятся к линейке K – только голову дадим на отсечение, энтузиасты вряд ли воспользуются встроенными графическими ядрами для выполнения 3D-задач. Остальные 12 моделей – как раз те, которые будут использоваться в массовых компьютерах в домах и офисах – получили HD Graphics 2000. Владельцы этих процессоров оценили бы экономию $50 за отказ от дискретной видеокарты. И они как раз получат урезанную версию графического ядра.

Энтузиасты, готовые заплатить на $20 больше за чип из линейки K, покупают дискретные видеокарты. Последний гвоздь в гроб мы забьём буквально через пару абзацев, когда вы узнаете, что чипсет H67, нужный для использования встроенной графики, не поддерживает разгон процессора. Нет никаких причин для комбинации K-процессора c чипсетом H67.

Есть большая вероятность того, что оценка результатов тестов Sandy Bridge в ноутбуках будет существенно отличаться, их ЖК-дисплеи, работающие в меньшем "родном" разрешении, хорошо дополняют более мощный движок HD Graphics 3000. Но ещё до анализа производительности десктопных решений можно сказать, что Intel упустила хорошую возможность проявить себя здесь.

Это просто игра чисел

Начнём тесты с игры, которая вполне соответствует графическому ядру процессоров Intel: World of Warcraft: Cataclysm. Мы использовали тестовый перелёт от Crushblow до Krazzworks в Twilight Highlands.

Графический движок HD Graphics 3000 очень хорош по сравнению с AMD Radeon HD 4550 512 MB – эта видеокарта стоит около $25. Ядро HD Graphics 2000 не выглядит столь же впечатляющим, даже на предпоследнем минимальном уровне качества картинки. Оно оказалось быстрее Clarkdale, в котором в два раза больше исполнительных ядер, что уже говорит кое о чём. Но всё же настольные процессоры Sandy Bridge вряд ли подходят для игр.

Для сравнения мы установили в тестовый стенд видеокарту Radeon HD 5550 с 1 Гбайт памяти DDR3 стоимостью около $55. Она обеспечивает более чем двукратный прирост производительности по сравнению с HD Graphics 3000, поэтому стоит её приобрести, если вы хотите поднять уровень детализации или запустить игру в разрешении 1920x1080.

Никто никогда не утверждал, что интегрированная графика способна достойно справиться с шутерами от первого лица, но CoD отличается невысокими требованиями к графике, поэтому мы дали шанс этому шутеру.

Еще раз надо признать, что HD Graphics 3000 достойно сражается с дискретной видеокартой самого начального уровня. Но HD Graphics 2000 хороша только для того, чтобы обойти графический движок Clarkdale Ironlake. Для сравнения, вполне доступная видеокарта Radeon HD 5550 даёт вполне приемлемую производительность в разрешении 1680x1050.


Результаты этих двух тестов можно было предсказать заранее: графическое ядро HD Graphics 3000 неплохо выглядит по сравнению с дискретной видеокартой AMD самого начального уровня, но если вы не рассчитываете тратиться на процессор линейки К и использовать его интегрированное ядро, обратите внимание на результаты HD Graphics 2000. Они чуть лучше, чем у графического ядра Clarkdale (которое, кстати, даже не смогло полностью выполнить тест игры Left 4 Dead 2).

В итоге - в сфере настольных ПК интегрированная графика сохраняет свой статус-кво. Её возможностей хватает для выполнения элементарных задач, но для игр она слишком слаба. Ничего не поделаешь.

Sandy Bridge | Две новые платформы, впереди - следующие

Процессоры Sandy Bridge несовместимы с чипсетами Intel пятой серии. В этом нет проблем, поскольку вам всё равно придётся покупать новую материнскую плату из-за того, что LGA 1156 уходит в прошлое. Но для массового рынка ещё один апгрейд платформы пережить будет сложно, особенно для тех пользователей, у кого просто нет денег, чтобы тратиться на то, когда технологии будущего становятся настоящим днем.

В момент выхода процессоров Sandy Bridge есть два чипсета для настольных ПК, на которых эти процессоры можно использовать: P67 и H67. Первый предназначен для использования в паре с дискретными видеокартами. Кроме того, только P67 поддерживает распределение 16 линий контроллера PCIe среди нескольких видеокарт. Поэтому, Р67 подойдёт для энтузиастов. Второй чипсет H67 – единственный выбор для тех, кто хочет использовать преимущества интегрированного графического ядра Sandy Bridge.

Вас беспокоит производительность P67 с несколькими установленными видеокартами? Напрасно. Мы уже показывали в нашей статье, как вы можете получить производительность, близкую к Intel X58 от материнской платы P55, оснащённой мостом Nvidia NF200, причём даже с тройкой видеокарт Radeon HD 5870.

Оба чипсета поддерживают целых 14 портов USB 2.0, ни один при этом не поддерживает USB 3.0. Ещё они поддерживают до шести портов SATA, два из которых могут работать со скоростью передачи 6 Гбит/с (четыре других ограничены скоростью 3 Гбит/с). Ни один из чипсетов не поддерживает старую шину PCI.

Оба чипсета перешли на сигнальную скорость 5 GT/s, что обеспечивает поток на линию до 500 Мбайт/с в любом направлении. P67 и H67 содержат восемь линий, как и чипсеты P55/H57. Хорошо было бы добавить дополнительные контроллеры USB 3.0 и SATA 6 Гбит/с, но в спецификациях Intel всё ещё указано, что интерфейс DMI поддерживает 1 Гбайт/с в любом направлении, что может потенциально привести к перегрузкам.

Сравнение чипсетов
H67 Express P67 Express P55 Express
Интерфейс сокета LGA 1155 LGA 1155 LGA 1156
Каналы памяти/DIMM на канал 2/2 2/2 2/2
USB 2.0 14 14 14
Всего портов SATA (из них 6 Гбит/с) 6 (2) 6 (2) 6 (0)
Число линий PCIe 8 (5 GT/s) 8 (5 GT/s) 8 (2.5 GT/s)
Поддержка слотов PCI Нет Нет 4
Независимые выходы на дисплей 2 0 0
Защищённый путь аудио/видео Да Нет Нет
Технология Rapid Storage Да Да Да
Разгон Только графическое ядро Только множитель процессора Множитель процессора/ BCLK

Чипсет Intel H67 – единственный, который может использовать графическое ядро Sandy Bridge, поэтому он отличается соответствующими функциями. Его PCH поддерживает два независимых выхода на дисплей. Кроме того, он обеспечивает защиту пути прохождения аудио/видео – необходимая функция для воспроизведения Blu-ray и передачи звука высокого разрешения в закодированном виде на внешний ресивер. Наконец, H67 позволяет вручную разгонять интегрированное графическое ядро.

Какие ограничения есть у H67? H67 не поддерживает разгон процессора. Если вы заплатили чуть больше за модель из линейки K, чтобы получить более скоростной графический движок, то будете ограничены частотным потолком Turbo Boost. Чипсет H67 также заблокирован по ограничениям памяти и энергопотребления Sandy Bridge. Чтобы снять блокировку по ядру, энергопотреблению и памяти, вам необходимо использовать P67.

В 2011 году Intel выпустит чипсет под названием Z68, который позволит выполнять разгон и вычислительных ядер, и графического ядра на одной плате. Его не следует путать с X78 – следующим флагманом Intel на замену X58.

Разгон - Sandy Bridge меняет правила игры

Как мы уже писали, в Sandy Bridge существенно изменён подход к разгону. Получить на нём выигрыш от хорошо масштабируемой архитектуры, как это удавалось с Nehalem, нельзя, но некоторые варианты существуют.

Суть проблемы хорошо известна. Чтобы упростить дизайн (что действительно имеет смысл с инженерной точки зрения), Intel интегрировала тактовый генератор в чипсеты 6-й серии. Теперь одна частота влияет на параметры всей системы, то есть вы не сможете независимо выставлять частоты разных подсистем, таких как PCI Express и DMI.

К сожалению, шина PCI Express неохотно работает за пределами своих спецификаций, так что любое значительное отклонение за уровень 100 МГц по частоте BCLK приводит к проблемам. Конечно, несколько процентов выжать можно, но прошли те дни, когда 133-МГц частоту BCLK у процессоров Nehalem можно было повышать до уровня 200 МГц и выше. Оверклокеры потеряли одну из двух переменных, которые ранее влияли на производительность процессора. Однако Intel всё же старается работать в этом направлении.

Во-первых, в мае 2010 года года была выпущена линейка процессоров Intel Core серии K с разблокированным множителем. У них максимальный множитель составляет 57x, то есть можно получать частоты до 5,7 ГГц, не затрагивая BCLK. Intel утверждает, что множитель 57x выбран по "соображениям дизайна", что бы это ни значило. Хорошая новость для хардкорных оверклокеров заключается в том, что компания работает над BIOS, который позволит получать более высокий множитель – и это будет верно для уже вышедших CPU. Кроме того, у чипов линейки K "разблокирован" множитель памяти DDR3, который на самом деле не разблокирован, но позволяет выставлять частоту памяти до DDR3-2133 (это выше, чем могут обеспечить большинство нынешних комплектов памяти). Ограничения по энергопотреблению и току тоже можно настраивать.

В случае с Sandy Bridge пока выпущено только два процессора из линейки K: Core i7-2600K и Core i5-2500K. Разблокированный i7 стоит на $23 дороже частично заблокированной версии того же чипа, а i5 обойдётся на $11 дороже менее гибкого варианта. Если учесть, что по умолчанию Core i5-2500K работает на частоте 3,3 ГГц, а Turbo Boost увеличивает частоту до 3,8 ГГц, по сравнению с Core i5-760 на 2,8 ГГц, то разблокированный чип Sandy Bridge за дополнительные $11 кажется очень привлекательным.

Если вы не купите чип из линейки K, а выберите модель Core i7-2600, Core i5-2500, 2400 или 2300 (вместе с материнской платой P67), то получите доступ к "ограниченному разгону". Это означает, что вы сможете выставлять тактовую частоту вплоть до четырёх ступенек выше максимальной тактовой частоты Turbo Boost при любом уровне загрузки процессора.

Возьмём в качестве примера Core i7-2600. Базовая частота чипа составляет 3,3 ГГц. Когда активны четыре ядра, то частота увеличивается на одну ступеньку – до 3,4 ГГц. Четыре ступеньки выше – это частота 3,8 ГГц. Когда активны два ядра, то технология Turbo Boost повышает производительность на две ступеньки – до 3,5 ГГц. В таком случае ограниченный разгон составит 3,9 ГГц. В оптимальной ситуации активно только одно ядро. Turbo Boost увеличит частоту на четыре ступеньки, что даст 3,7 ГГц, а схема разгона Intel позволяет выжать частоту до 4,1 ГГц.

Любой процессор из линейки K даст вам возможности для приличного уровня разгона даже при воздушном охлаждении. В двух лабораториях Tom’s Hardware мы смогли разогнать процессоры Core i7-2600K до частоты 4,7 ГГц при напряжении 1,35 В – и они стабильно проработали под нагрузкой весь день. Модели i5 и i7 для массового рынка позволяют выжать дополнительные 400 МГц из своих чипов. Однако покупатели процессоров по цене от $100 и $150 (где AMD предлагает свои наиболее привлекательные решения) могут считать себя проигравшими. Единственные два чипа Sandy Bridge дешевле $175 – это Core i3-2100 и i3-2120 с тактовой частотой 3,1 и 3,3 ГГц, соответственно. У них нет Turbo Boost, нет возможности менять BCLK, нет "ограниченного" разгона – то есть данные чипы буквально заблокированы.

Как и в случае с интегрированной графикой, наши калифорнийские коллеги по Tom's Hardware считают, в связи со всем сказанным выше, что Intel упустила поезд, пытаясь использовать оверклокинг как способ дифференцировать процессоры. Камрады, сумевшие преодолеть барьер в 7 ГГц, в нашем недавнем оверклокерском совревновании на западном THG, упёрлись в искусственный порог. Пользователям, покупающим процессоры нижнего сегмента массового рынка, не дана возможность менять настройки BCLK или множителя. Пока вы не приобрели один из двух процессоров линейки K, вам придётся довольствоваться Turbo Boost и потолком добавления частоты в 400 МГц.

Надеемся, компания AMD внимательно следит за ситуацией. Большинство новейших 45-нм процессоров компании не дают существенный потенциал по разгону, но переход на 32-нм техпроцесс, чуть позже в этом году, должен привести к тому, что более гибкие процессоры Bulldozer будут весьма привлекательны для всех пользователей-оверклокеров, которые считают, что Intel ограничивает их возможности как в сегменте low-end, так и high-end.

Sandy Bridge | Встречаем процессоры Intel Core второго поколения

Новые названия

В день официального запуска Sandy Bridge компания Intel объявила о 14 новых настольных процессорах (кроме того, вышли 15 мобильных моделей). Торговые марки Core i3, i5 и i7 сохранились, соответствуя процессорам начального уровня, массового рынка и сегмента энтузиастов. Однако числа-модификаторы изменились. Да и Intel стала более активно использовать суффиксы в конце названий моделей.

i7-2600K i7-2600 i5-2500K i5-2500 i5-2400 i5-2300 i3-2120 i3-2100
Цена $317 $294 $216 $205 $184 $177 $138 $117
Тепловой пакет 95 Вт 95 Вт 95 Вт 95 Вт 95 Вт 95 Вт 65 Вт 65 Вт
Ядра/потоки 4/8 4/8 4/4 4/4 4/4 4/4 2/4 2/4
Базовая частота 3,4 ГГц 3,4 ГГц 3,3 ГГц 3,3 ГГц 3,1 ГГц 2,8 ГГц 3,3 ГГц 3,1 ГГц
Макс. частота Turbo 3,8 ГГц 3,8 ГГц 3,7 ГГц 3,7 ГГц 3,4 ГГц 3,1 ГГц Н/Д Н/Д
Память (MT/s) 1333 1333 1333 1333 1333 1333 1333 1333
Кэш L3 8 Мбайт 8 Мбайт 6 Мбайт 6 Мбайт 6 Мбайт 6 Мбайт 3 Мбайт 3 Мбайт
HD Graphics 3000 2000 3000 2000 2000 2000 2000 2000
Макс. частота графического ядра 1350 МГц 1350 МГц 1100 МГц 1100 МГц 1100 МГц 1100 МГц 1100 МГц 1100 МГц
Hyper-Threading Да Да Нет Нет Нет Нет Да Да
Поддержка AVX Да Да Да Да Да Да Да Да
Поддержка Quick Sync Да Да Да Да Да Да Да Да
Поддержка AES-NI Да Да Да Да Да Да Нет Нет
Интерфейс LGA 1155 LGA 1155 LGA 1155 LGA 1155 LGA 1155 LGA 1155 LGA 1155 LGA 1155

В названии новых моделей везде присутствует двойка. Это означает второе поколение процессоров Intel Core, и, самое забавное, перед нами единственный компонент в названии, который что-то означает на самом деле. Три цифры, которые идут следом, указывают на относительную производительность – к этому вы должны уже привыкнуть, начиная с эпохи Nehalem. Intel использует для дифференциации процессоров тактовую частоту, размер кэша L3, поддержку Hyper-Threading и Turbo Boost. Вполне логично предположить, что процессор -2600 будет быстрее -2500 и так далее.

Номера некоторых моделей содержат только четыре цифры. Другие заканчиваются суффиксом K, S или T. Мы уже знаем, что в процессорах Core i7-875K и Core i5-655K суффикс "K" означает разблокированный множитель. Intel представила два процессора серии "K" – Core i7-2600K и Core i5-2500K, оба из которых стоят дороже версий "не-K". Если вы энтузиаст, занимающийся разгоном, то процессоры "K" явно оправдывают прибавку к стоимости.

С линейкой "S" тоже всё понятно. Мы уже видели, как Intel "играет" с суффиксом "S" в прошлом, снижая производительность Core i5-750S, чтобы уместиться в пределах теплового пакета 82 Вт, и вместе с тем повышая цену. До объявления новых процессоров компания не объявила цены на модели линейки "S", утверждая, что эти процессоры будут ориентированы только на канал, то есть в рознице мы их не увидим. Эти процессоры обладают меньшим тепловым пакетом 65 Вт, но достигают тех же максимальных уровней Turbo Boost, если есть потенциал по увеличению температуры.

Новый суффикс "T" относится к экономичным настольным процессорам с тепловым пакетом 35 и 45 Вт, которые работают на пониженном напряжении и базовой тактовой частоте, чтобы сохранять более агрессивный температурный профиль. Единственная модель с новым суффиксом – это Intel Core i5-2390T, которая не использует четыре ядра, как можно было бы подумать из наличия в названии i5, но оснащена двумя ядрами с поддержкой Hyper-Threading. Почему эту модель не назвали просто Core i3 - непонятно.

Новый интерфейс

Эта новость наверняка огорчит всех тех, кто потратил тринадцатую зарплату на новую платформу Lynnfield или Clarkdale. Sandy Bridge использует новый интерфейс процессора под названием LGA 1155. Да, у него всего на один контакт меньше, чем у существующего интерфейса LGA 1156, что приводит к несовместимости с сокетом, которому исполнился всего один год. Интерфейсы практически идентичны, а вот ключи у процессоров выставлены иным образом, чтобы вы не смогли вставить в новую платформу процессор Lynnfield или Clarkdale – Intel Core предыдущего поколения.


LGA 1156 (слева) и LGA 1155 (справа). Раскладка контактов различается.

По утверждению Intel, переход на LGA 1155 был естественным. Приход Sandy Bridge пронизан идеей интеграции. На кристалл процессора пришли те компоненты, которых раньше там не было. В результате даже контакты пришлось переставить. Представители Intel утверждают, что если бы можно было сделать процессоры Sandy Bridgee совместимыми с LGA 1156, то так бы и было сделано – поскольку компания не зарабатывает на смене интерфейсов (это верно лишь частично, поскольку Intel продаёт чипсеты для новых материнских плат).

Прежде чем клеймить Intel за это, вспомните, что AMD столкнётся с теми же проблемами с процессором Zambezi на основе Bulldozer, который выйдет позже в 2011 году. Компания шла на рекорд и сообщила о том, что могла бы сделать процессор следующего поколения совместимым с AM3, немного подрезав в нём архитектурные возможности. Но вместо этого мы получили переход на Socket AM3+, который позволил полностью реализовать все архитектурные планы.

В итоге: LGA 1155 нарушает совместимость с существующей инфраструктурой, делая апгрейд платформы необходимым. К сожалению, чипсеты P67/H67 не дают дополнительных функций, которых не было бы на high-end материнских платах P55.

Конфигурацию тестового стенда можно посмотреть в таблице ниже.

Аппаратное обеспечение
Процессоры Intel Core i7-2600K (Sandy Bridge) 3,4 ГГц (34 * 100 МГц), LGA 1155, 8 Мбайт общего кэша L3, Hyper-Threading активна, Turbo Boost активна, функции энергосбережения включены
Intel Core i5-2500K (Sandy Bridge) 3,3 ГГц (33 * 100 МГц), LGA 1155, 6 Мбайт общего кэша L3, Turbo Boost активна, функции энергосбережения включены
Intel Core i5-2400 (Sandy Bridge) 3,1 ГГц (31 * 100 МГц), LGA 1155, 6 Мбайт общего кэша L3, Turbo Boost активна, функции энергосбережения включены
Intel Core i3-2100 (Sandy Bridge) 3,1 ГГц (34 * 100 МГц), LGA 1155, 3 Мбайт общего кэша L3, Hyper-Threading активна, функции энергосбережения включены
Intel Core i7-875K (Lynnfield) 2,93 ГГц (22 * 133 МГц), LGA 1156, 8 Мбайт общего кэша L3, Hyper-Threading активна, Turbo Boost актива, функции энергосбережения включены
Intel Core i5-655K (Clarkdale) 3,2 ГГц (24 * 133 МГц), LGA 1156, 4 Мбайт общего кэша L3, Hyper-Threading активна, Turbo Boost активна, функции энергосбережения включены
Intel Core i7-950 (Bloomfield) 3,06 ГГц (23 * 133 МГц), LGA 1366, 8 Мбайт общего кэша L3, Hyper-Threading активна, Turbo Boost активна, функции энергосбережения включены
Intel Core 2 Quad Q9550 (Yorkfield) 2,83 ГГц (8,5 * 333 МГц), LGA 775, 12 Мбайт кэша L2, функции энергосбережения включены
AMD Phenom II X6 1100T (Thuban) 3,3 ГГц (16,5 * 200 МГц), Socket AM3, 6 Мбайт общего кэша L3, Turbo CORE активна, функции энергосбережения включены
AMD Phenom II X4 970 (Deneb) 3,5 ГГц (17,5 * 200 МГц), Socket AM3, 6 Мбайт общего кэша L3, функции энергосбережения включены
Материнские платы Gigabyte P67A-UD7 (LGA 1155) Intel P67 Express, BIOS F6a
Gigabyte H67MA-UD2 (LGA 1155) Intel H67 Express, BIOS F6a
Gigabyte P55A-UD7 (LGA 1156) Intel P55 Express, BIOS F8b
Gigabyte X58A-UD7 (LGA 1366) Intel X58 Express/ICH10R, BIOS FC
Gigabyte 890FXA-UD5 (Socket AM3) AMD 890FX/DB850, BIOS F6
Intel DX48BT2 (LGA 775) Intel X48 Express/ICH10R, BIOS 2006
Asus P7H57D-V EVO (LGA 1156) Intel H57 Express, BIOS 1606
Память Kingston 8 Гбайт (4 x 2 Гбайт) DDR3-2133, KHX2133C9AD3W1K2/4GX x 2 @ DDR3-1333, 7-7-7-20 и 1,65 В
Crucial 12 Гбайт (3 x 4 Гбайт) DDR3-1333, MT16JTF51264AZ-1G4D1 @ DDR3-1333, 7-7-7-20 и 1,65 В
Накопители OCZ RevoDrive X2 240 Гбайт PCI Express x4 (основная тестовая платформа)
Intel SSDSA2M160G2GC 160 Гбайт SATA 3 Гбит/с (тестовая платформа для графического ядра /Quick Sync)
Видеокарты nVidia GeForce GTX 580 1.5 GB
AMD Radeon HD 5550 1 GB DDR3
AMD Radeon HD 4550 512 MB DDR3
Блок питания Cooler Master UCP-1000 W

Системное ПО и драйверы
Операционная система Windows 7 Ultimate 64-bit
DirectX DirectX 11
Графический драйвер nVidia GeForce Release 263.09 (для GTX 580)
Intel GFX_Vista64_Win7_64_8.15.10.2266_PV (для Sandy Bridge и Clarkdale)
AMD Catalyst 10.12 (для Radeon HD 6870 1 GB)

Это тестовая конфигурация, которая использовалась целиком далеко не всегда.

Все 10 процессоров представлены в большинстве тестов. Но для тестов игр начального уровня использовались материнские платы на базе чипсетов H67 и H57 с процессорами Core i7-2600K и Core i5-661 CPU. Для платформы H67 мы взяли две дискретные видеокарты AMD для сравнения производительности с интегрированными на кристалл и на упаковку графическими ядрами Intel.

Мы выбрали видеокарты Radeon HD 6870 с 1 Гбайт памяти и GeForce GTX 570 1.25 Гбайт в качестве лучших для данного сценария представителей технологии GPGPU, чтобы сравнить их возможности с Quick Sync. Эта платформа состояла из материнской платы Gigabyte с чипсетом H67 и процессором Core i7-2600K.

Накопитель OCZ RevoDrive X2 на 240 Гбайт использовался только в основной тестовой платформе, при этом мы решили взять SSD Intel для платформы, которая отдельно использовалась для тестов игр/Quick Sync.

Sandy Bridge | Результаты тестов

PCMark Vantage

Три процессора с дизайном Sandy Bridge находятся в лидерах по производительности, за ними следует процессор Core i7-875K, который выигрывает из-за реализации Turbo Boost до 3,6 ГГц.

Хотя Core i7-950 работает с более высокой базовой частотой и обеспечивает преимущества трёхканального контроллера памяти DDR3, самая высокая официальная частота работы с памятью составляет 1066 MT/s (по сравнению с 1333 MT/s у Lynnfield). Не способствует скорости и то, что процессор из линейки 900 может ускоряться технологией Turbo Boost только до 3,33 ГГц.

Недостаток ПО, которое может нагрузить все шесть ядер, а также меньшая базовая частота снижают позиции AMD Phenom II X6 1100T в целом. Вы можете видеть это в некоторых тестах (например, TV and Movies и Communications), как шестиядерный процессор улучшает свою производительность. Между тем Phenom II X4 970 выходит вперёд из-за своей более высокой фиксированной частоты 3,5 ГГц.

Уже не в первый раз мы отмечаем, что если бы Phenom II вышел в эпоху Core 2, то позиции процессора были бы очень прочными. Но с архитектурой Nehalem он конкурировать не может. Сравнивая с Sandy Bridge - он отстаёт. Но опять же, PC Mark Vantage – тест синтетический, поэтому давайте посмотрим, какую производительность мы получим под теми или иными специфическими нагрузками и не изменится ли наше впечатление.







3DMark11

Недавняя добавка к нашему тестовому пакету - тест 3DMark11 – это оценка производительности в играх, что видно по отдельному тесту Graphics, где мы видим очень близкие результаты конфигураций с нашей эталонной видеокартой GeForce GTX 580.

Впрочем, несколько компонентов тестового пакета опираются на физику, просчитывающуюся с помощью центрального процессора – мы имеем в виду библиотеку Bullet. В итоге в общем тестовом прогоне Performance мы наблюдаем больший разброс результатов. Но даже здесь сложно назвать победителей, поскольку разница в результатах 10 разных конфигураций не превышает 1000 баллов.

Тест Physics отдаёт предпочтение высокочастотным четырёхъядерным чипам на архитектурах Sandy Bridge и Nehalem. Больший потенциал по увеличению частоты Turbo Boost вывел в лидеры процессоры Core i7-2600K и Core i7-875K на первое и второе места, соответственно, за ними следует четырёхъядерный Core i5-2500K (масштабирование до восьми потоков здесь, похоже, роли не играет).

Двуядерные процессоры проигрывают – даже с технологией Hyper-Threading. Core i3-2100 и Core i5-655K серьёзно уступают старому доброму Core 2 Quad Q9550.




SiSoftware Sandra 2011

Как мы и предполагали, процессоры Intel показали очень хорошую производительность в операциях с целыми числами, а процессоры AMD прекрасно справлялись с математическими вычислениями с плавающей запятой. Аналогичные результаты были показаны и в обоих тестах Arithmetic и Multimedia.




Тест Cryptography традиционно любит процессоры Intel с поддержкой инструкций AES-NI. Стоит отметить, что полоса пропускания хэширования AES действительно выше у Sandy Bridge, чем была у Clarkdale. Об этом было объявлено ещё в сентябре на IDF 2010 в Сан-Франциско, и компания свои обещания выполнила. Надо помнить и о том, что у процессоров Core i3 второго поколения - также, как и у первого, кстати – отключена поддержка инструкций AES-NI. Именно поэтому Core i3-2100 попадает в аутсайдеры.

Улучшился и двухканальный контроллер памяти Intel, перейдя на пропускную способность до 1 Гбайт/с, используя те же модули памяти и при тех же задержках, что и у Lynnfield. Core i5-655K на базе Clarkdale естественно более медленный, поскольку контроллер памяти вынесен с кристалла CPU на другой кристалл. Core 2 Quad остаётся позади, представляя в тесте умирающее поколение платформ с контроллером памяти в чипсете.

Создание контента

Для профессионального создания контента используются приложения, оптимизированные под все доступные процессорные ядра, какие только есть в системе. У AMD Phenom II X6 1100T 3ds Max 2010 может задействовать все шесть вычислительных ядер. Но процессор Intel Core i7-2600K всё равно лидирует. Правда процессор Intel стоит $320, а чип AMD - $270. AMD занимает вполне приличную позицию…

… но только до тех пор, пока мы не посмотрим на Intel Core i5-2500K, который идёт следом сразу за флагманом AMD, но при этом обладает разблокированным множителем и тепловым пакетом 95 Вт – по цене дешевле $220. Этот процессор побеждает даже Intel Core i7-875K – процессор с технологией Hyper-Threading, которая сегодня стоит на $100 дороже.

Все остальные процессоры отстают. Интересно, что Core i5-2400 и Core i7-950 идут буквально голова к голове. Процессор за $184 конкурирует с чипом за $300.

Процессор Core i5-2500K даёт в работе с Photoshop практически такую же производительность, что и i5-2600K, причём оба обходят Core i7-875K.

Удивителяетесь, что процессор Core i7-950 на базе Bloomfield попадает в середину линейки - перед шестиядерным флагманом AMD? Как же этот процессор смог обойти 3,5-ГГц Phenom II X4 970? Либо включилась технология Turbo CORE, позволяющая разогнать AMD Phenom II X6 1100T до частоты 3,7 ГГц, либо Photoshop действительно может нагрузить все шесть ядер.

По крайней мере, мы знаем, что приложение может использовать больше двух ядер – оба двуядерных процессора Intel остаются в аутсайдерах, а Core i3-2100 - на последнем месте.

Мы использовали ролик Paladin для измерения производительности кодирования графики. Premiere Pro CS5 официально не поддерживает ускорение CUDA на видеокарте GeForce GTX 580 без небольшого программного "хака". Иначе движок Mercury Playback Engine будет нагружать процессор.

Более 40 минут времени рендеринга разделяют первое и последнее место в этом тесте. Мы опять видим, что процессор Core i7-2600K занимает верхнюю строчку – вероятно, это результат хорошей поддержки параллелизма, поскольку процессоры с восемью логическими потоками находятся на первом, втором и третьем местах. За ними идут два четырёхъядерных чипа Sandy Bridge, а за ними – AMD Phenom II X6 1100T.

Вывод очевиден. Во-первых, если вы делаете тяжёлую работу в Premiere Pro, включите поддержку CUDA. Мы уже наблюдали, как этот тест выполняется быстрее двух минут на видеокарте GeForce среднего уровня. Во-вторых, если вы проигнорировали этот совет, то по крайней мере, используйте как можно более производительный процессор - приложение сможет использовать все его ресурсы.

Наш тест After Effects не такой требовательный, как Premiere Pro. Не удивительно, что трио процессоров Sandy Bridge заняло три первых места, за ними следуют модели Lynnfield и Bloomfield.

Шесть ядер AMD Phenom II X6 1100T позволили этому процессору обойти Phenom II X4 970, несмотря на более высокую тактовую частоту у последнего. И оба чипа AMD обгоняют старый добрый Core 2 Quad Q9550, а также двуядерные модели Intel.

Следуя пожеланиям читателей, мы добавили тест Blender в наш пакет, который выполнял рендеринг изображений.

Начиная снизу: оба двуядерных процессора демонстрируют слабую производительность, несмотря на то, что Hyper-Threading позволяет одновременно выполнять четыре потока. Ничего не поделаешь - двуядерные процессоры плохо подходят для создания контента.

На следующей ступеньке процессор Core 2 Quad, который отстал на два поколения и самые быстрые четырёх- и шестиядерные процессоры AMD. Правда, AMD Phenom II X6 1100T всего на шесть секунд медленнее Intel Core i5-2400.

И все же AMD Phenom II X6 1100T стоит $265, а Intel просит $184 за свой четырёхъядерный процессор.

Хотя тест OpenGL проводился с видеокартой GeForce GTX 580 на всех платформах, его результаты очень интересны. Более важен рейтинг процессоров, в котором Core i7-2600K стоит на первом месте, за ним следует AMD Phenom II X6 1100T.

Sandy Bridge | Результаты тестов. Продолжение

Производительность

ABBYY FineReader 10 – это приложение для автоматического распознавания символов, связанный с ним тест появился по просьбам читателей. Мы запустили автоматическое распознавание 111-страничного документа, поскольку эту задачу можно хорошо распараллелить.

Здесь два лидера – четырёхъядерные процессоры с поддержкой Hyper-Threading, на третьем месте - шестиядерный чип AMD. Четвёртое место занял Core i7-950 (Bloomfield), который тоже поддерживает одновременную работу с восемью потоками.

На обоих двуядерных процессорах работа будет выполняться в два раза дольше, чем на Intel Core i7-2600K.

Интересно сравнить Core i5-2400 и Phenom II X4 970 (оба стоят $185). i5-2400 обошёл Phenom II во всех тестах. Похоже, что AMD придётся снижать цены, чтобы сделать самый быстрый четырёхъядерный процессор конкурентоспособным.

Тест Lame даёт дополнительную информацию о производительности в расчёте на такт, поэтому он остается в нашем пакете.

Масштабирование процессоров оказалось предсказуемым. Когда тестируете Phenom II, то помните, что AMD Phenom II X6 1100T использует технологию Turbo CORE, позволяющую увеличивать частоты до 3,7 ГГц на нагрузках, подобных Lame.

Единственная аномалия наблюдается у процессора Core i7-875K. Его потолок Turbo Boost в 3,6 ГГц – несомненная причина, почему он обошёл Core i5-655K, несмотря на неравенство по тактовым частотам.

Мы отказались от архиватора WinZip некоторое время назад. Но с версии WinZip 14 Intel смогла убедить разработчика добавить поддержку инструкций AES-NI. Так что мы вновь возвращаем в наши тесты этот архиватор вместе с последней версией WinRAR (без поддержки AES-NI) и 7-Zip (бесплатный; есть поддержка AES-NI).

Вы можете подумать, что диаграммы результатов тестов Lame и WinZip похожи, как близнецы. Действительно, разработчики WinZip не оптимизировали свой архиватор под многопоточность, поэтому производительность полностью зависит от количества выполняемых инструкций за такт (IPC) и тактовой частоты, а не от параллелизма.

Спасибо всем читателям, порекомендовавшим перейти на WinRAR 4.00 и 7-Zip 9.20 – мы обновили обе утилиты до последних версий.

Результаты архиватора WinRAR не отличаются от результатов WinZip, но вы должны заметить, что двуядерный Core i5-655K был отброшен на последнее место, а Core i3-2100 упал ниже Core i7-950 и Core i7-875K.

К несчастью для AMD, шестиядерный AMD Phenom II X6 1100T и четырёхъядерный Phenom II X4 970 не поднялись в рейтинге, несмотря на оптимизацию WinRAR под многопоточность. Мы не знаем, связана ли эта особенность с разработчиком, но можно отметить чёткую тенденцию в пользу новых процессоров Sandy Bridge.

Вместо прогона такого же набора файлов со сжатием, мы решили использовать встроенную функцию 7-Zip для измерения производительности каждой платформы в миллионах инструкций в секунду.

Тест 7-Zip заметно выигрывает от параллелизма, он получает преимущество от всех доступных потоков CPU.

Кодирование мультимедиа

Мы уже писали выше о двух приложениях, которые были переписаны с учётом использования конвейера Intel Quick Sync к моменту объявления Sandy Bridge. Давайте посмотрим на эти результаты ещё раз, как демонстрацию возможностей, которые открываются, если переместить вычислительную нагрузку с "железа" общего назначения на специализированные блоки логики с фиксированными функциями.


Конечно, многие программы по-прежнему не были модифицированы, им приходится использовать вычислительные ресурсы общего назначения для завершения работы. Поэтому они отражают производительность ядер процессора.

Обновление теста iTunes до свежей версии не повлияло на результаты, поскольку Apple по-прежнему запускает всё в одном потоке. Выигрывают процессоры с наиболее агрессивной реализацией Turbo Boost.

Места, занимаемые Intel Core i3-2100 и Core i5-655K меняются по сравнению с тестами Lame и WinZip. В остальном расстановка сил идентичная. Главный вывод: однопоточные приложения должны остаться в прошлом.

К счастью, не все приложения так плохо оптимизированы под многопоточность, как iTunes. Приложение MainConcept может использовать столько потоков, сколько получит в свое распоряжение. Более того, Sonic Solutions недавно выпустила версию 1.1 своего комплекта CUDA SDK, который опирается на аппаратное перекодирование потоков MPEG-2, VC-1 или H.264 в H.264. Есть надежда, что компания обновит свой пакет до поддержки Quick Sync.

Intel Core i7-2600K – единственный процессор, который справился с заданием меньше чем за минуту. Вторым стал Core i7-875K на базе Lynnfield, а за ним следует AMD Phenom II X6 1100T. Intel Core i5-2500K отстал всего за секунду, оказавшись на одном уровне с более дорогим Core i7-950, который может работать одновременно с восемью потоками, но имеет меньшую тактовую частоту.

Тест HandBrake также активно использует параллелизм, в результате чего Core i7-2600K одерживает победу. AMD Phenom II X6 1100T смог обойти Core i7-875K на секунду и занял второе место. Другие результаты очень похожи на тест MainConcept: процессоры Core i5-2500K, Core i7-950 и Core i5-2400 располагаются близко друг к другу.

Четырёхъядерный Phenom II X4 970 сдаёт свои позиции, хотя и обходит стареющий Core 2 Quad. Еще раз подтвердилась тенденция: двуядерные процессоры откатываются на последнее место в тестах, опирающихся на многопоточность.

Metro 2033 (DX11)



Мы использовали самую быструю видеокарту с одним GPU, чтобы выявить любые "узкие места" применительно к тестированию платформ в игре Metro 2033. С учётом всего сказанного, вряд ли кто-то будет покупать GeForce GTX 580 и играть в разрешении 1680x1050. Если такое и произойдёт, то производительность будет существенно падать, начиная с процессора Phenom II X4 970, затем на двуядерных процессорах Intel, и в конце концов на старой модели Core 2 Quad Q9550.

Мораль сей басни такова: если вы переходите на high-end графику, то двуядерный процессор с ней не справится.

Интересно и то, что шестиядерный AMD Phenom II X6 1100T, хоть и не самое быстрое решение, обеспечивает достаточный запас для самой высокой минимальной частоты кадров в нашем тесте Metro 2033. Это преимущество исчезает при подъёме разрешения, когда акцент смещается в сторону GPU. Но к тому времени, как мы добираемся до разрешения 2560x1600, восемь платформ из десяти получают разницу в один кадр в секунду по сравнению с остальными.

F1 2010 (DX11)



Игра F1 2010 намного сильнее зависит от производительности процессора, чем Metro 2033, которая очень требовательна к видеокарте. C одной и той же видеокартой GeForce GTX 580 на десяти различных платформах разница между первым и последним местом оказывается более чем двукратной.

Три процессора на основе Sandy Bridge занимают три первых места с разрешениями 1680x1050 и 1920x1080. При переходе к разрешению 2560x1600 разница сокращается, поскольку видеокарта берёт на себя большую часть нагрузки. Если забыть о разрешении 1680x1050 (вряд ли кто-то с high-end видеокартой и хорошим процессором будет играть на 17" мониторе), то процессоры AMD сдают свои позиции. Процессор Core i5-2400 за $185 обеспечивает скорость 83,3 FPS в разрешении 1920x1080, а процессор Phenom II X4 970 за $185 даёт чуть меньше 50 FPS. Вам придётся поднять разрешение ещё на одну ступень до 2560x1600 (или включить сглаживание), чтобы процессоры работали более или менее одинаково.

Aliens Vs. Predator (DX11)



Игра Aliens Vs. Predator не очень чутко реагирует на то, какой процессор работает в вашем компьютере. Даже в разрешении 1680x1050 получается разница в четыре кадра в секунду у десяти протестированных конфигураций. Все что требуется - установить мощную видеокарту.

Энергопотребление

Мы давно измеряем энергопотребление во время тестов видеокарт, не стал исключением и обсуждаемый тест. Мы записали энергопотребление всех десяти конфигураций, но для одного графика картина оказалась слишком запутанной. Так что мы отбросили два "младших" чипа Sandy Bridge из нашего набора, а также процессоры Lynnfield и Clarkdale.

На графике мы смогли вывести шесть разных наборов измерений. Сразу видно, что AMD Phenom II X6 1100T потребляет большое количество мощности, за ним следует Phenom II X4 970.

Если взять средние значения, то Core i7-950 оказывается вторым процессором по потребляемой мощности (AMD Phenom II X6 1100T потребляет в среднем до 197 Вт, а Core i7-950 – около 181 Вт, вместе с тем работа Phenom II X4 970 приводит к потреблению мощности около 180 Вт).

Полный прогон PCMark Vantage Core i7-2600K (Sandy Bridge) Core i5-2500K (Sandy Bridge) Core i7-950 (Bloomfield) Core 2 Quad Q9550 (Yorkfield) Phenom II X6 1100T (Thuban) Phenom II X4 970 (Deneb)
Среднее энергопотребление системы 163,99 Вт 164,34 Вт 181,73 Вт 161,56 Вт 197,12 Вт 180,91 Вт

Как же ведут себя два самых быстрых процессора Sandy Bridge? Core i7-2600K потребляет 164 Вт мощности. Такие же цифры показывает и Core i5-2500K. Сравните эти цифры с процессором Core 2 Quad Q9550, чьё среднее потребление мощности составляет 161 Вт. Теперь вернитесь к результатам производительности PCMark Vantage. Core i7-2600K занимает первое место. Core 2 Quad - последнее. Можно ли назвать эти 32-нм чипы более эффективными (то есть выполняющими больше работы при той же мощности)? Да, конечно. Мы поговорим об этом в нашей следующей статье, где сравним эффективность Sandy Bridge с другими платформами.

Sandy Bridge | Заключение

Объявление новых процессоров оказалось действительно важным событием. Процессоры Sandy Bridge обладают рядом характеристик, достойных наград, но некоторые инновации Intel не очень понятны.

Начнём с плохого, чтобы закончить статью на хорошей ноте.

С разгоном дела обстоят не слишком хорошо. Единственной интересной опцией для энтузиастов являются процессоры из линейки "K". Но не надо забывать, что меньше года назад единственный процессор с разблокированным множителем в ассортименте Intel стоил $999. Теперь у нас есть несколько решений в ценовых диапазонах $200 и $300, и это здорово! Но ограниченный разгон (Core i5/i7) и урезание опций (Core i3) огорчат энтузиастов с ограниченным бюджетом.

Интегрированная графика весьма слабая, по крайней мере, для настольных ПК. Из 14 объявленных процессоров две модели, предназначенные для энтузиастов с дискретными видеокартами, оснащаются графическим движком Intel HD Graphics 3000. Другие 12 – более подходящие процессоры для массовых ПК, офисных ПК и HTPC – используют урезанную реализацию графического ядра HD Graphics 2000.

За исключением двух перечисленных претензий, можно только восхищаться производительностью Sandy Bridge. Существующие процессоры Lynnfield и Clarkdale уже обеспечивают хорошую производительность по сравнению с линейкой AMD. Процессоры Sandy Bridge значительно упрочивают лидерство Intel, поскольку обеспечивают более высокую производительность в расчёте на такт, и частоты у них более высокие (благодаря проработанному 32-нм техпроцессу).

Нам очень понравилась и технология Quick Sync. Пока ни у AMD, ни у nVidia нет ответа на ускорение кодирования/декодирования Intel, и этот ответ вряд ли появится в ближайшее время. Если вы выполняете большое количество работы по перекодированию или монтажу видео, то имеет смысл переходить на Sandy Bridge только из-за Quick Sync. Надо отдать должное Intel и за прекрасную поддержку разработчиков, которые уже представили свои решения. Если бы производители графических процессоров работали с индустрией так же эффективно, то мы наверняка бы уже купались в приложениях с ускорением CUDA и APP.

Если бы нам пришлось выбирать один процессор Sandy Bridge, чтобы рекомендовать его родственникам и знакомым для сборки новых ПК, то это был бы Core i5-2500K. Его производительность по сравнению с процессорами AMD и другими процессорами Intel заслуживает восхищения, особенно учитывая цену чуть выше $200. Процессор i5-2500K значительно облегчает разгон Sandy Bridge благодаря разблокированному множителю, а геймерам мы рекомендуем устанавливать его на материнскую плату P67, чтобы сразу же забыть об интегрированном графическом ядре.

И хотя второй раз за два с половиной года международная редакция Tom's Hardware Guide выдаёт награду "Рекомендованная покупка", а этот процессор действительно её заслуживает, поверьте, мы внимательно следим за архитектурой AMD Bulldozer, и ждём, сможет ли она составить конкуренцию ритмично выходящим решениям Intel.

КОНЕЦ СТАТЬИ


Координаты для связи с редакцией:

Общий адрес редакции: thg@thg.ru;
Размещение рекламы: Roman@thg.ru;
Другие координаты, в т.ч. адреса для отправки информации и пресс-релизов, приглашений на мероприятия и т.д. указаны на этой странице.


Все статьи: THG.ru

 

Rambler's Top100 Рейтинг@Mail.ru