Обновление архитектуры Core 2: новый флагман Extreme QX9650
Не часто у компаний встречаются столь благоприятные стечения обстоятельств, как сегодня у Intel. Через 18 месяцев после первого объявления Intel решила обновить очень успешные процессоры Core 2. Производитель чипов уменьшил техпроцесс с 65 до 45 нм и готов к следующему шагу – переходу на платформу Nehalem. Впрочем, это всё ещё дело будущего, и раньше конца 2008 года, по самым оптимистичным прогнозам, Nehalem не выйдет.
Обновление архитектуры Conroe в целях увеличения производительности, добавления новых инструкций и, что наиболее важно, снижения энергопотребления идёт по плану. До сих пор процессоры Intel Core 2 уступали процессорам AMD Athlon 64 X2 по энергопотреблению, по крайней мере, в режиме бездействия. Именно поэтому мы построили наш солнечный ПК на платформе AMD. Впрочем, ситуация изменилась с появлением Intel Core 2 Extreme QX9650 на ядре Yorkfield (два кристалла Penryn).
Одновременно Intel пошла на радикальные изменения в техпроцессе, нарушая традиционный метод. Вместо производства транзисторов MOSFET (канальный полевой униполярный МОП-транзистор) внутри процессора на технологии с диоксидом кремния, которая работает с 1960-х годов, Intel теперь производит транзисторы по новой технологии с диэлектриком High-K. Это позволяет ядру Penryn опережать предыдущие поколения несколькими путями.
Перед тем, как мы перейдём к тестам, следует сделать несколько комментариев. Поскольку AMD так и не смогла обеспечить нам систему 4×4, пришлось использовать самый скоростной двуядерный процессор AMD Athlon X2 6400+ Black Edition. Конечно, сложная двусокетная система AMD на рынке практически отсутствует, но для полноты мы хотели бы привести и её тесты. Собственно, по этой причине мы сравниваем четырёхядерный процессор Intel с двуядерным процессором AMD. Это всё, что мы можем сделать до появления Phenom.
Собственно, это мы и хотели сказать после бессонных ночей за тестовой системой, когда нам пришлось обходить некоторые проблемы, связанные с новизной компонентов. Новые процессоры, изготавливающиеся по 45-нм технологии, не только потребляют феноменально мало энергии, но и обеспечивают прекрасный потенциал разгона. Даже когда мы разогнали процессор до предела, его тепловыделение и энергопотребление практически не превышали уровень современных процессоров Core 2 – на их штатных частотах. Новый набор инструкций SSE4 и больший объём кэша L2 в 12 Мбайт обеспечивают уже неслабой архитектуре Core 2 заметный прирост производительности. Насколько он велик?
Мы уже встречали несколько разогнанных систем на четырёхядерных Penryn на последнем IDF в Сан-Франциско.
Примечание: если быть точным, то кодовое название Penryn имеют двуядерные чипы с одним кристаллом. А четырёхядерные процессоры на двух кристаллах Penryn имеют кодовое название Yorkfield.
Новый диэлектрик минимизирует токи утечки
С 1960-х годов все MOSFET, то есть все транзисторы в современных процессорах, изготавливались только из кремния и диоксида кремния. С выходом процессора Penryn и одновременным переходом на 45-нм технологию Intel стала первым производителем, который добавил в процесс изготовления другое вещество.
В каждом транзисторе Intel заменила два слоя (показаны на иллюстрации синим и жёлтым) другими материалами. Жёлтый слой диэлектрика, влияющий на скорость переключения между истоком и стоком MOSFET, раньше состоял из диоксида кремния, а теперь его заменил диэлектрик High-K. Кроме того, бывший слой кремния в затворе над диэлектриком (синий) теперь стал металлическим.
По сравнению с традиционным техпроцессом, который по-прежнему используется для изготовления 65-нм процессоров, изменились следующие характеристики.
- Скорость переключения транзисторов выросла на 20%.
- Токи утечки, которые приводили к немалому тепловыделению (особенно у Pentium 4 Prescott), снизились в 10 раз.
Анна Келлехер (Ann Kelleher) рассказывает о переключении транзисторов на новых материалах… Нажмите на картинку для увеличения.
…подкрепляя объяснение формулами. Нажмите на картинку для увеличения.
Поэтому время переключения отдельных транзисторов нового процессора Penryn уменьшилось, а характеристики переключения таковы, что сигналы получаются более чистыми.
Именно благодаря использованию двух новых материалов процессор Penryn получил такой экстраординарный потенциал разгона. Теперь не проблема даже частота 4 ГГц и выше, что мы уже видели на нынешнем “Форуме Intel для разработчиков”.
45 нм: выход годных кристаллов больше, площадь кристалла меньше
Как по расписанию, Intel уменьшает техпроцесс каждые два года, и следующий такой шаг нас ждёт в 2009 году. Хотя 45-нм процессоры ещё только готовятся поступить в продажу, в лабораториях Intel уже тестируются первые прототипы чипов, изготовленные по 32-нм техпроцессу.
Начиная с 45-нм технологии, Intel пришлось исследовать работу новых материалов, которые стали использоваться в этом и следующих техпроцессах. Если до сих пор для разных техпроцессов использовались практически одни и те же материалы, то для новых, ещё меньших по размеру транзисторов, пришлось переходить на новые вещества.
45-нм техпроцесс имеет следующие преимущества по сравнению с 65-нм.
- На той же площади кристалла можно разместить почти в два раза больше транзисторов.
- Энергопотребление уменьшилось примерно на 30%.
Всё это хорошо сочетается с “законом Мура”, предсказании, сделанном несколько десятков лет назад Гордоном Муром (Gordon Moore), которое утверждает (в одной из трактовок), что число транзисторов будет примерно удваиваться с появлением каждого нового техпроцесса (то есть за два года).
На пресс-конференции Intel каждый из журналистов получил возможность подержать в руках 300-мм пластину.
300-мм пластины, из которых изготавливаются процессоры Penryn. Нажмите на картинку для увеличения.
Ядро Penryn по размеру меньше, чем евроцент. Нажмите на картинку для увеличения.
Исследования 32-нм техпроцесса в Intel идут полным ходом. С сентября нынешнего года в лабораториях Intel уже работают полноценные чипы SRAM на 32-нм техпроцессе.
12 Мбайт кэша L2 и SSE4
При равных тактовых частотах новый Penryn оказывается быстрее, чем 65-нм предшественник Conroe. За прирост производительности отвечают две самые важные инновации, а именно, больший кэш L2, который вырос с 2 x 4 Мбайт до 2 x 6 Мбайт и новый набор инструкций SSE4.
Благодаря большему кэшу L2 на некоторых приложениях удаётся снизить число обращений в относительно медленную память, что даёт прирост производительности до 27%.
Новый набор инструкций SSE4 состоит из 54 новых инструкций, большинство из которых призваны ускорить задачи видео. Впрочем, Intel пока реализовала не весь набор инструкций, а только 47 из них. Именно поэтому расширения SSE называются SSE4.1 (версия 1). Вторая версия, которая будет содержать полный набор инструкций, появится у преемника Penryn под названием Nehalem и будет называться SSE4.2.
На иллюстрации показана краткая история инструкций SSE с их первого поколения до сегодняшнего дня.
Как SSE4 ускоряет рендеринг видео?
До сих пор участок кода, работающий с определением движения, выглядел подобно следующему.
Теперь, с помощью SSE4, его можно полностью заменить следующей инструкцией.
MPSADBW xmm0, xmmm1, 0
Это не только сокращает время написания программы, но и существенно ускоряет её выполнение.
При кодировании видео не только кодек является важным фактором (например, DivX 6.6.1 или более поздний), но и программа кодирования. Например, текущая версия VirtualDub уже поддерживает SSE4, а TMpegEnc и Adobe Premiere будут обновлены в ноябре и к концу года, соответственно.
Мы смогли проверить производительность предварительной версии TMpegEnc с поддержкой SSE4. И вот, что мы получили.
Intel показала “живую” демонстрацию работы SSE4.1 в Adobe Premiere CS3. Нажмите на картинку для увеличения.
Intel планирует довольно быстро осуществить полный переход на 45-нм техпроцесс.
Процессор: Intel Core 2 QX9650
Новый четырёхядерный процессор Intel по-прежнему состоит из двух отдельных двуядерных кристаллов в одной упаковке CPU. Под кодовым названием Penryn скрывается двуядерная версия, а четырёхядерная версия называется Yorkfield.
При площади кристалла всего 107 мм², Penryn меньше, чем монета в один евроцент.
Площадь кристалла Yorkfield составляет 214 мм². Нажмите на картинку для увеличения.
В следующей таблице приведены отличия между старой и новой технологиями на основе сравнения четырёхядерных процессоров.
Сравнение технологий | ||
Penryn QX9650 | Conroe QX6850 | |
Тактовая частота | 3,00 ГГц | 3,00 ГГц |
FSB | 333 МГц | 333 МГц |
Кэш L2 | 2x 6 Мбайт | 2x 4 Мбайт |
Техпроцесс | 45 нм | 65 нм |
Число транзисторов | 820 млн. | 586 млн. |
Площадь кристалла | 214 мм² | 286 мм² |
TDP | 130 Вт | 130 Вт |
Инженерный образец QX9650. Нажмите на картинку для увеличения.
На обратной стороне ничего не изменилось: то же число ножек, та же их раскладка. Нажмите на картинку для увеличения.
Этот процессор мы использовали для всех тестов.
Мы получили инженерный образец в такой коробочке. Нажмите на картинку для увеличения.
Core 2 Extreme QX9650, полученный нами от Intel, использовал степпинг C0.
Хотя CPU-Z не смог идентифицировать степпинг, у Everest подобных проблем не обнаружилось.
Разгон I: 3,33 ГГц
Поскольку процессор из нового семейства Intel относится к моделям Extreme Edition, множитель у него разблокирован. Это позволило нам разгонять процессор без повышения частоты FSB.
Множитель QX9650 по умолчанию равен 9x, что даёт тактовую частоту 3,0 ГГц на FSB 333 МГц (1333 QDR). Для первых тестов разгона мы перевели множитель на 10x.
Мы смогли разогнать QX9650 до 3,33 ГГц и успешно загрузились в Vista без подъёма штатного напряжения ядра 1,25 В. Конечно, мы не ожидали от 45-нм процессора меньшего.
На штатном напряжении QX9650 может работать на 3,33 ГГц. Нажмите на картинку для увеличения.
Мы запустили тест максимальной нагрузки Prime95 версии 25.4, чтобы проверить стабильную работу на данной тактовой частоте. Проблем мы не обнаружили.
Intel раздаёт дополнительную производительность “бесплатно”: частоту процессора можно повысить на 11% без увеличения напряжения ядра.
Разгон II: 3,66 ГГц
Следующий множитель – 11x, что даёт нам тактовую частоту 3,66 ГГц. Процессор уже не смог справиться с этой частотой без подъёма напряжения. Мы успешно загрузились в Vista, но тест стабильности Prime95 не прошёл.
Наш образец стабильно заработал только при повышении напряжения ядра до 1,29375 В, что является приростом на 0,04375 В.
Незначительное увеличение напряжения позволило получить стабильную работу на 3,66 ГГц. Нажмите на картинку для увеличения.
Разгон III: 3,8 ГГц
В нашем задании обнаружить максимальную тактовую частоту QX9650 следующим этапом оказалась стабильная работа на 3,8 ГГц. Поскольку номинально FSB у этого процессора работает на частоте 333 МГц (1333 QDR), а наша плата X38 от Gigabyte на момент тестирования не поддерживала промежуточные множители, мы не смогли получить 3,8 ГГц за счёт изменения множителя. Поэтому мы остались с множителем 11x и увеличили частоту FSB до 346 МГц (1384 QDR).
Чтобы процессор стабильно работал на 3,8 ГГц, нам пришлось ещё больше увеличить напряжение. При напряжении 1,3375 В (на 0,0975 В выше штатного) процессор QX9650 успешно прошёл через тест стабильности Prime95.
При напряжении ядра, которое для 65-нм поколения процессоров Core 2 является штатным, новая 45-нм версия работает с частотой на 27% выше стандартной. Впрочем, как можно видеть, тепловыделение после разгона возрастает не очень сильно.
QX9650 стабильно работал на 3,8 ГГц с напряжением на 7% больше штатного. Нажмите на картинку для увеличения.
Разгон IV: 4 ГГц при очень высоком напряжении
Наконец, мы решили достичь “магического” барьера в 4 ГГц. На этот раз мы вернулись к FSB 333 МГц и выставили множитель 12x, что даёт в точности частоту 4 ГГц. В нашей первой попытке мы смогли всего лишь взглянуть на экран BIOS POST, после чего система “зависла”.
Поскольку при таких настройках материнская плата даже не загружалась, нам пришлось повысить напряжение, причём значительно. Скрепя сердце, мы выставили в BIOS напряжение 1,4375 В, что соответствует приросту на 0,1875 В. При таком высоком напряжении процессор QX9650 не только загружался, но и выдержал тесты стабильности Prime95.
Впрочем, работа 45-нм процессора при таком высоком напряжении явно не лучшее решение для продолжительной работы, поскольку CPU будет наноситься значительный вред из-за электронной миграции. Есть вероятность, что проводящие пути внутри CPU исчезнут, и он перестанет работать. И в один прекрасный день компьютер внезапно “повиснет” и никогда уже не включится с этим процессором.
При напряжении 1,4375 В мы смогли заставить работать наш образец Penryn на частоте 4,0 ГГц. Нажмите на картинку для увеличения.
В любом случае, мы были более чем удивлены, что процессор не только заработал на 4,0 ГГц, но и оказался стабильным. Во всех тестах разгона мы использовали только воздушное охлаждение (Zalman CNPS9700 LED), поэтому результат оказался ещё более впечатляющ.
Все тесты проводились с помощью кулера Zalman. Нажмите на картинку для увеличения.
Разгон V: 4 ГГц на FSB 1600
Чтобы выжать максимум из нашего инженерного образца, мы провели тесты на частоте 4 ГГц с частотой FSB 400 МГц (1600 QDR). Для данного теста мы выставили множитель 10x.
Процессор стабильно работал в заданном режиме, но мы провели и тесты стабильности Prime95.
Мы успешно запустили QX9650 на 4,0 ГГц с FSB 1600. Нажмите на картинку для увеличения.
Во время наших тестов разгона мы обнаружили, что новое 45-нм поколение процессоров имеет намного больший потенциал разгона. Диапазон между стабильной и нестабильной работой стал шире. Если процессоры поколения 65 нм просто не загружались, когда частота была выставлена слишком высоко, то наш 45-нм образец смог, по крайней мере, загрузить ОС. Поведение процессора при разгоне схоже с моделями Northwood и Prescott на микро-архитектуре Netburst. Даже при очень высоких частотах вы всё равно сможете, как минимум, загрузить ОС.
После первых тестов мы можем подтвердить заявление Intel о том, что 45-нм дизайн создавался с учётом высоких тактовых частот. Вполне вероятно, что производитель выпустит модели на частотах 3,33 и 3,66 ГГц. Даже 3,83 ГГц тоже может стать вариантом, если будет принята 400-МГц FSB (1600 QDR) или половинные множители.
Чуть ниже в нашей статье мы поговорим об энергопотреблении и о том, как оно меняется на высоких тактовых частотах.
Разгон: до 19% больше производительности
Мы провели анализ производительности на отдельных программах, которые составляют наш тестовый пакет, при разгоне до 3,33 и 3,66 ГГц.
Мы не включили в таблицу такие синтетические тесты, как SiSoft Sandra, PCMark и 3DMark, поскольку они не являются реальными приложениями и не дают результатов, которые можно было бы перенести на обычные программы.
Процессор Core 2 Extreme QX9650, работающий на 3,3 ГГц и штатном напряжении, демонстрирует средний прирост производительности на 6,6% на программах, входящих в наш тестовый пакет.
При повышении частоты процессора до 3,66 ГГц, что потребовало незначительного увеличения напряжения, результаты возросли на 13,3%.
Все наши тесты проводились на материнской плате Gigabyte GA-X38-DQ6. Нажмите на картинку для увеличения.
Разгон до 4,0 ГГц: FSB1600 не даёт преимущества
Микро-архитектура Core была разработана таким образом, что доступ к основной памяти осуществляется очень редко. Это достигается за счёт предварительной (спекулятивной) загрузки данных. Большой кэш L2 в 12 Мбайт (2 x 6 Мбайт) ещё сильнее снижает зависимость производительности CPU от памяти.
Именно поэтому увеличение частоты системной шины северного моста, в котором есть и контроллер памяти, на 25% до 400 МГц (QDR 1 600) не дало практически никакого эффекта. Прирост производительности на 0,5% по сравнению с результатами FSB1333 пользователь вряд ли заметит.
Более высокая частота FSB приведёт лишь к увеличению энергопотребления северного моста, а также, потенциально, к сбоям в работе чипсетов P35 и X38, ни один из которых не поддерживает FSB1600 официально.
По крайней мере, на сегменте настольных ПК, переход на FSB1600 является больше маркетинговым шагом, нежели даёт ощутимый прирост производительности.
На мероприятии Intel представитель компании подтвердил, что “для настольных ПК частота FSB вряд ли даёт разницу”. В любом случае, он дал понять, что процессоры с FSB1600, которые требуют нового чипсета X48, появятся в следующем году.
Чёткое указание от Intel – FSB1600 не даёт преимуществ. Нажмите на картинку для увеличения.
Работая на 4,0 ГГц, наш процессор обеспечил в тестах прирост до 19%. Впрочем, для стабильной работы на данной частоте требуется серьёзное увеличение напряжения, что вряд ли подходит для длительной работы.
В наших тестах мы использовали память DDR2-800, работающую с задержками CL 4,0-4-4-12, сертифицированными JEDEC.
Сенсация: энергопотребление в режиме бездействия всего 3,79 Вт
Мы были удивлены и не поверили глазам, когда впервые измерили энергопотребление QX9650. Мы повторили измерения несколько раз, чтобы проверить результат и исключить фактор ошибки, но энергопотребление оставалось прежним. В режиме бездействия, когда четыре ядра процессора работают на пониженной частоте 2 ГГц благодаря технологии Intel Speedstep, амперметр показал всего 310 миллиампер. Напряжение системы составляло 12,216 В, в результате чего 45-нм Penryn имеет сенсационно низкое энергопотребление – всего 3,79 Вт.
Относительно высокая частота процессора 2,0 ГГц даже в режиме бездействия связана с высокой частотой FSB 333 МГц (1333 QDR) и минимальным множителем 6x. При активной Speedstep напряжение ядра составляет всего 0,998 В.
Мы видим, что новые материалы затвора транзисторов MOSFET демонстрируют впечатляюще малое энергопотребление. Это позволяет флагманскому процессору Intel легко обходить самые экономичные модели AMD при включённых функциях энергосбережения. Проблема в том, что процессор AMD с минимальным энергопотреблением – это Sempron, который явно находится не в той же лиге, что процессор Core 2 Extreme. С другой стороны, следует помнить, что AMD интегрирует контроллер памяти на сам процессор, что снижает энергопотребление северного моста.
Процессор Penryn способен оповещать материнскую плату о том, что находится в режиме бездействия. Тогда материнская плата может отключать часть стабилизаторов напряжения, чтобы ещё больше экономить энергию.
Опять же, мы должны учитывать и общее энергопотребление двух платформ. В этом отношении Intel по-прежнему проигрывает AMD. Если у чипсета Intel X38 тепловой пакет составляет 36,5 Вт, то варианты под AMD потребляют меньше.
Очень хорошо: 73 Вт для четырёх ядер
Чтобы определить максимальное энергопотребление нашего тестового процессора, мы нагрузили все ядра с помощью Prime95. Опять же, результат нас удивил. По сравнению с прямым предшественником – четырёхядерным Kentsfield (Conroe), новый процессор на основе Penryn с технологией High-K Metal Gate потребляет на 39,25% меньше энергии. Учтите, что мы измеряли энергопотребление обоих процессоров на одной и той же материнской плате, а именно, на Gigabyte GA-X38-DQ6.
Хотя новый Penryn оснащён на 4 Мбайт кэша L2 больше, его энергопотребление составляет меньше 73 Вт, что ниже, чем у предшественника, примерно на 47 Вт.
Несмотря на то, что число транзисторов возросло с 586 до 820 миллионов, энергопотребление упало примерно на 39%.
Ситуация для AMD выглядит печально. Флагманский процессор этой компании, оснащённый всего двумя ядрами, потребляет 132,76 Вт. Топовая 45-нм модель Intel, четырёхядерный процессор, потребляет всего 72,98 Вт. Даже меньшее энергопотребление северного моста у платформы AMD не способно закрыть разрыв в 50 Вт.
Если посмотреть на результаты, то в следующем году мы вполне можем ожидать официальный выход 4-ГГц модели. Новый степпинг, как нам кажется, вполне способен обеспечить меньшее рабочее напряжение, так что 4-ГГц вариант очень даже возможен. Мы не знаем, по какой причине Intel указывает тепловой пакет у QX9650 на уровне 130 Вт. В наших тестах процессор и стабилизатор напряжения потребляли вместе существенно меньше энергии и легко вписывались в тепловой пакет 95 Вт.
Меньшее напряжение ядра: 1,250 В
Благодаря 45-нм техпроцессу и технологии High-K Metal Gate Intel смогла существенно понизить штатное напряжение Penryn. Наш QX9650 питался всего от 1,250 В.
Для сравнения, все предыдущие модели Core 2 на 65-нм техпроцессе, которые тестировались в нашей лаборатории, питались от 1,3125 В, что на 5% больше.
Даже когда мы разогнали процессор до 3,8 ГГц, нам пришлось повысить напряжение всего до уровня, на котором штатно работают 65-нм модели.
Благодаря новому материалу затвора напряжение ядра удалось понизить до 1,250 В, существенно уменьшив тепловыделение CPU.
Рабочая температура: на 12°C ниже
Нажмите на картинку для увеличения.
Мы решили изучить влияние уменьшения площади кристалла на тепловыделение CPU. Для разных тестов, которые мы провели в рамках обзора, мы использовали воздушный кулер Zalman CNPS9700 LED, вентилятор которого работал на полной скорости.
По сравнению с 65-нм поколением, которое производится по технологии напряжённого кремния (strained silicon), новые процессоры работают на 12°C холоднее, причём при полной загрузке всех ядер. QX9650 достигает температуры уровня 65-нм QX6850 только при разгоне до 4,00 ГГц, когда мы существенно увеличили рабочее напряжение.
По причине низкого тепловыделения системам на 45-нм процессорах вряд ли потребуются системы водяного охлаждения при работе на высоких частотах. По нашему опыту, комбинации радиатор/вентилятор оказалось вполне достаточно для разгона процессора до 4,00 ГГц. Если вы не хотите, чтобы вентилятор работал на полной скорости, просто ограничьтесь частотой 3,8 ГГц.
Процессоры Core 2 на Penryn/Yorkfield: модели, цены, новый штатный кулер
Intel запускает линейку Penryn/Yorkfield с одним процессором, а именно: Core 2 Extreme QX9650. Ситуация не изменится до следующего года, так как расширение модельного ряда Penryn планируется в первом квартале 2008. Появятся модели с меньшими тактовыми частотами и по меньшей цене. В любом случае, пройдёт не меньше пяти месяцев, прежде чем мы увидим появление “младших” моделей. Все новые процессоры будут использовать 333-МГц FSB.
Обзор будущих процессоров на Penryn/Yorkfield | |||
Модель | Тактовая частота | Кэш L2 | Доступность |
Core 2 Extreme QX9650 | 3,00 ГГц | 2x 6 Мбайт | 12 ноября |
Core 2 Quad Q9550 | 2,83 ГГц | 2x 6 Мбайт | Q1/2008 |
Core 2 Quad Q9450 | 2,66 ГГц | 2x 6 Мбайт | Q1/2008 |
Core 2 Quad Q9300 | 2,50 ГГц | 2x 3 Мбайт | Q1/2008 |
Core 2 Duo E8500 | 3,16 ГГц | 1x 6 Мбайт | Q1/2008 |
Core 2 Duo E8400 | 3,00 ГГц | 1x 6 Мбайт | Q1/2008 |
Core 2 Duo E8200 | 2,66 ГГц | 1x 6 Мбайт | Q1/2008 |
Учтите, что информация о “младших” моделях не основана на официальных данных Intel, поэтому может меняться.
Грядущие модели, которые будут работать на 2,5, 2,83 и 3,16 ГГц, потребуют поддержки половинных множителей, например, 8,5x, что реализовано в архитектуре Penryn. Наша материнская плата MSI P35 Neo2 уже оснащена поддержкой этих процессоров и предоставляет множители. Несмотря на то, что мы получили новую BIOS прямо с Тайваня, плата Gigabyte X38 board GA_X38-DQ6 так и не смогла работать с половинными множителями.
А пока, если вы пожелаете купить Penryn, будьте готовы выложить около 1 000 евро за QX9650. Если подобные траты выходят за рамки вашего бюджета, придётся подождать несколько месяцев, прежде чем появятся другие модели.
Чипсеты
Процессоры Penryn официально поддерживают чипсеты Intel X38, P35 и G33.
Коробка материнской платы Foxconn X38. Нажмите на картинку для увеличения.
В нашу лабораторию уже поступила материнская плата Foxconn X38A Digitalife. Нажмите на картинку для увеличения.
Ситуация в нашей лаборатории оказалась анекдотичной. Когда мы получили наш образец процессора от Intel, то с нетерпением принялись за тесты. Однако материнские платы Gigabyte и MSI отказались с ним стартовать. Когда мы попросили производителей выслать обновлённые версии BIOS, то ответ был таков: рады бы помочь, но мы пока не получили образцов процессоров Penryn от Intel. Похоже, Intel решила превзойти саму себя и выслала образцы журналистам раньше, чем производителям материнских плат. Мы встречаемся с таким впервые.
Северный мост чипсета Intel X38. Нажмите на картинку для увеличения.
Официально ни 965P, ни 975X не поддерживают 45-нм процессоры.
Новый “коробочный” кулер
Вместе с образцом процессора мы получили новые официальные спецификации – все 96 страниц. В пункте “Boxed Cooler” мы обнаружили не только привычный штатный кулер Intel, но и модель совершенно нового дизайна.
Нажмите на картинку для увеличения.
В следующей таблице представлены все доступные сегодня модели процессоров Core 2.
Процессор | Кодовое название | Тактовая частота | Кэш L2 | FSB | Техпроцесс |
Core 2 Extreme QX9650 | Yorkfield | 4x 2 933 МГц | 2x 6 144 кбайт | 333 МГц | 45 нм |
Процессор | Кодовое название | Тактовая частота | Кэш L2 | FSB | Техпроцесс |
Core 2 Extreme QX6850 | Kentsfield | 4x 3 000 МГц | 2x 4 096 кбайт | 333 МГц | 65 нм |
Core 2 Extreme QX6800 | Kentsfield | 4x 2 933 МГц | 2x 4 096 кбайт | 266 МГц | 65 нм |
Core 2 Extreme QX6700 | Kentsfield | 4x 2 666 МГц | 2x 4 096 кбайт | 266 МГц | 65 нм |
Core 2 Extreme Q6700 | Kentsfield | 4x 2 666 МГц | 2x 4 096 кбайт | 266 МГц | 65 нм |
Core 2 Quad Q6600 | Kentsfield | 4x 2 400 МГц | 2x 4 096 кбайт | 266 МГц | 65 нм |
Процессор | Кодовое название | Тактовая частота | Кэш L2 | FSB | Техпроцесс |
Core 2 Extreme X6800 | Conroe XE | 2x 2 933 МГц | 1x 4 096 кбайт | 266 МГц | 65 нм |
Core 2 Duo E6850 | Conroe | 2x 3 000 МГц | 1x 4 096 кбайт | 333 МГц | 65 нм |
Core 2 Duo E6750 | Conroe | 2x 2 666 МГц | 1x 4 096 кбайт | 333 МГц | 65 нм |
Core 2 Duo E6550 | Conroe | 2x 2 333 МГц | 1x 4 096 кбайт | 333 МГц | 65 нм |
Core 2 Duo E6540 | Conroe | 2x 2 333 МГц | 1x 4 096 кбайт | 333 МГц | 65 нм |
Core 2 Duo E6700 | Conroe | 2x 2 667 МГц | 1x 4 096 кбайт | 266 МГц | 65 нм |
Core 2 Duo E6600 | Conroe | 2x 2 400 МГц | 1x 4 096 кбайт | 266 МГц | 65 нм |
Процессор | Кодовое название | Тактовая частота | Кэш L2 | FSB | Техпроцесс |
Core 2 Duo E6400 | Conroe-2048 | 2x 2 133 МГц | 1x 2 048 кбайт | 266 МГц | 65 нм |
Core 2 Duo E6300 | Conroe-2048 | 2x 1 866 МГц | 1x 2 048 кбайт | 266 МГц | 65 нм |
Core 2 Duo E6420 | Conroe | 2x 2 133 МГц | 1x 4 096 кбайт | 266 МГц | 65 нм |
Core 2 Duo E6320 | Conroe | 2x 1 866 МГц | 1x 4 096 кбайт | 266 МГц | 65 нм |
Core 2 Duo E6400 | Allendale | 2x 2 133 МГц | 1x 2 048 кбайт | 266 МГц | 65 нм |
Core 2 Duo E6300 | Allendale | 2x 1 866 МГц | 1x 2 048 кбайт | 266 МГц | 65 нм |
Core 2 Duo E4600 | Allendale | 2x 2 400 МГц | 1x 2 048 кбайт | 200 МГц | 65 нм |
Core 2 Duo E4500 | Allendale | 2x 2 200 МГц | 1x 2 048 кбайт | 200 МГц | 65 нм |
Core 2 Duo E4400 | Allendale | 2x 2 000 МГц | 1x 2 048 кбайт | 200 МГц | 65 нм |
Core 2 Duo E4300 | Allendale | 2x 1 800 МГц | 1x 2 048 кбайт | 200 МГц | 65 нм |
Процессор | Кодовое название | Тактовая частота | Кэш L2 | FSB | Техпроцесс |
Pentium Dual CoreE2180 | Conroe-L | 2x 2 000 МГц | 1x 1 024 кбайт | 200 МГц | 65 нм |
Pentium Dual CoreE2160 | Conroe-L | 2x 1 800 МГц | 1x 1 024 кбайт | 200 МГц | 65 нм |
Pentium Dual CoreE2140 | Conroe-L | 2x 1 600 МГц | 1x 1 024 кбайт | 200 МГц | 65 нм |
Сравнение производительности: на 6,9% лучше
Кэш L2 большего размера – 12 Мбайт – заметно влияет на производительность. По сравнению с предшественником, QX6850, новый процессор QX9650 выходит в тестах (в среднем) почти на 7% вперёд при равных тактовых частотах. Причём мы не обнаружили ни одного приложения, которое бы не выигрывало от нового процессора, пусть даже ненамного.
Serious Sam 2 и Quake 4 от увеличения кэша L2 демонстрируют наиболее сильный прирост. А Xvid кодирует на 15,2% быстрее.
Intel на 45% быстрее AMD
Результаты производительности оказались для AMD весьма удручающими. Новый процессор Intel QX9650 на основе Penryn/Yorkfield обходит самый быстрый настольный процессор AMD Athlon 64 X2 6400+, в среднем, на 45%.
Сегодня у AMD есть только двуядерная линейка настольных процессоров, и модель Athlon 64 X2 6000+ отстаёт, в среднем, на 53,8%. В некоторых приложениях, таких, как MainConcept, 3D Studio Max и Cinema 4D, чип Intel оказывается в два раза быстрее конкурентов.
Операционная система: Windows Vista Enterprise
Мы осуществляем постепенный переход на новую версию Windows, а именно, на Windows Vista Enterprise. Хотя эту версию нельзя купить в магазине, её производительность идентична Windows Vista Business и Windows Vista Ultimate. Но нам пришлось использовать именно её, поскольку она поддерживает Open License. Эта лицензия позволяет активировать Windows Vista через Интернет много раз, а не звонить каждый раз на линию активации Microsoft.
Аппаратная конфигурация
Мы обновили наши тестовые платформы такими новыми комплектующими, как видеокарта, звуковая карта и жёсткий диск, чтобы наши читатели получили результаты на современных платформах.
Системное аппаратное обеспечение | |
Платформа AMD Socket AM2 | Asus M2N32-SLI Deluxe, Rev.1.03G, nVidia nForce 5, BIOS: 1001 (03/13/2007) |
Платформа Intel Socket S775 (Intel P35) | Gigabyte P35C-DS3R, Rev. 1.0, Intel P35, BIOS: F2o (05/11/2007) |
Платформа Intel Platform S775 (Intel X38) | Gigabyte GA-X38-DQ6, Rev. 1.0, Intel X38, BIOS: F4 (09/19/2007) |
Память | 2x 1 Гбайт A-Data DDR2-1066+ Vitesta Extreme Edition |
DVD-ROM | Samsung SH-D163A , SATA150 |
Видеокарта | Foxconn nVidia Geforce 8800 GTX, GPU: 575 МГц, блок шейдеров: 1350 МГц, память: 786 Мбайт DDR4 (900 МГц, 384 бита) |
Звуковая карта | Creative Labs Sound Blaster X-Fi XtremeGamer |
Блок питания | Zalman, ATX 2.01, 510 Вт |
Samsung SH-D163A SATA. Нажмите на картинку для увеличения.
Программная конфигурация
Системное ПО и драйверы | |
ОС | Windows Vista Enterprise Version 6.0 (Build 6000) |
DirectX 10 | DirectX 10 (Vista default) |
DirectX 9 | Версия: April 2007 |
Звуковая карта | Vista Driver 2.13.0012 (15.03.2007) |
Видеокарта | nVidia ForceWare Version 158.18 (32 бита) WHQL |
Чипсет Intel | Версия 8.1.1.1010 (21/11/2006) |
Intel Storage Driver | Matrix-Storage Manager 7.0.0.1020 |
Чипсет nVidia | nForce platform driver: 15.00 (02.02.2007) WHQL |
Java | Java Runtime Environment 6.0 Update 1 |
Наша тестовая система
Тестовая система Penryn. Нажмите на картинку для увеличения.
Тесты и настройки
3D-игры | |
Warhammer Mark of Chaos | Version: 1.006.000 Video Mode: 1280×1024 Video Quality: game default Multiple CPU/Core Demo: THG Timedemo (1 minutes) |
Quake 4 | Version: 1.3 Final Video Mode: 1280×1024 Video Quality: game default Benchmark I: THG Timedemo Benchmark II: playnettimedemo id_demo001 (official ID-Soft NetTimeDemo) |
Unreal Tournemant 2004 | Version: 3369 UMark: 2.0.0 Video Mode: 1280×1024 High Image Quality Bots: 16 Benchmark: AS-Junkyard |
Serious Sam 2 | Version: 2.070 Video Mode: 1024×768 HDR Rendering: off Renderer: Direct3D Filtering mode: none Anti-Aliasing mode: none Benchmark: Greendale |
F.E.A.R | Version: 1.08 Retail Video Mode: 1280×1024 Computer: High Graphics Card: Custom FSAA: off Texture Filtering: Trilinear Benchmark: Performance Test |
Supreme Commander | Version: 3.220 Video Mode: 1024×768 Video Quality: game default Vsync = off Benchmark: real 60 second game with real three computer physics |
Prey | Version: 1.3 Video Mode: 1280×1024 Video Quality: game default Vsync = off Benchmark: THG-Demo |
Кодирование аудио | |
iTunes 7.2 | Version: 7.1.1.5 Audio CD “Terminator II SE”, 53 min High Quality (160 kbps) |
Lame MP3 | Version 3.98 Beta 3 (05-22-2007) Audio CD “Terminator II SE”, 53 min wave to mp3 160 Kbps |
Кодирование видео | |
Pinnacle Studio 11 Plus | Version: 11.0.0.5082 Encoding and Transition Rendering Private MPEG2-Cam-Movie Video: 720 x 480 Pixel, NTSC, 6000 Kbits/sec Audio: MPEG Layer 2, 224 Kbits/sec 16 Bit, Stereo 48 KHz File Type: MPEG-2 (DVD Compatible) |
TMPEG 4.2 | Version: 4.2.10.211 Import file: Terminator 2 SE DVD (720×576, 16:9) 2 Minutes Dolby Digital, 48000 Hz, 6-Kanal, English Advanced Acoustic Engine MP3 Encoder (160 kbps) |
DivX 6.6.1 | Version: 6.6.1 – Main Menu – Profile: Home Theater Profile (720 x 576) 1-pass, 780 kbit/s – Codec Menu – Encoding mode: Insane Quality Enhanced multithreading |
XviD 1.1.2 | Version: 1.1.2 (01/11/2006) Target quantizer: 1.00 (maximum quality) |
Clone DVD 2 | Version: 2.908 DVD “Terminator II SE” (English version) Transcoding from DVD-9 to DVD-4.7 Audio: English Dolby AC-3/6 (surround) – DTS Subtitle: no |
MainConcept H.264 Encoder | Version: 2.0 MPEG2 to MPEG2 (H.264) MainConcept H.264/AVC Codec 24 sec HDTV 1920×1080 (MPEG2) Audio: MPEG Layer 2 (48 kHz, 2 Channel, 16 Bit) Stream: Transport Codec: H.264 Mode: NTSC (29.97 FPS) Profile: High |
Adobe Premiere Pro 2.0 HDTV Windows Media Encoder 9.1 AP HDTV Windows Audio Encoder 10 Pro |
Version: 2.0 NTSC MPEG2-HDTV 1920×1080 (24 sec) Import: MainConcept NTSC HDTV 1080i Export: Adobe Media Encoder – Video – Windows Media Video 9 Advanced Profile Encoding Passes: one Bitrate Mode: Constant Frame: 1920×1080 Frame Rate: 29.97 Maximum Bitrate [kbps]: 2000 Image Quality: 50.00 – Audio – Windows Media Audio 10 Professional Audio Format: 160 kbps, 44.1 kHz, 2 channel 16 bit (A/V) CBR |
HD Playback (Blue Ray) | PowerDVD HD 7.3 Blue Ray – Disc (James Bond – Casino Royale) Video Mode: 1920x1080p (full screen) Codec: H.264 |
Приложения | |
Grisoft AVG Anti-Virus | Version: 7.5.467 Virus base: 269.6.1./776 Benchmark Scan: Vista Enterprise (Windows folder) 8 GB |
WinRAR | Version 3.70 BETA 8 Compression = Best Dictionary = 4096 KB Benchmark: THG-Workload |
Autodesk 3D Studio Max 9 | Version: 9.0 Rendering a Dragon picture rendering HTDV 1920×1080 |
Maxon Cinema 4D Release 10 | Version: 10.008 Rendering from a scene Water drop at a Rose Resolution: 1280 x 1024 – 8Bit (50 frames) |
Adobe Photoshop CS 3 | Version: 10.0×20070321 Filtering from a 69 MB TIF-Photo Benchmark: Tomshardware-Benchmark V1.0.0.4 Programmed by Tomshardware using Delphi 2006 Filters: Crosshatch Glass Sumi-e Accented Edges Angled Strokes Sprayed Strokes |
Adobe Acrobat 7 Professional | Version: 7.0.9 Settings: High Quality Print Compatibility: Acrobat 8 (PDF 1.7) Security: High (128-bit RC4) |
Microsoft PowerPoint 2007 | Version: 2007 PPT to PDF PowerPoint Document (115 Pages) Adobe PDF-Printer |
Deep Fritz 10 | Version: Nov 16 2006 |
Синтетические тесты | |
3DMark06 | Version: 1.10 1280×1024 – 32 bit Graphics and CPU Default Benchmark |
PCMark05 Pro | Version: 1.2.0 CPU and Memory Tests Windows Media Player 10.00.00.3646 Windows Media Encoder 9.00.00.2980 |
SiSoftware Sandra XI SP1c | Version 2007.5.11.40 CPU Test = CPU Arithmetic / MultiMedia Memory Test = Bandwidth Benchmark |
3D-игры
3D-рендеринг
Приложения
Кодирование аудио
Синтетические тесты
Синтетические тесты, продолжение
Кодирование видео
Заключение
Традиционно на Tom’s Hardware Guide мы очень сдержанно относимся к новым продуктам. Однако наш первый тестовый образец нового Core 2 Extreme QX9650 на основе архитектуры Penryn/Yorkfield доказывает, что Intel проделала не просто хорошую, а великолепную работу. Новые четырёхядерные процессоры, которые вскоре выйдут на рынок, теперь лидируют по эффективности энергопотребления. В режиме бездействия новый процессор потребляет всего 3,78 Вт – немыслимое значение для high-end процессора. Даже процессоры AMD Sempron начального уровня не могут подойти к таким цифрам, несмотря на то, что используют всего одно ядро.
Тепловыделение упало настолько сильно, что новые системы на основе Penryn/Yorkfield будут работать тише и холоднее, причём даже после разгона. Мы можем смело утверждать, что Intel выполнила обещание, данное на IDF, по поводу потенциала 45-нм процессоров по разгону. Потенциал Penryn/Yorkfield находится на уровень выше предыдущего поколения Core 2.
Интеграция технологии High-K Metal Gate в техпроцесс позволила Intel заметно улучшить и так очень хороший процессор Core 2 (Conroe), сделав его ещё более эффективным по энергопотреблению, и, вместе с тем, обеспечив потенциал по разгону. Благодаря новому набору инструкций SSE4 данное поколение процессоров способно ускорять задачи кодирования и обработки видео не менее, чем на 40%. При равных тактовых частотах QX9650 оказывается быстрее предшественника QX6850. Процессоры Core 2 на ядре Penryn/Yorkfield – это не просто версии с уменьшенной площадью кристалла, это полностью новые процессоры, начиная буквально с транзисторов.
Как обычно, процессоры Extreme Edition будут продаваться по экстремальной цене в 1 000 евро. Если вы хотите приобрести менее дорогой процессор на Penryn/Yorkfield, то придётся подождать следующего года, поскольку расширение модельного ряда запланировано на первый квартал 2008 года.
Разница в производительности между Intel и AMD возросла ещё больше. Теперь топовые модели обеих компаний отличаются по скорости почти на 50%. Сегодня AMD попросту нечем ответить. ИТ-индустрия с нетерпением ждёт первый четырёхядерный процессор AMD для настольных ПК под названием Phenom, который должен выйти в декабре. Вместе с тем, Intel уже прощается с первым поколением четырёхядерных процессоров, представляя второе. AMD придётся сделать никак не меньше, чем технологическое чудо, если компания желает стоять на одной ступеньке с Intel. Даже трёхядерных процессоров, которые являются четырёхядерными с дефектным или отключённым четвёртым ядром, на рынке не найти. Теоретически, мы должны были использовать платформу AMD 4×4 для данного сравнения, поскольку она тоже состоит из четырёх ядер, пусть и в двух процессорных сокетах. Подобная платформа, состоящая из двух процессоров Athlon X2 FX 74 и материнской платы, стоит всего 880 евро. Впрочем, в итоге мы всё же решили отказаться от этой платформы, сконцентрировавшись на односокетных системах, предназначенных для массового рынка. Тем более, что AMD не смогла предоставить платформу 4×4 вовремя.
Если присмотреться к текущему ядру Penryn, то возникает мысль о восьмиядерных системах. Благодаря грядущим версиям с 3 Мбайт кэша L2 Intel может легко сочетать четыре двуядерных кристалла в одной упаковке CPU. Даже тепловыделение такой конфигурации останется в разумных пределах.
Восьмиядерные 45-нм процессоры не кажутся такими уж недостижимыми.