Шесть ядер и 32 нм против четырёх ядер и 45 нм
Конечно, мы знаем о том, что у AMD есть собственные планы по выпуску шестиядерного Phenom II X6, но Intel сделала свой ход первой, представив шестиядерную модель раньше AMD. Core i7-980X, ранее известный как Gulftown, вскоре должен появиться в розничной продаже для систем LGA 1366, при этом он обещает новые уровни производительности в многопоточных приложениях, способных выиграть от увеличенного параллелизма и интегрированного на кристалл общего кэша L3.
Благодаря тому, что новый шестиядерный процессор базируется на 32-нм техпроцессе, он штатно работает на той же частоте 3,33 ГГц, что и четырёхъядерный Core i7-975 Extreme Edition, в том же тепловом пакете 130 Вт. Даёт ли это больше производительности на ватт? Сложно сказать, не проведя глубокий анализ производительности. В конце концов, 1,17 млрд. транзисторов чипа уместились даже на меньшей площади кристалла, чем у предшественника.
Нажмите на картинку для увеличения.
Честно говоря, мы несколько скептически относимся к первому месту Intel, поскольку многие спецификации платформ больше подходят для “бюджетных” решений. Так, вы не получите полноценные интерфейсы PCI Express 2.0 в чипах PCH (platform controller hub), несмотря на то, что Intel рекламирует их как интерфейсы уровня PCIe 2.0. Да и процессоры Clarkdale не могут разделять свои 16 линий PCIe 2.0 на два интерфейса x8 в чипсетах H55/H57, хотя без проблем делают это в P55. Да и не будем забывать о недавнем экономичном процессоре Core i5-750S. Хотя он действительно экономит энергию, вам придётся смириться с пониженной производительностью (и более высокой ценой CPU), а это приводит к снижению эффективности (соотношения производительности на ватт). Так что мы решили внимательно подойти к тому, как работает Gulftown в отношении эффективности.
Обновляем интерфейс LGA 1366
Наконец, у нас появилась ясная причина, почему стоит покупать платформу для энтузиастов Intel X58 Express. Это вполне ощутимый апгрейд, который был неочевиден в момент запуска платформы в 2008 году. Два интерфейса x16 PCI Express 2.0 у Intel X58 важны только для энтузиастов с несколькими видеокартами, но сегодня вполне понятно, что Intel не планирует представить шестиядерные CPU для массовой платформы LGA 1156 в ближайшее время. Core i7-980X даёт платформе LGA 1366 “второе дыхание”, причём по более привлекательной цене материнских плат, чем год назад. Действительно, в то время цена приличной материнской платы на Intel X58 составляла $350 и выше. Сегодня же материнские платы Intel X58 можно купить по цене от $150 (от 6 тыс. рублей в России). Кроме того, сегодня можно купить вполне доступный четырёхъядерный Core i7, а апгрейд на шесть ядер выполнить, например, через год.
За некоторыми исключениями, большинству производителей материнских плат не придётся выпускать новые версии существующих продуктов LGA 1366. Но, как правило, вам потребуется обновлённая версия BIOS с поддержкой Gulftown, нужно будет прошить её в материнскую плату, после чего можно будет устанавливать нового шестиядерного “монстра”.
Производительность против эффективности
Мы уже опубликовали статью, посвящённую производительности и разгону нового процессора Core i7-980X. Gulftown показывает существенные преимущества по производительности на программном обеспечении, оптимизированном под многопоточность, и новый Core i7-980X хорошо работает на номинальной частоте до 4,13 ГГц. Сейчас же настало время проанализировать эффективность энергопотребления новинки.
Gulftown против Bloomfield: 6/4 ядра, 32/45-нм техпроцесс
Нажмите на картинку для увеличения.
Чтобы всё было честным, следует отметить, что шестиядерный AMD Opteron с кодовым названием Istanbul доступен ещё с июня 2009 года. Однако Core i7-980X – это первый шестиядерный процессор для настольного рынка, да и в свете лучшей оптимизации программ под многоядерные окружения, чем пять лет назад, новый CPU даёт новый уровень производительности. В теории 50% прирост вычислительных блоков даст 50% увеличение производительности. К счастью, в реальных условиях оптимизированные под многопоточность приложения дают схожий рост.
Технология Hyper-Threading, которая максимизирует эффективность CPU, обеспечивая два логических процессора для каждого физического ядра, может работать как с пользой, так и с вредом для нового CPU. Если приложение способно использовать восемь ядер, то система может использовать не идеальную комбинацию (шесть физических ядер и два виртуальных), а менее удачную. В операционных системах Windows 7 и Server 2008 R2 сделаны некоторые улучшения, оптимизирующие нагрузку физических ядер, но мы рассмотрим разницу в производительности при активной и неактивной технологиях Hyper-Threading в грядущей статье.
Мы знаем, что новый Core i7-980X остаётся в пределах того же теплового пакета 130 Вт, что и 45-нм четырёхъядерный Core i7-975 Extreme. Но весь вопрос в том, как энергопотребление при пиковой нагрузке всех ядер соотносится с энергопотреблением четырёх ядер Bloomfield? И какова ситуация в режиме бездействия? Intel весьма успешно поработала над уменьшениями токов утечки, то есть 32-нм шестиядерный процессор может потреблять в режиме бездействия и под нагрузкой даже меньше энергии, чем 45-нм четырёхъядерный. Это соответствует предварительной информации об энергопотреблении, которую мы получили в первом обзоре Gulftown.
Шестиядерный процессор Gulftown по-прежнему работает на хорошо известной платформе Intel X58. Всё, что вам потребуется – обновление BIOS.
Тестовая конфигурация
Системное аппаратное обеспечение | |
Материнская плата (Socket LGA1366) | Gigabyte EX58-UD4P (Rev. 1.0), чипсет: Intel X58; BIOS: F12 (02/11/2009) |
CPU Intel | Intel Core i7-975 Extreme (45 нм, 3,33 ГГц, 4 x 256 кбайт кэша L2 и 8 Мбайт кэша L3, TDP 130 Вт, Rev. D0) |
CPU Intel II | Intel Core i7-980X Extreme (32 нм, 3,33 ГГц, 6 x 256 кбайт кэша L2 и 12 Мбайт кэша L3, TDP 130 Вт) |
Память DDR3 | 3 x 2 Гбайт DDR3-1600 (Corsair TR3X6G-1600C8D 8-8-8-24) |
Видеокарта | Sapphire Radeon HD 5850, GPU: Cypress (725 МГц); видеопамять: 1024 Мбайт GDDR5; потоковые ядра: 1440 |
Жёсткий диск | Western Digital VelociRaptor, 300 Гбайт (WD3000HLFS), 10 000 об/мин, SATA/300, кэш 16 Мбайт |
Блок питания | PC Power & Cooling, Silencer 750EPS12V 750W |
Системное ПО и драйверы | |
Операционная система | Windows Vista Enterprise Version 6.0 x64, Service Pack 2 (Build 6000) |
Драйверы и настройки | |
Драйверы чипсета Intel | Chipset Installation Utility Ver. 9.1.1.1025 |
Драйверы подсистемы накопителей Intel | Matrix Storage Drivers Ver. 8.8.0.1009 |
Тесты и настройки
Аудио | |
iTunes | Version: 8.1.0.52 Audio CD (“Terminator II” SE), 53 min. Convert to AAC audio format |
Lame MP3 | Version 3.98 Audio CD “Terminator II SE”, 53 min. convert WAV to MP3 audio format Command: -b 160 –nores (160 Kbps) |
Видео | |
TMPGEnc Xpress 4.6 | Version: 4.6.3.268 Video: Terminator 2 SE DVD (720×576, 16:9) 5 Minutes Audio: Dolby Digital, 48000 Hz, 6-channel, English Advanced Acoustic Engine MP3 Encoder (160 Kbps, 44.1 KHz) |
DivX 6.8.5 | Version: 6.8.5 == Main Menu == default == Codec Menu == Encoding mode: Insane Quality Enhanced multithreading Enabled using SSE4 Quarter-pixel search == Video Menu == Quantization: MPEG-2 |
XviD 1.2.1 | Version: 1.2.1 Other Options / Encoder Menu – Display encoding status = off |
Mainconcept Reference 1.6.1 | Version: 1.6.1 MPEG-2 to MPEG-2 (H.264) MainConcept H.264/AVC Codec 28 sec. HDTV 1920×1080 (MPEG-2) Audio: MPEG-2 (44.1 kHz, 2-channel, 16-bit, 224 Kbps) Codec: H.264 Mode: PAL (25 FPS) Profile: Settings for eight threads |
Приложения | |
Grisoft AVG Anti-Virus 8 | Version: 8.5.287 Virus base: 270.12.16/2094 Benchmark Scan: some compressed ZIP and RAR archives |
WinRAR 3.9 | Version 3.90 x64 BETA 1 Compression = Best Benchmark: THG-Workload |
WinZip 12 | Version 12.0 (8252) WinZip Commandline Version 3 Compression = Best Dictionary = 4096KB Benchmark: THG-Workload |
Autodesk 3ds Max 2009 | Version: 9 x64 Rendering Dragon Image Resolution: 1920 x 1280 (frame 1-5) |
Adobe Photoshop CS4 (64-Bit) | Version: 11 Filtering a 16MB TIF (15000×7266) Filters: Radial Blur (Amount: 10; Method: zoom; Quality: good) Shape Blur (Radius: 46 px; custom shape: Trademark sysmbol) Median (Radius: 1px) Polar Coordinates (Rectangular to Polar) |
Adobe Acrobat 9 Professional | Version: 9.0.0 (Extended) == Printing Preferenced Menu == Default Settings: Standard == Adobe PDF Security – Edit Menu == Encrypt all documents (128 bit RC4) Open Password: 123 Permissions Password: 321 |
Microsoft PowerPoint 2007 | Version: 2007 SP2 PPT to PDF PowerPoint Document (115 Pages) Adobe PDF-Printer |
Deep Fritz 11 | Version: 11 Fritz Chess Benchmark Version 4.2 |
Производительность на 3,33 ГГц
Мы добавили информацию о производительности новинки для облегчения сравнения. Хотя мы получили другие результаты, чем в нашем первом тесте i7-980X (мы проводили тесты эффективности в другой тестовой лаборатории, на другом наборе тестов, с другими настройками и другим “железом”), соотношение между производительностью Core i7-975 и i7-980X осталось примерно таким же.
Photoshop CS4 хорошо масштабируется с появлением дополнительных ядер и даёт 28% прирост производительности на шестиядерном Gulftown.
Энергопотребление
Энергопотребление в режиме бездействия оказалась чуть меньше, чем на конфигурации в наших первых тестах производительности Core i7-980X, что связано, главным образом, с другой материнской платой и другим блоком питания. Приятно радует 101 Вт у четырёхъядерного Core i7-975 по сравнению с 99 Вт у нового шестиядерного 32-нм Core i7-980X. Новый чип явно обладает большим потенциалом производительности при меньшем энергопотреблении в режиме бездействия.
Энергопотребление под пиковой нагрузкой составило 241 Вт для 45-нм четырёхъядерного процессора, и при этом оно ничуть не увеличилось при переходе на шестиядерный чип, который работает на точно такой же номинальной тактовой частоте 3,33 ГГц и 3,46/3,6 ГГц в режиме Turbo Mode. Как это отразится на среднем энергопотреблении при выполнении нашей тестовой нагрузки?
Мы измерили суммарную потреблённую энергию в ватт-часах на выполнение нашей тестовой нагрузки, которая включает последовательное выполнение всех тестов, представленных выше. Как видим, количество энергии оказалось в случае нового шестиядерного CPU существенно меньшим. Дело в том, что новый CPU справляется со многими тестами намного быстрее, и переходит в режим бездействия раньше. В итоге мы получили 12,4% экономию по затраченной энергии.
Среднее энергопотребление тоже оказалось ниже. Мы получили 134,4 Вт по сравнению со 147,5 Вт, что даёт 8,9% разницу в пользу нового Core i7-980X. Давайте посмотрим, как эта экономия скажется на эффективности.
Эффективность
На диаграмме приведён результат производительности, который мы использовали для расчёта эффективности – а именно общее время выполнения нашего тестового прогона.
А вот и цель нашего исследования. Наш анализ эффективности (соотношения производительности приложений на ватт) показал серьёзное преимущество нового шестиядерного процессора. Core i7-980X справляется с рабочим заданием быстрее и требует при этом меньше энергии, что даёт намного большую эффективность.
Нажмите на картинку для увеличения.
Диаграмма эффективности показывает мгновенное энергопотребление в любой момент выполнения теста, а также время, которое потребовалось на выполнение задания. Вполне наглядно видно, что новый процессор требует существенно меньшей энергии (красный график), чем четырёхъядерный Core i7-975. Можно видеть, что есть как многопоточные задачи (более высокие пики и стабильные участки), так и менее оптимизированные приложения (меньший уровень энергопотребления).
Заключение
Следует отметить, что 32-нм производство Intel, похоже, получилось крайне удачным. Дизайны Clarkdale и Gulftown на новом техпроцессе продолжают радовать нас впечатляющей эффективностью. Двуядерные процессоры Core i5 уже доказали, что сегодня вполне достижимы высокие тактовые частоты при низком энергопотреблении, а новый шестиядерный Core i7-980X для энтузиастов под сокет LGA 1366 предлагает самую совершенную технологию производства и на high-end секторе. Следующим логическим шагом будет представление профессиональной линейки 32-нм процессоров Xeon.
Наш изначальный скептицизм полностью развеялся. Процессор Gulftown не только обеспечивает прекрасную производительность – сегодня вы не найдёте процессора быстрее – но и обходит предыдущего флагмана Core i7-975 Extreme Edition по эффективности и производительности на ватт. Мы не стали включать в тесты предложения AMD, поскольку разница по производительности, эффективности, ценам слишком велика. Так, по цене одного Core i7 Extreme Edition вы можете купить сегодня пять флагманских процессоров AMD Phenom II X4.
Gulftown оказывается, по крайней мере, не медленнее Bloomfield во всех тестах, причём он обходит четырёхъядерную архитектуру, если приложение способно нагрузить больше четырёх потоков. В ближайшее время мы опубликуем отдельную статью, посвящённую влиянию Hyper-Threading, но если вы планируете потратить $1000 на один только процессор, то все доводы сегодня складываются в пользу новейшего шестиядерного Core i7-980X.
Кроме того, что процессор быстрый, Gulftown также потребляет меньше энергии в режиме бездействия и под пиковой нагрузкой, да и среднее энергопотребление при выполнении нашей тестовой нагрузки тоже оказалось ниже. Добавление новых инструкций Intel AES позволяет ускорить операции шифрования и расшифровки – тоже приятный бонус. Впрочем, более высокие частоты Turbo Boost явно помогли бы ещё сильнее увеличить эффективность процессора при выполнении рядовых приложений, нагружающих одно или два ядра.
Больше Turbo Boost, пожалуйста!
Было бы неплохо получить для столь мощного процессора более агрессивную реализацию Turbo Boost. На данный момент Core i7-980X не работает быстрее 3,60 ГГц при нагрузке на одно ядро, хотя, как мы обнаружили, этот 32-нм процессор прекрасно может работать при номинальной частоте 4,13 ГГц (при нагрузке всех шести ядер) и 4,4 ГГц при активной Turbo Boost. По цене $1000, как нам кажется, частота Turbo Boost 4 ГГц для одного или двух активных ядер была бы вполне оправдана, поскольку теоретически возможно, что двуядерный Core i5 обойдёт i7-980X в однопоточных приложениях, так как его максимальная частота Turbo составляет 3,73 ГГц.