Какая технология ускорения лучше?
В отличие от автомобилей, технологии увеличения производительности AMD и Intel не требуют дополнительных комплектующих, таких как турбоагрегаты. Шестиядерные процессоры просто увеличивают свои тактовые частоты, чтобы обеспечить более высокую производительность под пиковыми нагрузками. Мы решили сравнить реализации Turbo Boost и Turbo Core – какая технология работает лучше?
Нажмите на картинку для увеличения.
Инициативам следует отдавать должное; поэтому мы хотели бы отметить тот факт, что Intel первой представила данную функцию увеличения производительности. Архитектура Nehalem и семейство процессоров Core i7-900 впервые получили поддержку Turbo Boost в конце 2008 года. Технология позволяет ускорять все четыре ядра на один шаг множителя и одно-два ядра на два шага множителя (в зависимости от конкретной модели). Позже в 2009 году четырёхъядерные процессоры Lynnfield Core i5/i7 для Socket LGA 1156 получили более мощную реализацию Turbo Boost, когда одно-два ядра могли ускоряться на целых четыре (!) шага. У линейки 800 прирост тактовой частоты составляет даже пять шагов при нагрузке на одно ядро. Один шаг соответствует 133 МГц на штатной тактовой частоте, так что мы получили динамическое увеличение частоты на 133-533 МГц. Turbo Boost также поддерживается на двуядерных процессорах Clarkdale Core i5.
AMD представила технологию Turbo Core вместе с шестиядерными процессорами Phenom II X6, но в будущем другие модели тоже обзаведутся этой функцией. Если реализация Intel позволяет CPU ускорять одно, два или большее число ядер, то подход AMD заключается в ускорении только трёх ядер в случае 6-ядерного CPU и двух ядер у четырёхъядерных процессоров.
Мы взяли последние шестиядерные процессоры AMD Phenom II X6 и Core i7-980X, чтобы выяснить, какая из реализации Turbo лучше всего покажет себя в наших тестах как по производительности, так и по эффективности. Поскольку уровень производительности двух процессоров существенно отличается – у Intel производительность выше – мы решили сравнить результаты тестов с технологией Turbo и без неё, после чего нормализовать результаты, взяв за 100% уровень без Turbo. Это позволит нам сравнить относительное влияние ускорения Turbo на процессоры AMD и Intel, пусть даже абсолютная производительность отличается.
AMD: Turbo Core
Нажмите на картинку для увеличения.
Технология Turbo Core доступна на процессорах AMD Phenom II X4 и X6, изготавливаемых по последнему 45-нм техпроцессу, а именно на 6-ядерных Thuban и 4-ядерных Zosma. Phenom II X4 960T с номинальной тактовой частотой 3,0 ГГц будет ускорять два ядра до частоты 3,4 ГГц, если есть резерв по тепловому пакету (плюс 400 МГц), а также соответствующая нагрузка приложений. Процессоры Phenom II X6 увеличивают тактовую частоту на 500 МГц за исключением топовой модели 1090T, которая получает прирост на 400 МГц – с 3,2 до 3,6 ГГц.
Данную реализацию можно назвать добавлением к функции Cool’n’Quiet, которая снижает тактовую частоту и напряжение, если нагрузка на процессор невелика. Если половина ядер находятся в состоянии бездействия, то система снижает их тактовую частоту до минимума Cool’n’Quiet 800 МГц. Следующий шаг заключается в увеличении напряжения оставшихся активных ядер вместе с приростом тактовой частоты до 500 МГц, как мы уже указывали выше.
Недостаток заключается в том, что немногие нагрузки будут нагружать три ядра на 100%, приводя к увеличению тактовой частоты до 3,6 ГГц. Мы обнаружили, что сценарий с нагрузкой на два ядра более реалистичный, поэтому данная функция будет лучше работать на CPU с двумя ускоряемыми ядрами, такими как Phenom II X4 960T на ядре Zosma.
Пользователи процессоров Black Edition могут управлять технологией AMD Turbo Core, регулируя количество ускоряемых ядер, что усложняет наш анализ, но вместе с тем позволяет энтузиастам более тонко настраивать свои системы.
Intel: Turbo Boost
Нажмите на картинку для увеличения.
Реализация Intel лучше всего показывает себя на 32-нм процессорах, поскольку Turbo Boost даёт намного более существенный прирост тактовых частот за исключением нового шестиядерного Core i7-980X на дизайне Gulftown, который ограничен приростом 266 МГц для одного ядра и 133 МГц для двух или большего количества ядер. Учитывая тот факт, что потенциал разгона у процессоров Intel весьма существенный, подобный слабый прирост действительно можно назвать обидным для энтузиастов, и это следует учитывать при сравнении с AMD: помните, что процессор Phenom II X6 1090T может ускорять до трёх ядер на шаг до 400 МГц.
Специальные запорные транзисторы Intel могут полностью отключать отдельные ядра, что позволяет устранить их из теплового пакета CPU. Именно поэтому технология Turbo Boost может увеличивать тактовую частоту других ядер, поскольку меньшее число ядер могут работать на более высокой тактовой частоте, прежде чем они упрутся в тот же тепловой пакет.
Если AMD просто снижает тактовую частоту и напряжение для неактивных ядер, то Intel может физически их выключать. В теории это должно дать меньшее энергопотребление, а вместе с возможностью динамически ускорять одно или несколько ядер и более высокую производительность в целом.
У Intel есть ещё одно преимущество, которое следует упомянуть: если шестиядерные процессоры AMD получают доступ к 6 Мбайт кэша L3, то нынешняя архитектура Intel предоставляет более существенный объём 12 Мбайт. Если выключать отдельные ядра, то оставшиеся ядра CPU будут по-прежнему получать доступ к полному объёму 12 Мбайт кэша L3. Это должно дать преимущества для приложений, работающих с ограниченным количеством данных и с малым числом потоков.
Тестовая конфигурация
Аппаратное программное обеспечение | |
Материнская плата (Socket AMD3) | Asus Crosshair IV Formula (Rev. 1.0), чипсет: AMD 890FX, BIOS: 0505 (04/02/2010) |
Материнская плата (Socket LGA1366) | MSI X58 Pro-E, чипсет: Intel X58 |
CPU AMD I | AMD Phenom II X6 1090T (45 нм, 3,2 ГГц, 6x 512 кбайт L2 и 6 Мбайт L3, TDP 125 Вт, Rev. C3) |
CPU Intel II | Intel Core i7 Extreme 980X (32 нм, 3,33 ГГц, 6x 256 кбайт L2 и 12 Мбайт L3, TDP 130 Вт) |
Память DDR3 (два канала) | 2x 2 Гбайт DDR3-1600 (OCZ3G2000LV4GK 8-8-8-24) |
Память DDR3 (три канала) | 3x 2 Гбайт DDR3-1600 (Corsair TR3X6G-1600C8D 8-8-8-24) |
Видеокарта | Sapphire Radeon HD 5850, GPU: Cypress (725 МГц), память: 1024 Мбайт GDDR5 (2000 МГц), потоковые процессоры: 1440 |
Жёсткий диск | Western Digital VelociRaptor, 600 GB (WD6000HLHX), 10 000 об/мин, SATA/600, кэш 32 Мбайт |
Блок питания | PC Power & Cooling, Silencer 750EPS12V 750 Вт |
Системное ПО и драйверы | |
Операционная система | Windows Ultimate x64, обновлена 3 марта 2010 |
Драйвер чипсета Intel | Chipset Installation Utility Ver. 9.1.1.1025 |
Драйвер Intel Storage | Matrix Storage Drivers Ver. 8.9.0.1023 |
Asus Crosshair IV Formula: чипсет 890FX и Socket AM3 для процессоров AMD Phenom II X6. Нажмите на картинку для увеличения.
MSI X58 Pro-E: чипсет X58 и Socket LGA 1366 для Intel Core i7-980X. Нажмите на картинку для увеличения.
Тесты и настройки
Кодирование аудио и видео | |
iTunes | Version: 9.0.3.15 Audio CD (“Terminator II” SE), 53 min. Convert to AAC audio format |
Lame MP3 | Version 3.98.3 Audio CD “Terminator II SE”, 53 min convert wav to mp3 audio format Command: -b 160 –nores (160 kbps) |
Handbrake CLI | Version: 0.94 Video: Big Buck Bunny (720×480, 23.972 frames) 5 Minutes Audio: Dolby Digital, 48000 Hz, 6-Kanal, English to Video: AVC1 Audio1: AC3 Audio2: AAC (High Profile) |
Mainconcept Reference v2 | Version: 2.0.0.1555 MPEG2 to H.264 MainConcept H.264/AVC Codec 28 sec HDTV 1920×1080 (MPEG2) Audio: MPEG2 (44.1 kHz, 2 Channel, 16 Bit, 224 kbps) Codec: H.264 Pro Mode: PAL 50i (25 FPS) Profile: H.264 BD HDMV |
Приложения | |
7-Zip | Version 9.1 beta LZMA2 Syntax “a -t7z -r -m0=LZMA2 -mx=5” Benchmark: 2010-THG-Workload |
Winrar | Version 3.92 RAR Syntax “winrar a -r -m3” Benchmark: 2010-THG-Workload |
Winzip 14 | Version 14.0 Pro (8652) WinZIP Commandline Version 3 ZIPX Syntax “-a -ez -p -r” Benchmark: 2010-THG-Workload |
Autodesk 3d Studio Max 2010 | Version: 10 x64 Rendering Space Flyby Mentalray (SPECapc_3dsmax9) Frame: 248 Resolution: 1440 x 1080 |
Cinebench 11.5 | Version 11.5 Build CB25720DEMO CPU Test single and multi threaded |
Adobe Photoshop CS 4 (64-Bit) | Version: 11 Filtering a 16 MB TIF (15000×7266) Filters: Radial Blur (Amount: 10; Method: zoom; Quality: good) Shape Blur (Radius: 46 px; custom shape: Trademark sysmbol) Median (Radius: 1px) Polar Coordinates (Rectangular to Polar) |
Adobe Acrobat 9 Professional | Version: 9.0.0 (Extended) == Printing Preferenced Menu == Default Settings: Standard == Adobe PDF Security – Edit Menu == Encrypt all documents (128 bit RC4) Open Password: 123 Permissions Password: 321 |
Microsoft Powerpoint 2007 | Version: 2007 SP2 PPT to PDF Powerpoint Document (115 Pages) Adobe PDF-Printer |
Fritz | Fritz Chess Benchmark Version 4.3.2 |
Синтетические тесты | |
3DMark Vantage | Version: 1.02 Patch 1901 Options: Performance Graphics Test 1 Graphics Test 2 CPU Test 1 CPU Test 2 |
PCMark Vantage | Version: 1.0.2.0 Patch 1901 PCMark Benchmark Memories Benchmark |
SiSoftware Sandra 2010 | Version: 2010.1.16.10 Processor Arithmetic, Cryptography, Memory Bandwidth |
Синтетические тесты
Решение AMD даёт чуть лучшую производительность в Sandra, но разница слишком мала, чтобы воспринимать её всерьёз.
3DMark и PCMark Vantage
3DMark, тоже синтетический тест, демонстрирует преимущества от архитектуры Intel и технологии Turbo Boost.
Тест PCMark Vantage явно говорит о том, что подход Intel даёт больший прирост производительности, а выигрыша от AMD Turbo Core нет.
Приложения
Тест 3DS Max интенсивно использует многопоточность, поэтому он не выигрывает от ускорения тактовой частоты при нагрузке на малое число ядер.
Тест 7-Zip оптимизирован под многопоточность, но данная оптимизация ограничена, поскольку технология Intel Turbo Boost демонстрирует приятный прирост производительности.
Cinebench в однопоточном прогоне работает на процессоре AMD с Turbo Core быстрее, чем на процессоре Intel с технологией Turbo Boost. Дело в том, что Intel даёт прирост всего 266 МГц, а процессор AMD увеличивает частоту трёх ядер на более существенный уровень 400 МГц.
При переходе на многопоточный прогон мы не наблюдаем особой разницы между разными режимами.
Fritz – шахматное приложение, которое больше выигрывает от AMD Turbo Core.
То же самое касается создания документа PDF с помощью Adobe Acrobat 9 из презентации Microsoft Powerpoint. Поскольку оба приложения не могут выиграть от нескольких ядер, ускорение трёх ядер AMD на 400 МГц даёт более ощутимый эффект.
Photoshop CS4 интенсивно использует многопоточность, и в данном случае прирост 133 МГц у технологии Intel Turbo Boost сказывается сильнее.
Архиватор WinRAR оптимизирован под многопоточность, и он сильнее выигрывает от поддержки Turbo Boost, чем Turbo Core. Впрочем, обе технологии сказываются на производительности положительно.
WinZip также работает быстрее на платформе AMD, поскольку включается ускорение на 400 МГц, которое остаётся активным при работе данного однопоточного архиватора. 266-МГц прирост Intel в данном случае даёт меньший эффект.
Кодирование аудио и видео
iTunes – однопоточное приложение, поэтому оно получает более ощутимый прирост на процессоре Phenom II X6 с активной Turbo Core.
То же самое можно сказать и про Lame.
Утилита Mainconcept, которая хорошо оптимизирована под многопоточность, сильнее выигрывает от Turbo Boost, которая срабатывает даже при нагрузке на множество ядер.
То же самое можно сказать и про утилиту Handbrake, где процессор AMD сразу же упирается в ограничение нагрузки на все шесть ядер, и Turbo Core уже не срабатывает.
Энергопотребление
Как и можно было ожидать, активация функций Turbo не влияет на энергопотребление в режиме бездействия.
Впрочем, пиковое энергопотребление увеличивается – вполне логично для Turbo Boost и Turbo Core. Но разница, между тем, крайне невелика.
Эффективность
Время выполнения нашего тестового прогона на платформе AMD снижается сильнее, поскольку больше приложений выигрывают от реализации AMD Turbo Core, чем от Intel Turbo Boost.
Среднее энергопотребление оказывается существенно выше у системы AMD с активной Turbo Core.
Суммарная затраченная энергия у платформы Intel оказалась точно такой же. Весьма интересно, так как Core i7-980X с активной Turbo Boost всё равно оказывается быстрее. Активная технология AMD Turbo Core с процессором Phenom II X6 также даёт больше производительности, но при этом требует больше энергии.
В итоге эффективность решения Intel не изменилась: суммарная затраченная энергия одинаковая, но среднее энергопотребление под нагрузкой оказалось выше. И эффективность стала одинаковой. Представьте себе автомобиль, который быстрее доедет до пункта назначения, но расход топлива на 100 км не изменится. Реализация AMD Turbo Core, с другой стороны, приводит к ухудшению эффективности. Время выполнения прогона уменьшается, но среднее энергопотребление и общая затраченная энергия увеличиваются сильнее.
Заключение
Мы можем рекомендовать AMD и Intel продолжать работать над своими функциями Turbo. Мы обнаружили, что обе технологии справляются со своей работой по увеличению производительности. Поскольку подходы AMD и Intel отличаются, мы обнаружили различия в реальных приложениях.
Начнём с Intel, поскольку Turbo Boost присутствует на рынке дольше. 3,2-ГГц шестиядерный Core i7-980X ускоряет одно ядро на 266 МГц, если запущено однопоточное приложение с максимальной нагрузкой, а также может ускорять все шесть ядер на дополнительные 133 МГц, если позволяет тепловой пакет. В этом заключается основное отличие от решения AMD, поскольку Core i7 Gulftown способен ускорять как однопоточные приложения, так и high-end многопоточные программы. С точки зрения запуска многопоточных приложений технология Turbo Boost имеет большее значение, чем Turbo Core, поскольку от неё выигрывают все типы нагрузки по сравнению с номинальной тактовой частотой.
AMD Turbo Core умеет выполнять только один режим ускорения: она увеличивает тактовую частоту трёх ядер вплоть до 400 МГц в случае шестиядерного 3,2-ГГц Phenom II X6 1090T. Это означает, что все приложения, способные использовать не более трёх ядер, получают заметное ускорение. Мы обнаружили, что прирост производительности оказался выше, чем у платформы Intel, так как увеличение на 400 МГц более заметно, чем прирост на 133/266 МГц в случае процессора Intel. Недостатком будет отсутствие ускорения, если интенсивно нагружаются четыре-шесть ядер процессора.
Заключение будет очевидным: ни одно из решений нельзя признать явным победителем. Технология Intel Turbo Boost оказалась лучше в “тяжёлых” многопоточных окружениях, а подход AMD лучше показал себя в приложениях, не так хорошо оптимизированных под многопоточность. Наилучшая реализация Turbo, на наш взгляд, должна быть более последовательной: одно ядро следует ускорять даже сильнее, чем на 400 МГц в случае AMD, два ядра – примерно на 400 МГц, три и четыре ядра на какой-то меньший уровень, а все остальные ядра – настолько, насколько позволит бюджет теплового пакета.