Энергопотребление вчера и сегодня: очередь AMD
В начале прошлого месяца мы опубликовали интересную статью “Процессоры Intel: сравнительные тесты энергопотребления“, где сравнивались производительность, энергопотребление и соотношение производительности на ватт и на ватт-час четырёх разных процессоров Intel. Мы начали со старого Pentium 4 и поднялись вплоть до Core 2 Quad, причём все тесты проводились на одинаковой тактовой частоте 3,0 ГГц. Результаты оказались впечатляющими, поскольку современные процессоры не только обеспечивают существенно более высокую производительность, но и намного лучшую эффективность энергопотребления, чем старое поколение Pentium 4/D.
Конечно, нам было очень интересно посмотреть, наблюдается ли такая же тенденция у AMD? Обычно мы начинаем любое сравнение в алфавитном порядке, поэтому вполне логично было бы начать анализ соотношения производительности на ватт именно с AMD. Однако история Intel показалась нам изначально более интересной, так как компания бросалась из одной крайности в другую, заменяя уже дряхлеющий “линкор” Pentium 4 более эффективными и скоростными “крейсерами” Core 2. Со стороны AMD тоже были существенные продвижения, включая переход на 65-нм техпроцесс и на четырёхъядерные процессоры Phenom, но эти изменения можно считать больше эволюционными, нежели революционными.
Ещё одна причина рассмотрения первыми процессоров Intel кроется в лёгкости этого сравнения. Достаточно просто найти модели Pentium 4, Pentium D, Core 2 Duo и чётырёхъядерный Core 2 Quad для одного Socket 775 на одинаковой тактовой частоте. Хотя шины процессора и памяти эволюционировали со временем, все эти процессоры доступны на одинаковых тактовых частотах, поэтому мы и решили взять уровень 3,0 ГГц.
Если посмотреть на процессоры AMD, то будет сложнее “выровнять” разные модели для объективного сравнения. С одной стороны, у нас нет одноядерных процессоров Athlon 64 для Socket AM2. Переход на материнскую плату Socket 939 требует память DDR400 вместо DDR2, что было бы приемлемо, но смена платформы и чипсета повлияет на результат.
Мы использовали процессор Sempron, чтобы у нас в сравнении был хотя бы один одноядерный процессор AMD64. С другой стороны, проблема кроется и в поиске процессоров, которые работали бы на одинаковой тактовой частоте. Если уменьшение тактовых частот не влияет на функцию “SpeedStep” в процессорах Intel, то переход на меньший множитель отключает “Cool’n’Quiet” на платформах AMD. Поскольку “Cool’n’Quiet” является очень важным механизмом для минимизации энергопотребления, когда высокая производительность не нужна, то нам пришлось использовать образцы процессоров на их штатных частотах.
Мы не хотели тестировать процессоры AMD на очень низких тактовых частотах, чтобы не рисковать релевантностью результатов из-за недостаточных тактовых частот. Поэтому оптимальным решением оказалась частота 2,3 ГГц, на которой работают Phenom 9600, Athlon X2 BE-2400 (эквивалент 65-нм Athlon 64 X2 4400+ Brisbane, но работает на TDP 45 Вт вместо 65 Вт). Так как среди 90-нм процессоров AMD не существует модели на 2,3 ГГц, мы добавили 2,4-ГГц Athlon 64 X2 4600+ (ядро Windsor F2) и не забыли Sempron 3600+. К сожалению, последний работает только на 2,0 ГГц, но у нас не было более скоростной модели на момент проведения тестов. Поэтому медленная модель Sempron дана только для сравнения.
100-МГц разница между Athlon X2 BE-2400 и Athlon 64 X2 4600+ достаточно мала, чтобы не влиять на итоговый результат. Для нас было важно выявить улучшения, которые сделала AMD, перейдя с одного поколения продуктов на другое. Давайте посмотрим, как производительность и соотношение производительности на ватт эволюционировали с течением времени. Мы начнём с одноядерного 90-нм Sempron, затем посмотрим на 90-нм двуядерный Athlon 64 X2, продолжим с двуядерным 65-нм Athlon X2 и завершим обзор последним процессором AMD: 65-нм четырёхъядерным Phenom.
AMD Sempron 3600+ (ядро Manila, 2,0 ГГц)
У процессора AMD Sempron уже достаточно долгая история. Он был впервые представлен для Socket 754, который был сокетом AMD64 для процессоров, использующих только один канал памяти DDR. Первые версии использовали 130-нм ядро Paris, но они быстро уступили место 90-нм Georgetown, в то же время AMD получила возможность удвоить ёмкость кэша L2 со 128 до 256 кбайт. Процессоры Sempron на скорости 3000+ или более высокой тоже поддерживают “Cool’n’Quiet”. Ещё одно обновление ядра под названием Palermo добавило поддержку SSE3 и чуть более высокие тактовые частоты. Ядро Palermo вышло и для Socket 939, что позволило использовать оба канала памяти DDR.
При переходе на Socket AM2 AMD решила объединить обе платформы, недорогую и high-end. Экономически это тоже имело смысл, да и соответствовало стратегии Intel, у которой все процессоры работают на Socket 775. AMD Sempron для Socket AM2 вышел на 90-нм ядре Manila (сначала со 128 кбайт кэша L2, затем объём был удвоен). Есть и 65-нм версия с тепловым пакетом 45 Вт под названием Sparta, хотя Manila заявлена на TDP 35 Вт для частот до 2,2 ГГц и 35 Вт для 1,6 и 1,8 ГГц.
Последняя версия, которую мы получили, построена на версии F2 ядра Manila и работает с рейтингом 3600+ (2,0 ГГц). Процессор оснащён 256 кбайт кэша L2 и стандартными 64 кбайт кэша L1 для данных и 64 кбайт L1 для инструкций. Процессор, определённо, более эффективен по энергопотреблению, чем одноядерные Athlon 64 для Socket 754 или Socket 939, поскольку он использует последнее 90-нм ядро (62 Вт TDP, степпинг F2), в то время как 90-нм Athlon 64 построены на 90-нм ядрах со степпингами D0, E3, E4 и E6 (тепловой пакет от 67 до 89 Вт). Поскольку частота 2,0 ГГц меньше 2,3/2,4 ГГц, которую мы приняли для Phenom и Athlon 64 X2, то на результаты этого процессора следует смотреть с определённой долей сомнений. Мы привели его только для сравнения.
С включённой технологией “Cool’n’Quiet” даже дешёвый Sempron при бездействии снижает частоту до 1,0 ГГц.
AMD Athlon 64 X2 4600 (ядро Windsor F2, 2,4 ГГц)
Athlon 64 X2, построенный на ядре Windsor, является фундаментом продуктов AMD для Socket AM2. Все процессоры используют двухканальный контроллер памяти DDR2-800 и общий набор инструкций вплоть до SSE3. Кроме того, это первая линейка продуктов, в которой AMD представила модели с повышенной эффективностью энергопотребления, работающие от пониженного напряжения и обладающие меньшим тепловым пакетом (TDP). По сравнению с Sempron, который мы описали выше, этот процессор оснащён двумя вычислительными ядрами с 512 кбайт или 1 Мбайт кэша L2 на ядро, а тепловой пакет составляет 89 Вт (до 6000+ и 3,0 ГГц) или 125 Вт (6000+ и 6400+ на 3,2 ГГц).
Мы использовали 2,4-ГГц процессор Athlon 64 X2 4600+ с двумя 512-кбайт кэшами L2. Поскольку 90-нм процессора на частоте 2,3 ГГц не существует, мы использовали версию на 2,4 ГГц (а не 2,2 ГГц). 65-нм версии Athlon 64 X2 имеют схожий рейтинг производительности (от 3600+ до 5400+), однако AMD немного отрегулировала тактовые частоты из-за небольшой разницы в производительности по сравнению с 90-нм ядрами Windsor. 65-нм ядро Brisbane доступно только с 2×512 кбайт кэша L2, хотя последние скоростные Windsor оснащаются 2×1 Мбайт кэша второго уровня. Поэтому многие 65-нм процессоры Athlon 64 X2 поставляются с необычными тактовыми частотами 2,1, 2,3, 2,5 или 2,7 ГГц, чтобы компенсировать влияние на производительность меньшего кэша L2.
В режиме бездействия Athlon 64 X2 4600 снижает тактовую частоту до 1,0 ГГц.
AMD Athlon X2 BE-2400 (ядро Brisbane, 2,3 ГГц)
Линейка AMD Athlon X2 BE доступна только на 65-нм ядре Brisbane (степпинг G1 или G2). Будучи процессорами с повышенной эффективностью энергопотребления, они обеспечивают ту же производительность, что и обычные Athlon 64 X2 на равных тактовых частотах. Однако сниженное напряжение ядра (максимум 1,25 В против 1,35 В) гарантирует, что процессоры не выйдут за пределы теплового пакета 45 Вт, что является меньшим уровнем максимального энергопотребления, чем в ассортименте Intel. Конечно, важно понимать, что тепловой пакет (TDP) определяет только максимальное энергопотребление. Это отнюдь не означает, что процессор всегда потребляет энергию на подобном уровне.
Самый быстрый Athlon X2 в данной линейке – BE-2400, работающий на 2,3 ГГц. Процессор доступен только на последнем степпинге G2 ядра Brisbane. Модели на G1 BE-2350 и BE-2300 работают на частоте 2,1 и 1,9 ГГц, соответственно.
И вновь технология “Cool’n’Quiet” снижает частоту CPU до 1,0 ГГц в режиме бездействия.
AMD Phenom 9600 (2,3 ГГц)
Мы уже немало говорили о новом четырёхъядерном процессоре AMD Phenom 9000. Вскоре должны выйти трёхъядерные модели (линейка 8000, ранее известная как 7000), а также и двуядерные, которые, скорее всего, будут выпущены под торговой маркой Athlon. Хотя AMD в прошлом использовала разные дизайны ядер для разных процессоров, трёхъядерная версия построена на четырёхъядерном кристалле, да и другие наверняка тоже. Умная система отключения ядер позволяет AMD продавать четырёхъядерные процессоры с одним дефектным ядром в виде трёхъядерных версий. Если же дефекты наблюдаются в частях кэша L2 или L3, то их тоже можно выключать в будущих версиях. Поскольку пользователь получит полноценный процессор на основе рабочих блоков, подобный подход экономически разумен для AMD, так как он позволяет развернуть ассортимент процессоров на разные рынки. Intel, кстати, сегодня делает то же самое, даже в больших масштабах. Просто посмотрите на двуядерные процессоры Celeron: это те же Core 2 с минимумом кэша L2.
Сегодня доступны только две модели четырёхъядерных Phenom, на основе 65-нм техпроцесса и степпинга B2, который содержит ошибку в буфере быстрого преобразования адреса (TLB) кэша L3. AMD сегодня работает над исправлением процессора, и мы ожидаем появление моделей B3 во втором квартале. Phenom 9600 работает на частоте 2,3 ГГц, а модель 9500 – на 2,2 ГГц. Phenom 9600 Black Edition является версией для энтузиастов с разблокированным множителем, который позволяет разгонять CPU до его пределов.
Статьи по теме.
- “Апгрейд на Phenom? Спасибо, нет“;
- “AMD Phenom против Athlon X2: сравнение роста производительности от частоты“;
- “AMD Phenom против Athlon X2: сравнение ядра к ядру“.
Тестовая конфигурация
Тестовая система | |
CPU I | AMD Sempron 3600+ (90 нм; 2 000 МГц, 256 кбайт кэша L2) |
CPU II | AMD Athlon 64 X2 4600+ (90 нм; 2 400 МГц, 1 Мбайт кэша L2) |
CPU III | AMD Athlon X2 BE-2400 (65 нм; 2 300 МГц, 1 Мбайт кэша L2) |
CPU IV | AMD Phenom 9600 (65 нм; 2 300 МГц, 2 Мбайт кэша L2 и 2 Мбайт кэша L3) |
Материнская плата | MSI K9GA2 Platinum, Rev: 1.0, чипсет: AMD 790FX, BIOS VP.0BF (2008-01-11) |
Память | OCZ Reaper PC2-8500 OCZ2RPR1066GK, 2x 1024 Мбайт Phenom DDR2-1066 (CL 5-5-5-15 2T) 2x 1024 Мбайт Athlon и Sempron DDR2-800 (CL 4-4-4-12 2T) |
Жёсткий диск | Western Digital WD5000AAKS, 500 Гбайт, 7 200 об/мин, кэш 16 Мбайт, SATA/300 |
DVD-ROM | Samsung SH-S183 |
Видеокарта | Gigabyte GV-RX385512H, GPU: Radeon HD 3850 (670 МГц), память: 512 Мбайт GDDR3 (830 МГц) |
Звуковая карта | Интегрированная |
Блок питания | Coolermaster RS850-EMBA, ATX 12V 2.2, 850 Вт |
Системное ПО и драйверы | |
ОС | Windows XP Professional 5.10.2600, Service Pack 2 |
Версия DirectX | 9.0c (4.09.0000.0904) |
Драйверы платформы AMD | Version 5.10.1000.7 |
Графические драйверы ATI | Catalyst 7.12 |
Тесты и настройки | |
Sysmark 2007 Preview | Official Run, Version 1.02 |
Материнская плата: MSI K9A2 Platinum (AMD790FX)
Память: OCZ Reaper HPC
Нам пришлось использовать память, которая способна работать на частоте DDR2-1066, поскольку именно её большинство пользователей выберет для компьютеров Phenom. Кроме того, у материнской платы MSI есть проблемы с работой памяти “только” на DDR2-800 с начальной версией BIOS.
Видеокарта: Gigabyte Radeon HD3850
Мы использовали эту модель в качестве эталонной видеокарты, поскольку она обеспечивает производительность на уровне верхнего сегмента массового рынка, требуя при этом меньше энергии, чем другие решения, особенно в режиме бездействия. Любая другая более скоростная видеокарта минимизирует разницу между процессорами, поскольку общее энергопотребление платформы будет выше.
Жёсткий диск: WD Caviar SE16, 500 Гбайт
Блок питания: Coolermaster RS850-EMBA
Результаты тестов производительности
SYSmark 2007 Preview
Благодаря удвоенному количеству ядер Phenom обеспечивает существенный прирост производительности по сравнению с Athlon 64 X2 или Athlon X2; особенно существенно выигрывают тесты создания видео и 3D в пакете SYSmark 2007 Preview. Одноядерный Sempron ощутимо отстаёт из-за всего одного ядра и заметно меньшей тактовой частоты 2,0 ГГц по сравнению с 2,3/2,4 ГГц у процессоров Athlon 64 X2 и Phenom.
Результаты тестов энергопотребления
Мин./макс. энергопотребление системы
Нас не удивило, что эффективный процессор Athlon X2 BE-2400 победил в тестах энергопотребления, поскольку он потребляет в режиме бездействия меньше других моделей. Собственно, для этого он и предназначался. Все процессоры AMD64 имеют практически идентичное энергопотребление в режиме бездействия, так как все они переключаются на 1,0 ГГц и снижают напряжение ядра во время простоя, если активна технология “Cool’n’Quiet”. Максимальное энергопотребление у процессоров существенно отличается. Если Sempron побеждает из-за простого дизайна (всего одно вычислительное ядро и всего 256 кбайт кэша L2), то 65-нм версия BE-2400 определённо выигрывает у 90-нм Athlon 64 X2 4600. И разница в 100 МГц, без сомнения, не является причиной столь существенного различия.
Phenom здесь выглядит не очень хорошо, поскольку у него намного более высокое энергопотребление в режиме бездействия (несмотря на “Cool’n’Quiet”), а также более высокое максимальное энергопотребление. Впрочем, если вы сравните энергопотребление одноядерного Sempron и двуядерных Athlon, у которых больше кэша L2, увеличение энергопотребления при переходе от двух ядер к четырём в процентном отношении будет меньше.
Среднее энергопотребление во время тестового прогона SYSmark 2007 Preview
Среднее энергопотребление во время полного прогона SYSmark 2007 Preview оказалось интересным. Athlon X2 BE-2400 оказался наиболее эффективным для данной нагрузки, а Phenom, определённо, потребляет, в среднем, больше энергии. Это связано с более высоким энергопотреблением в режиме бездействия и под максимальной нагрузкой.
Суммарная энергия, требующаяся для тестового прогона SYSmark 2007 Preview
График суммарной энергии, которая требуется для полного прогона SYSmark 2007, оказался весьма любопытным. На графике указана потреблённая энергия в ватт-часах для всей тестовой системы (без дисплея). Phenom “съел” энергии больше всех, а Athlon X2 BE-2400 – меньше других, что можно объяснить низким минимальным и максимальным энергопотреблением этого процессора. То же самое относится и к Sempron: это не самый быстрый процессор, поэтому большую часть времени ему приходится работать при высокой нагрузке, что приводит к увеличению энергопотребления. Это прекрасный пример того, что процессор, технологически обладающий меньшим минимальным и максимальным энергопотреблением, не всегда является самым эффективным по энергопотреблению при определённой задаче. Если процессор слишком медленный, ему требуется больше времени на завершение работы, что требует в сумме большей энергии.
Производительность SYSmark в расчёте на ватт-час
Мы рассчитали соотношение между результатом SYSmark и энергией, потребовавшейся на полный прогон. По результатам видно, что Phenom обеспечивает даже лучшее соотношение баллов SYSmark на ватт, чем очень эффективный Athlon X2 BE-2400. Учитывая, что минимальное и максимальное энергопотребление Phenom существенно выше, чем у эффективного процессора Athlon X2, результаты просто впечатляют. Они доказывают, что Phenom действительно обеспечивает существенно больше производительности благодаря четырём ядрам и кэшу L3. Поэтому, если вам нужен процессор, который будет работать над задачами, а не бездействовать большую часть времени, то четырёхъядерный Phenom будет намного лучше, чем двуядерный Athlon. Грядущие трёхъядерные версии тоже должны хорошо себя показывать в этом тесте, поскольку неиспользуемые ядра должны снизить энергопотребление в режиме бездействия, а три ядра вместо четырёх не окажут существенного влияния на такие тесты, как SYSmark 2007. Мы обязательно это проверим, как только в нашу лабораторию поступят трёхъядерные процессоры Phenom 8000.
Производительность Sysmark в расчёте на ватт-час, нормированная по Sempron
На графике приведён нормированный результат, показывающий соотношение производительности и затраченной энергии в процентах относительно Sempron.
График энергопотребления во время прогона Sysmark
Нажмите на картинку для увеличения.
Нам очень нравятся диаграммы энергопотребления во время прогона Sysmark, так как они показывают, как меняется потребление энергии в любой момент работы SYSmark 2007 Preview. Здесь ясно видно, что система Phenom потребляет больше других энергии во время работы (включая пики), однако она завершает тест за один час и 12 минут. Двуядерным процессорам требуется один час и 35 минут, а одноядерному Sempron – один час и 45 минут. Для процессора, работающего под полной нагрузкой, дополнительные 20 минут определённо скажутся на суммарном энергопотреблении.
Заключение
Если сравнение разных поколений процессоров Intel выявило улучшение соотношения производительности на ватт больше 400% при сравнении 3-ГГц Pentium 4 630 и Core 2 Duo E6850, то AMD смогла улучшить этот показатель меньше, чем на 60% (сравнение четырёхъядерного Phenom и одноядерного Sempron). Результаты производительности на ватт будут более впечатляющими, если вы будете запускать интенсивные приложения. Программы, оптимизированные под многопоточность, должны ещё сильнее выигрывать от нескольких ядер. Но мы использовали пакет SYSmark 2007 Preview, который представляет большую часть задач для широкого круга пользователей, поэтому он включает ряд периодов слабой нагрузки, которые тоже сказываются на итоговом результате.
Большинство из вас наверняка согласятся, если мы скажем, что процессор Phenom находится в начале своей карьеры. У AMD возникли сложности с финализацией продукта, да и есть некоторые проблемы с производством и выходом годных кристаллов. Но если посмотреть на результаты тестов энергопотребления и принять во внимание умную систему управления энергопотреблением, которая позволяет управлять каждым ядром по отдельности, то можно уверенно сказать, что будущие степпинги Phenom обеспечат большую экономию энергии и лучшую эффективность. На то намекают и результаты сравнения 90-нм Athlon 64 X2 4600+ (2,4 ГГц) и эффективного 65-нм процессора Athlon X2 BE-2400 (2,3 ГГц). Оба построены на одной и той же архитектуре, но последний относится к новейшему поколению AMD64. Он показывает, что изменения на уровне производства могут повлиять на энергопотребление всей системы.
Если вы хотите купить процессор AMD, то Athlon X2 или Athlon 64 X2 по-прежнему остаются наиболее разумным выбором. Эти процессоры стоят вполне доступно – некоторые даже дёшево – и обеспечивают достаточную производительность. Энтузиастам, которым требуется высокая производительность в многопоточном окружении, лучше порекомендовать Phenom (после выхода степпинга B3) или линейку Intel Core 2, которая по-прежнему является чемпионом по производительности и часто лидирует по соотношению производительности на ватт.