Разные степпинги AMD Athlon: шаги эволюции
Редакция THG,  28 марта 2008


Шаг за шагом: анализ степпингов AMD Athlon 64 X2

Шаг за шагом: анализ степпингов AMD Athlon 64 X2

Во время запуска процессоров AMD Phenom мир буквально затаил дыхание. Но, как знают технически подкованные читатели, старт у AMD вряд ли можно считать успешным, будь то процессоры Phenom 9000 для массового рынка или их аналоги Opteron для рынка профессионального. Четырёхъядерные процессоры с кодовым названием Agena должны были вернуть AMD в лидеры после того, как эта компания так и не смогла представить процессор, способный конкурировать с Intel Core 2 Duo. К сожалению, новый продукт не только опоздал на многие месяцы, но и содержал неприятную ошибку, которая заставила AMD приостановить поставки до тех пор, пока не будет готова новая версия микропроцессора. Новые версии выходят в виде степпинга, что стало характерным и для линейки Phenom. Но каково будет потенциальное влияние нового степпинга? Мы решили рассмотреть четыре разных степпинга Athlon 64 X2 5000+ и проанализировать улучшения.

AMD уже сказала, что пользователям не следует ожидать существенного увеличения производительности от нового степпинга B3, поскольку он предназначен, главным образом, для исправления ошибок. Типичный дизайн Phenom предусматривает 64+64 кбайт кэша L1 для инструкций и данных, а также 512 кбайт кэша L2 на ядро плюс общие 2 Мбайт кэша L3, который динамически разделяется между всеми ядрами. Всё это не изменилось, остались прежними набор инструкций и система регулировки энергопотребления. Это касается и техпроцесса производства. Хотя AMD планирует перейти на 45-нм техпроцесс позднее в этом году, Phenom по-прежнему будет выпускаться по 65-нм техпроцессу DSL SOI (dual stress liner, silicon on insulator). Кроме того, мы считаем, что возможен, как минимум, прирост тактовой частоты, поскольку AMD уже раздала несколько 2,4-ГГц образцов процессоров Phenom, которые коммерчески ещё не доступны.

Прогресс AMD прекрасно показан на сайте компании в разделе Desktop CPU Selector. Там можно выбрать линейку процессора, модельный номер, частоту, размер кэша, сокет и другие параметры, чтобы найти соответствующую модель. Мы использовали данный инструмент для поиска моделей в двуядерной линейке Athlon 64 X2, которая находится на рынке достаточно долгое время и прошла через множество обновлений. Мы выбрали процессор Athlon 64 X2 5000+, который вышел в двух 90-нм степпингах и ещё в двух версиях на основе 65-нм техпроцесса. Давайте посмотрим, каково влияние отдельных степпингов.

Что такое степпинг?

Как мы уже упоминали, степпинг процессора - это попросту новая аппаратная версия, но она не содержит существенных изменений или пересмотра микроархитектуры. В новом степпинге некоторые функции могут быть улучшены, однако производители микропроцессоров рассматривают степпинги, главным образом, как способ исправить технические ошибки - их называют errata, и большинство таких ошибок публикуется AMD и Intel. Так называемое уменьшение площади кристалла (die shrink) - то есть перенос существующего продукта с 90-нм техпроцесса на меньший 65-нм техпроцесс - по своей сути не является переходом на новый степпинг. Однако такой шаг может использоваться и для модификаций, например, для увеличения кэш-памяти или расширения набора инструкций.

Если процессоры на новых степпингах в прошлом продавались AMD и Intel под теми же модельными и продуктовыми номерами, то уменьшение площади кристалла может содержать достаточное число модификаций, чтобы оправдать новые модельные номера. Хорошим примером можно считать Intel Core 2 Duo. 45-нм версии процессоров с 6 и 3 Мбайт кэша L2 называются линейкой E8000, а линейка E6000 содержит процессоры с 4 или 2 Мбайт кэша L2, изготовленные по 65-нм техпроцессу. AMD, напротив, решила сохранить модельный номер 5000+ для всех 90- и 65-нм версий.

Степпинги не только являются прекрасной возможностью исправления известных ошибок и добавления функциональных улучшений, но и показывают, чему научился производитель за время выпуска процессоров. Процесс производства часто можно улучшить, внеся минимальные изменения, или можно изменить и целую часть техпроцесса. Изменение процесса производства может дать повышение доли выхода годных кристаллов. При этом можно устранить - или рассеять - так называемые "горячие точки" (hot spots). Вполне понятно, что новые степпинги не всегда приводят к улучшению набора функций или заметному приросту производительности, но следует учитывать снижение себестоимости производства и другие факторы.

CPU-Z - очень полезная утилита, которая позволяет получить информацию об обновлении процессора и истории степпингов. Windows обычно не выдаёт такую информацию, поскольку большинству пользователей компьютеров она и не нужна.

Степпинги AMD Socket AM2 и модельные номера

У AMD вышло два важных степпинга как для 90-, так и для 65-нм версий Athlon 64 X2 на сокете AM2. Когда процессор был впервые представлен, он использовал 90-нм степпинг F2, за которым следовал 90-нм F3. После выхода 65-нм процессоров AMD через несколько месяцев представила степпинги G2.

90-нм Windsor F2: ADO5000IAA5CU

90-нм Windsor F2: ADO5000IAA5CU

90-нм Windsor F2: ADO5000IAA5CU
Скриншот с активной технологией "Cool'n'Quiet".

90-нм Windsor F2: ADO5000IAA5CU

90-нм Windsor F2: ADO5000IAA5CU

90-нм Windsor F2: ADO5000IAA5CU

90-нм Windsor F2: ADO5000IAA5CU

90-нм Windsor F2: ADO5000IAA5CU
Скриншот с активной технологией Cool'n'Quiet.

90-нм Windsor F2: ADO5000IAA5CU

65-нм Brisbane G1: ADO5000IAA5DD

65-нм Brisbane G1: ADO5000IAA5DD

65-нм Brisbane G1: ADO5000IAA5DD

65-нм Brisbane G1: ADO5000IAA5DD
Скриншот с активной технологией "Cool'n'Quiet".

65-нм Brisbane G1: ADO5000IAA5DD

65-нм Brisbane G2: ADO5000IAA5DO

65-нм Brisbane G2: ADO5000IAA5DO

65-нм Brisbane G2: ADO5000IAA5DO

65-нм Brisbane G2: ADO5000IAA5DO
Скриншот с активной технологией "Cool'n'Quiet".

65-нм Brisbane G2: ADO5000IAA5DO

Тестовая конфигурация

Процессор AMD Athlon 64 X2 Dual-Core
Модель 5000+
OPN Tray ADO5000IAA5DO ADO5000IAA5DD ADA5000IAA5CU ADO5000IAA6CZ
OPN Pib ADO5000DOBOX ADO5000DDBOX ADA5000CUBOX ADO5000CZBOX
32-битный режим работы Да
64-битный режим работы Да
Степпинг G2 G1 F2 F3
Частота ядра (МГц) 2 600
Частота шины (МГц) 2 000
Напряжение 1,325/ 1,35/ 1,375 В 1,25/ 1,35 В 1,30/ 1,35 В 1,20/ 1,25 В
Макс. температура 55-68 55-72 55-70 55-72
Тепловой пакет 65 Вт 89 Вт 65 Вт
Размер кэша L1 (кбайт) 128
Число кэшей L1 2
Размер кэша L2 (кбайт) 512
Число кэшей L2 2
Размер кэша L3 (кбайт) 0
CMOS 65nm SOI 90nm SOI
Системное аппаратное обеспечение
Процессоры AMD Athlon 64 X2 5000 (2,6 ГГц, 2x 512 кбайт кэша L2)
ADA5000IAA5CU (F2)
ADO5000IAA6CZ (F3)
ADO5000IAA5DD (G1)
ADO5000IAA5DO (G2)
Платформа AMD AM2 Asus M3A32-MVP Deluxe, Rev.1.02G, AMD 790FX, BIOS: 0801 (12/26/2007)
Память 2x 1 Гбайт Corsair DDR2-1066, CM2X1024-8888-C4D, задержки CL5-5-5-12
DVD-ROM Samsung SH-D163A , SATA150
Видеокарта Gigabyte Radeon HD 3850 GV-RX385512H, GPU: 670 МГц, память: 512 Мбайт DDR3 (830 МГц, 256 битов)
Звуковая карта Встроенная
Блок питания Coolermaster RS-850-EMBA, ATX 12V V2.2, 850 Вт
Системное ПО и драйверы
ОС Windows Vista Enterprise Version 6.0 (Build 6000)
DirectX 10 DirectX 10 (Vista default)
DirectX 9 Версия: April 2007
Графический драйвер ATI Radeon Version 7.12
Драйвер чипсета AMD Версия 3.0.642 (28/11/2008)
Java Java Runtime Environment 6.0 Update 1

Для нашего проекта мы вновь использовали эталонную систему THG.

Тестовая конфигурация
Материнская плата Asus M3A32 MVP на чипсете AMD790FX.

Тестовая конфигурация

Тестовая конфигурация

Тесты и настройки

Тесты и настройки
3D-игры
Warhammer Mark of Chaos Version: 1.006.000
Video Mode: 1280x1024
Video Quality: game default
Multiple CPU/Core
Demo: THG Timedemo
Quake 4 Version: 1.3 Final
Video Mode: 1280x1024
Video Quality: game default
Benchmark I: THG Timedemo
Benchmark II: playnettimedemo id_demo001
(official ID-Soft NetTimeDemo)
Unreal Tournament 2004 Version: 3369
UMark: 2.0.0
Video Mode: 1280x1024
High Image Quality
Bots: 16
Benchmark: AS-Junkyard
Supreme Commander Version: 3.220
Video Mode: 1024x768
Video Quality: game default
Vsync = off
Benchmark: real 60 second game
Prey Version: 1.3
Video Mode: 1280x1024
Video Quality: game default
Vsync = off
Benchmark: THG-Demo
Звук
iTunes 7.2 Version: 7.1.1.5
Audio CD "Terminator II SE", 53 min
High Quality (160 kbps)
Lame MP3 Version 3.98 Beta 3 (05-22-2007)
Audio CD "Terminator II SE", 53 min
wave to mp3
160 kbps
Видео
Pinnacle Studio 11 Plus Version: 11.0.0.5082
Encoding and Transition Rendering
Private MPEG2-Cam-Movie
Video: 720 x 480 Pixel, NTSC, 6000 kb/sec
Audio: MPEG Layer 2, 224 kb/sec 16 Bit, Stereo 48 kHz
File Type: MPEG-2 (DVD compatible)
TMPEG 4.2 Version: 4.2.10.211
import file:
Terminator 2 SE DVD (720x576, 16:9) 2 Minutes
Dolby Digital, 48000 Hz, 6-Kanal, English
Advanced Acoustic Engine MP3 Encoder (160 kbps)
DivX 6.6.1 Version: 6.6.1
- Main Menu -
Profile: Home Theater Profile (720 x 576)
1-pass, 780 kb/s
- Codec Menu -
Encoding mode: Insane Quality
Enhanced multi-threading
XviD 1.1.2 Version: 1.1.2 (01/11/2006)
Target quantizer: 1.00 (maximum quality)
Mainconcept H.264 Encoder Version: 2.0
MPEG2 to MPEG2 (H.264)
MainConcept H.264/AVC Codec
24 sec HDTV 1920x1080 (MPEG2)
Audio: MPEG Layer 2 (48 kHz, 2 Channel, 16 Bit)
Stream: Transport
Codec: H.264
Mode: NTSC (29.97 FPS)
Profile: High
Adobe Premiere Pro 2.0 HDTV Version: 2.0
Windows Media Encoder 9.1 AP HDTV
Windows Audio Encoder 10 Pro
NTSC MPEG2-HDTV 1920x1080 (24 sec)
Import: Mainconcept NTSC HDTV 1080i
Export: Adobe Media Encoder
- Video -
Windows Media Video 9 Advanced Profile
Encoding Passes: one
Bitrate Mode: Constant
Frame: 1920x1080
Frame Rate: 29.97
Maximum Bitrate [kbps]: 2000
Image Quality: 50.00
- Audio -
Windows Media Audio 10 Professional
Encoding Passes: one
Bitrate Mode: Constant
Audio Format: 160 kbps, 44.1 kHz, 2 channel 16 bit (A/V) CBR
Приложения
Grisoft AVG Anti-Virus Version: 7.5.467
Virus base: 269.6.1./776
Benchmark
Scan: Vista Enterprise (Windows folder) 8 GB
Maxon Cinema 4D Release 10 Version: 10.008
Rendering from a scene
"Water drop at a Rose"
Resolution: 1280 x 1024 - 8Bit (50 frames)
Adobe Photoshop CS 3 Version: 10.0x20070321
Filtering a 69 MB TIF photo
Benchmark: Tomshardware-Benchmark V1.0.0.4
Programmed by Tomshardware using Delphi 2006
Filers:
Crosshatch
Glass
Sumi-e
Accented Edges
Angled Strokes
Sprayed Strokes
Deep Fritz 10 Version: Nov 16 2006
Синтетические тесты
3DMark06 Version: 1.10
1280x1024 - 32 bit
Graphics and CPU Default Benchmark
PCMark05 Pro Version: 1.2.0
CPU and Memory Tests
Windows Media Player 10.00.00.3646
Windows Media Encoder 9.00.00.2980
SiSoftware Sandra XI SP1c Version 2007.5.11.40
CPU Test = CPU Arithmetic / MultiMedia
Memory Test = Bandwidth Benchmark
Performance Benchmark Results

Результаты тестов

3D-игры

3D-игры

3D-игры

Разница в производительности в 3DMark06 слишком мала, чтобы можно было увидеть преимущество одного из степпингов.

3D-игры

3D-игры

3D-игры

3D-игры

3D-игры

Тесты аудио/видео

Тесты аудио/видео

В iTunes при преобразовании в формат Apple AAC разницы практически нет.

Тесты аудио/видео

Тесты аудио/видео

Степпинги F2/F3 на 90-нм ядре Windsor оказались чуть быстрее.

Тесты аудио/видео

Тесты аудио/видео

Тесты аудио/видео

Тесты приложений

Тесты приложений

Здесь мы наблюдаем небольшое преимущество 90-нм ядер Winsdor.

Тесты приложений

Тесты приложений

90-нм версии чуть быстрее, но разница мизерная.

Тесты приложений

Синтетические тесты

Синтетические тесты

Синтетические тесты

Производительность памяти у 65-нм степпингов G заметно отстаёт от 90-нм ядер Windsor. Синтетические тесты показывают низкоуровневую разницу в производительности, но на реальных приложениях она может и не отразиться. Собственно, эта разница объясняет, почему 65-нм версии немного отстают от 90-нм процессоров по вычислительной производительности.

Синтетические тесты

Синтетические тесты

Синтетические тесты

Синтетические тесты

Синтетические тесты

Синтетические тесты

Индекс производительности Windows Vista

Индекс производительности Windows Vista

Индекс производительности Windows Vista

Тесты энергопотребления

Тесты энергопотребления

Поскольку техпроцесс AMD SOI уже прекрасно показал себя, отличаясь низкими токами утечки и малым энергопотреблением в режиме бездействия, то улучшения при переходе с 90 на 65 нм не такие существенные. Мы обнаружили экономию энергии в 2 Вт при переходе на последние степпинги с меньшим техпроцессом.

Тесты энергопотребления

Измерения энергопотребления под нагрузкой показали любопытный факт: первое 90-нм ядро Windsor потребляет ощутимо больше энергии, чем любой другой степпинг. Кроме того, очевидно, что 65-нм техпроцесс не является более эффективным при максимальной нагрузке на CPU.

Заключение

AMD представила платформу AM2 почти два года тому назад, и затем у компании ушло больше шести месяцев на представление первых 65-нм процессоров. В то время мы обнаружили, что у двуядерных Athlon 64 X2 увеличились задержки кэш-памяти, но и энергопотребление снизилось. Тестовые результаты в нашей статье это тоже подтверждают.

И 90-нм, и 65-нм процессоры получили обновление в виде степпингов, причём они разрабатывались практически параллельно. AMD по-прежнему использует 90-нм техпроцесс для high-end моделей, включая Athlon 64 X2 6000+ и 6400+ Black Edition. Эти процессоры требуют модифицированный степпинг F3, а процессоры F2 уже доступны с тактовыми частотами до 3,2 ГГц. В то же время, 65-нм процессоры были обновлены со степпинга G1 до G2, что привело к появлению 5000+ Black Edition с неплохим потенциалом разгона.

Хотя мы не тестировали возможности разгона четырёх процессоров, представленных в нашем обзоре, мы можем сделать некоторые выводы.

  • Производительность всех версий Athlon 64 X2 5000+ одинаковая. 65-нм модели чуть медленнее в некоторых тестах из-за увеличенной задержки кэша L2. Впрочем, столь малой разницей можно пренебречь.
  • 65-нм процессоры требуют меньше энергии в режиме бездействия, чем 90-нм модели, однако меньший техпроцесс не помогает им под нагрузкой - они потребляют не меньше. AMD сделала весьма важный шаг при переходе с 90-нм степпинга F2 на F3.
  • С учётом сказанного, глядя на токи утечки, вполне логично утверждать, что техпроцесс AMD DSL SOI уже вполне отработан, и снижение площади кристалла важнее с экономической точки зрения (больше чипов с кремниевой пластины) и не даёт каких-то преимуществ по дизайну. Это объясняет, почему AMD не предлагает high-end двуядерные процессоры на основе 65-нм техпроцесса, продолжая использовать для флагманов 90-нм техпроцесс - 65-нм кристаллы ничуть не лучше по тактовым частотам. Намного важнее с экономической точки зрения поставлять меньшие по площади 65-нм кристаллы в большом объёме для массового рынка, чем отлаживать их для меньших сегментов рынка.
  • Прогресс между двумя 65-нм степпингами G1 и G2 с точки зрения эффективности или производительности кажется меньше, чем разница между F2 и F3.
  • Степпинг G2 даёт лучшие результаты в арифметическом тесте CPU SiSoftware Sandra по сравнению с другими процессорами, но это никак не сказывается на реальных приложениях.

Мы продолжим обсуждение темы разных степпингов в следующей статье, в который сравним разные модели линейки Intel Core 2.

КОНЕЦ СТАТЬИ


Координаты для связи с редакцией:

Общий адрес редакции: thg@thg.ru;
Размещение рекламы: Roman@thg.ru;
Другие координаты, в т.ч. адреса для отправки информации и пресс-релизов, приглашений на мероприятия и т.д. указаны на этой странице.


Копирование и распространение информации, упомянутой на страницах THG.ru возможно только при наличии у вас письменного разрешения руководства издания. По вопросам использования наших статей обращайтесь по электронной почте.

THG.ru ("Русский Tom's Hardware Guide") входит в международную сеть изданий Best of Media


Все статьи: THG.ru

 

Rambler's Top100 Рейтинг@Mail.ru bigmir)net TOP 100 агентство контекстной рекламы адвертпро московская ремонтная служба стиральных машин