Новое мировоззрение: Athlon 64 FX и Athlon 64 против P4 Extreme
Вино в бочке требуется выдержать, прежде чем оно достигнет зрелости. Глубоко в подвалах THG два винодела из солнечных долин Калифорнии приглашают принять участие в особой дегустации. Слухи о ней ходили уже несколько месяцев. Два сорта вина настолько хороши, что можно даже сгрызть рюмки. Любой эксперт знает, что и молодое вино может покорить сердце гурмана.
С чистой совестью можно утверждать, что данное тестирование является самым интересным и увлекательным за прошедшие два года. Команда THG потратила почти четыре недели на это деликатное дело. Откупорим пробки и приступим к дегустации двух процессоров AMD: Athlon 64 FX-51 и Athlon 64 3200+.
В то же время, сюрпризом, даже для работников Intel, стала ещё одна премьера: несколько дней назад появился процессор Pentium 4 в версии Extreme. Кстати, не забудьте скачать наше новое видео.
Intel выслала этот документ OEM за два дня до запуска P4 Extreme.
Новое мировоззрение: Athlon 64 FX и Athlon 64 против P4 Extreme, продолжение
AMD выпустила гражданскую версию Hammer и встретила “старого архиврага” Intel с P4 (Extreme). В конце концов, что касается процессоров x86, лидер рынка “отъел” немалую долю у “выскочки” AMD, особенно за два последних квартала. На сегодня соотношение таково: 15,7 процентов (AMD) против 82,5 процентов (Intel), а оставшиеся 1,8 процента разделяют между собой VIA и Transmeta.
Процессоры x86 | Рыночная доля | Прибыльность |
Intel | 82,5% | от 51 до 54% |
AMD | 15,7% | убытки |
VIA | 1% | нет информации |
Transmeta | 0,8% | убытки |
Самое интересное, что Athlon 64 и Athlon 64 FX-51 уже знакомы нам с апреля по версии процессора для рабочих станций/серверов Opteron (см. статью Битва титанов: Opteron против Xeon). Основной привлекательной функцией Athlon 64 является постепенный переход с 32-битного на 64-битное программное обеспечение для всего миллионного массового рынка.
В то же время, Apple заявила, что система на процессоре G5 станет самым мощным настольным компьютером в мире. Вероятно, существуют пользователи, которые поверили в подобные заявления. Впрочем, G5 также имеет поддержку 64-битных приложений. В любом случае, пока ещё для этого процесса нет готовой операционной системы.
Среди других 64-битных процессоров следует отметить Alpha 21364 (1150 МГц), IBM PowerPC (1700 МГц) , Intel Itanium 2 (1500 МГц) и Sun UltraSparc III Cu (1200 МГц). По сравнению с перечисленными процессорами, использующимися только в профессиональных 64-битных окружениях, Athlon 64 является первым процессором, способным революционизировать рынок настольных ПК – то есть массовый рынок.
Слева – обычный Athlon 64, а справа – Athlon 64 FX
Новое мировоззрение: Athlon 64 FX и Athlon 64 против P4 Extreme, продолжение
Интересная деталь: 8 сентября 2003 года Intel провела мероприятие для прессы. Во время этого мероприятия компания пыталась, помимо всего прочего, попросить журналистов использовать тесты, которые могут задействовать многопоточные возможности P4. Вероятно, Intel переживает, что в период эйфории “Hammer” о компании могут подзабыть.
Та же самая конструкция: Athlon 64 FX и Opteron
В то же время, рекламный лозунг AMD, распространённый по многочисленным изданиям, гласит: купите 64-битный процессор сегодня, чтобы быть готовыми к дальнейшему переходу на Windows XP 64. Он звучит не так абсурдно, если вы примите во внимание, что когда-нибудь 32-битную базу (x86-32) всё равно придётся менять. В конце концов, при 32-битных вычислениях адресное пространство теоретически ограничено 4 Гбайт. Поскольку требования к памяти продолжают расти, данный барьер может быть преодолён только переходом на 64 бита – помимо других трюков, типа расширения регистров. Этот аргумент, по идее, адресован Intel, поскольку компания не может ничем на него ответить с P4, будь то даже версия P4 Extreme. Как мы полагаем, Intel будет подчёркивать, что в ближайшем будущем настольные платформы не получат какого-либо существенного преимущества от перехода к 64 битам. В то же время, по слухам, Intel предусмотрела альтернативное развитие событий и включила 64-битное расширение “Yamhill” в ядро Prescott, выход которого планируется 26 ноября. Но даже работники Intel с большим стажем, владеющие, безусловно, внутренней информацией, не могут подтвердить или опровергнуть существование в этой компании, насчитывающей 78.000 работников, секретной команды разработчиков.
Новое и старое: Athlon XP слева и два Athlon 64 справа.
Четыре разных процессора с одним дизайном
Обязательное требование для сложного производства чипов гласит: необходимо создать максимально возможное число разновидностей одного и того же дизайна процессора для разных рынков. И ядро Hammer от AMD не стало исключением. Только такой метод позволяет сохранять ASP (среднюю розничную цену) на высоком уровне и гарантировать нормальные прибыли. В принципе, помимо версий Opteron для рабочих станций и серверов, в настоящее время существуют два настольных процессора: Athlon 64 для массового рынка и топовая модель Athlon 64 FX, которая изначально поставляется в ограниченных количествах.
Помимо них, в октябре планируется выход мобильной версии Athlon 64, в результате чего именитые производители, типа Hewlett-Packard, к примеру, представят свои первые 64-битные ноутбуки. Специальная роль уготована для Athlon 64 FX. Некоторые производители материнских плат планируют продавать топовую модель FX-51 в комплекте с платами nForce3 или K8T800. Похоже, что у AMD существуют свои проблемы с этой моделью, и накануне запуска лишь несколько экземпляров этого процессора были высланы прессе по всему миру. В Европе было распространено около двенадцати экземпляров этого процессора. Кроме того, нельзя предсказать возможное развитие ситуации с производителями материнских плат. По некоторым сведениям, вскоре Intel существенно опустит цены на P4. В любом случае, в данной ситуации не понятно, когда и с какими условиями AMD начнёт поставлять Athlon 64 FX в объёмах, достойных упоминания. Так что пока нам придётся терпеть “ужас”, типа супер-дорогих комплектов с FX. Похоже, что в данной ситуации лучшей стратегией будет политика выжидания.
Причины мотивации конечных пользователей вполне очевидны: в кругу друзей 64-битный процессор явно привлечёт внимание и станет элементом престижа. В сообществе любителей Athlon переход на Athlon 64, скорее всего, будет расцениваться как получение дворянского звания. В любом случае, ожидания от Athlon 64, который появился на массовом рынке с задержкой не меньше года, очень велики. В то же время, у Intel была масса времени, чтобы подготовить достойную контратаку. Вероятно, даже слишком много времени, чтобы вдоволь пофилософствовать о технических деталях и производительности новых процессоров.
Intel Pentium 4 3,2 Extreme Edition
AMD Athlon 64 3200+
AMD Athlon XP 3200+
AMD Athlon 64 FX-51
Плохой выбор: партнёр по запуску nVidia
Партнёром по запуску настольных процессоров Athlon 64 была выбрана nVidia. Сотрудничество даже заметно по именам: Athlon 64 FX и GeForce FX. В процессе предварительного отбора AMD рассматривала только трёх производителей чипсетов: ATi, nVidia и VIA. Выбор пал на nVidia, так что все тестовые системы, распространённые по всему миру, базируются на пока ещё сыроватом чипсете nForce3. По этой причине в нашей лаборатории мы использовали для тестирования различные платы, которые были оснащены как чипсетом nForce3 от nVidia, так и K8T800 от VIA.
Приведём некоторую информацию о тестировании: мы протестировали 18 процессоров от AMD и Intel в течение четырёх недель. Среди них присутствовали Athlon 64 3200+ (2000 МГц ) для массового рынка, Athlon 64 FX-51 (2200 МГц) для амбициозных геймеров, всем известные процессоры Athlon XP (от 2500+ до 3200+) с шиной 166 МГц 200 МГц, а также процессоры Intel Pentium 4 от 2,4 ГГц до 3,2 ГГц с шинами 133 МГц и 200 МГц. Наконец, на нашу лабораторию неожиданно, лишь за считанные часы до публикации статьи, “свалился” P4 Extreme.
Приведём также некоторые комментарии для любителей деталей: AMD выслала нам полностью собранную систему на Athlon 64 FX-51. Она базировалась на плате Asus S8KN (чипсет nForce3). Несмотря на многие запросы и личные связи, AMD не пожелала предоставить нам “нормальный” Athlon 64. Пришлось обращаться за этим к производителям материнских плат. Тестовая платформа тоже была полностью пересмотрена: поскольку платформа AMD использовала 1 Гбайт оперативной памяти, все другие тестовые платформы тоже были оснащены таким же объёмом.
Чипсеты и материнские платы: Socket 754 против Socket 940
Сокет для Athlon 64 FX – идентичен Opteron.
Socket 754 для Athlon 64.
Северный мост чипсета VIA K8T800.
Чипсеты и материнские платы: Socket 754 против Socket 940, продолжение
Южный мост чипсета VIA K8T800 с интегрированным контроллером SATA.
Чип от nVidia – CK8.
nVidia: ошибка nForce3
Крайне низкая производительность AGP чипсета nForce3 явно связана с проблемами интерфейса HyperTransport северного моста. Это доказывается результатами тестов и производительностью, сниженной вплоть до 33,2 процента. Детальную информацию читайте в части статьи, посвящённой тестам.
Изначально nVidia планировала интегрировать контроллер SATA RAID в южный мост. Хотя контроллер присутствует в текущей версии nForce3, nVidia отключила его. Причина кроется в том, что контроллер работает с ошибками. По этой причине мы решили включить в наше тестирование дополнительные платы на чипсете VIA K8T800.
nVidia (Athlon 64 FX, или GeForce FX – схожие имена) может стать более прибыльным партнёром для AMD, чем VIA. Однако мы должны указать, что VIA с чипсетом K8T800 на данный момент предлагает лучшее решение для Athlon 64.
Десятое видео для скачивания: Athlon 64 FX-51 vs. Athlon 64 vs. P4 3.2 Extreme
Некоторые люди любят Францию не только из-за кухни и языка, но и по причине существования старых чёрно-белых фильмов, в которых актёры столь выразительно молчаливы. THG регулярно создаёт видеоролики, демонстрирующие слабые и сильные места различного оборудования. Иногда они имеют драматические последствия. Мы имеем в виду наше первое видео под названием “Что произойдёт с процессором, если снять с него кулер”, которое стало культовым.
В то же время, число наших видеороликов достигло 10. Как и в предыдущих случаях, мы постарались достичь оптимального качества картинки при сравнительно низкой пропускной способности потока. В десятом видео мы постарались показать различные тестовые платформы для AMD и Intel, чтобы сделать наше тестирование более понятным. Мы впервые использовали совершенно новый кодек DivX 5.1 Pro, который позволяет получить улучшенное качество картинки при меньшем потоке, по сравнению с младшими версиями кодека. В дополнение мы сжали видеоролик с помощью архиватора ZIP, в результате чего получили файл объёмом в 20 Мбайт. Время проигрывания составляет 3 минуты и 15 секунд, включая стерео-звук, то есть средний поток получился 6,1 Мбайт/мин или 103 кбайт/с. Учитывая разрешение 540×432, это отнюдь неплохо, тем более что на экране вы вряд ли заметите мерцание.
Техническая информация по десятому видео THG | |
Разрешение | 540 x 432 @ 25 fps (3/4 PAL) |
Формат кадра | 4:3 |
Глубина цвета | 16 бит |
Звук | Стерео, 16 бит, 48 кГц |
Звуковой поток | 96 кбит/с (12 кбайт/с) |
Видео поток | 780 кбит/с (97 кбайт/с) |
Общий поток | 876 кбит/с (109 кбайт/с) |
Кодек видео | MPEG-4 DivX, 5.1 Pro, 2 прохода, двунаправленное кодирование |
Кодек звука | MPEG-1 Layer 3 (MP3), Fraunhofer |
Цветовое пространство | YUV |
Продолжительность | 3:15 минут |
Размер файла | 20 Мбайт |
Требования для воспроизведения видео
Малый объём файла и низкий поток видео требуют высокой производительности процессора. Основным требованием является установка на компьютер кодека DivX версии 5.1. Текущую версию кодека можно скачать с сайта DivX.com: DivX-Codec 5.1
Кодек гарантирует должное воспроизведение видео. Поскольку звук сжат в формате MP3, и этот формат поддерживается в большинстве версий Windows, специального драйвера для него не нужно.
Ядро Athlon XP 64: Athlon на 95 процентов
Внешний вид процессорного ядра долгожданного Hammer: большую часть кристалла (более 50 процентов) занимает 1 Мбайт кэша L2.
При внимательном рассмотрении можно заметить, что ядро AMD Hammer во многом очень похоже на старое ядро Athlon. Одной из инновационных черт нового процессора можно считать добавление на кристалл контроллера памяти, для которого было выделено место там, где у ядер Palomino и Thoroughbred располагался кэш L2. Помимо встроенного контроллера памяти и увеличенного кэша L2 (1 Мбайт, 16-канальный ассоциативный), остальные функции остались, в большей степени, прежними. Это можно заметить на фотографиях, где новое ядро сравнивается с ядром Thoroughbred. Как и в предыдущем случае, процессор содержит девять функциональных блоков: 3 ALU, 3 AGU, FADD, FMUL и FMISC (три целочисленных блока и три блока с плавающей запятой), а также три декодера x86 – проверенный временем дизайн AMD. Почти нетронутым остался кэш L1 для данных и инструкций, по 64 кбайт на каждую область, хотя была добавлена новая схема ECC.
Посмотрите на сердце процессора: внешний вид процессорного ядра без кэша L2 и контроллера памяти. Следующее изображение объясняет, зачем мы привели эту фотографию.
Сравнение ядер Hammer (слева) и старого Athlon Thoroughbred – похоже, что, на первый взгляд, все блоки идентичны. Как видим, AMD осуществила лишь незначительные изменения деталей архитектуры Hammer, если не считать контроллер памяти и кэш L2, конечно.
Ядро Athlon XP 64: Athlon на 95 процентов, продолжение
Настоящие инновации кроются в деталях. В сердце процессора находится перекрёстный коммутатор (crossbar switch, XBAR), который направляет потоки информации между контроллером памяти, ядром процессора и тремя портами HyperTransport. По сравнению с Athlon 64, который поддерживает только однопроцессорные конфигурации, Opteron также содержит логику управления для работы в многопроцессорном окружении. Поэтому в серверах до восьми процессоров Opteron могут работать вместе без северного моста. Кроме того, был добавлен блок совместимости с SSE2, где присутствует в два раза больше регистров (16), чем у Intel P4. Фундаментальные изменения были осуществлены в механизме обработки команд: буферы TLB были переработаны под большую нагрузку (максимум 1000 записей). В целом, чем больше размер TLB, тем менее часто будет осуществляться доступ к таблицам трансляции в основной памяти при передаче физического адреса.
Фундаментальная структура Hammer не слишком отличается от Athlon: три целочисленных блока и три блока работы с плавающей запятой остались неизменными, как и три декодера x86. Кэши теперь обладают схемой ECC. Важные изменения кроются в деталях.
Ядро процессора | Hammer | Barton | Thoroughbred “B” |
Площадь подложки (диаметр 200 мм) | 31416 мм² | 31416 мм² | 31416 мм² |
Площадь кристалла | 193 мм² | 101 мм² | 84 мм² |
Техпроцесс | 0,13 мкм | 0,13 мкм | 0,13 мкм |
Потери | 18 процентов | 18 процентов | 18 процентов |
Теоретический максимальный выход годных кристаллов | 122 шт./подложку | 255 шт./подложку | 306 шт./подложку |
Число кристаллов при выходе 60% | 73 шт./подложку | 153 шт./подложку | 183 шт./подложку |
Ядро процессора | Thoroughbred “A” | Palomino | Thunderbird |
Площадь подложки (диаметр 200 мм) | 31416 мм² | 31416 мм² | 31416 мм² |
Площадь кристалла | 80 мм² | 128 мм² | 128 мм² |
Техпроцесс | 0,13 нм | 0,18 нм | 0,18 нм |
Потери | 18 процентов | 18 процентов | 18 процентов |
Теоретический максимальный выход годных кристаллов | 322 шт./подложку | 201 шт./подложку | 201 шт./подложку |
Число кристаллов при выходе 60% | 193 шт./подложку | 120 шт./подложку | 120 шт./подложку |
В целом, это помогает экономить время. По сравнению с ядрами Thoroughbred и Barton, буферы TLB работают с меньшими задержками, что, в свою очередь, приводит к повышению производительности. Также был переработан и блок предсказания ветвлений, в результате чего счётчик событий (History Counter) может хранить до 16.00 записей (Athlon XP – 4.000). Чтобы позволить ядру работать на более высоких тактовых частотах, AMD удлинила конвейер Hammer до 12 ступеней – старый Athlon имел всего десять ступеней, в то время как текущая модель Intel P4 (и Xeon) использует 20 ступеней. В результате исполнительные устройства могут быстрее загружаться последовательными командами, что снижает пустые циклы ожидания.
Существенная особенность: расширенные 64-битные регистры.
HyperTransport: высокоскоростная шина без компромиссов
В отличие от всех процессоров Intel, которые связываются с северным мостом по обычной параллельной FSB, AMD Hammer использует интерфейс HyperTransport. Последовательный интерфейс с переменным потоком позволяет SledgeHammer получить скорость передачи данных до 3,2 Гбайт/с – в обоих направлениях одновременно. В результате суммарная пропускная способность составляет 6,4 Гбайт/с. Для сравнения, Pentium 4 с 533 МГц FSB позволяет достигать пропускной способности 3,97 Гбайт/с, но только в одном направлении. Последовательный интерфейс разработан с учётом максимально гибкой пропускной способности. AMD оснастила серверную версию ядра Hammer тремя портами HyperTransport. Все данные к процессору Hammer проходят через интерфейс HyperTransport и встроенный контроллер памяти. Чтобы соседние процессоры получали доступ к системной памяти, Hammer использует коммутатор XBAR. Для команд и адресов коммутатор XBAR использует 64-битную шину.
Athlon 64/FX: пять различных режимов работы
Пять различных режимов работы AMD 64/FX.
В зависимости от выставленных битов в регистре LME, процессор работает в одном из пяти режимов, показанных на иллюстрации. В результате обеспечивается обратная совместимость.
Регистры: 32-битные и 64-битные
Хотя это может показаться существенно меньшим, чем ожидаемые 64 бита, архитектура x86-64 использует 40-битное пространство физических адресов и 48-битное пространство виртуальных адресов. В результате объём адресуемой памяти равен 1 Тбайт (1024 Гбайт). Новое в Hammer: архитектура x86-64 расширяет 32-битные регистры процессоров IA-32 до 64 бит. Когда приложения работают в наследственных/совместимых режимах, Hammer продолжает использовать только восемь обычных 32-битных регистров EAX, EBX, ECX, EDX, EBP, ESI, EDI и ESP (см. иллюстрацию выше). Если процессор работает в 64-битном режиме, то архитектура x86-64 расширяет восемь регистров с префиксом “R” до 64 бит. Соответственно, расширенные регистры называются от RAX до RSP. В дополнение к этому, в 64-битном режиме Hammer может получать доступ ещё к восьми регистрам общего назначения от R8 до R15, также имеющих 64-битную ширину. Для вычислений с плавающей запятой восемь 128-битных регистров SSE были удвоены с появлением регистров от XMM8 до XMM15. И вновь отметим, что от этого получает преимущество только 64-битный режим.
Athlon XP | Athlon 64 (FX) | ||
Режим | 32-битный режим | 32-битный режим (режим совместимости или наследственный) | 64-битный режим |
Регистры общего назначения | 8x (32-битные) | 8x (32-битные) | 16x (64-битные) |
Регистры SSE | 8x (128-битные) | 8x (128-битные) | 16x (128-битные) |
Регистры MMX | 8x (64-битные) | 8x (64-битные) | 8x (64-битные) |
Регистры x87 | 8x (80-битные) | 8x (80-битные) | 8x (80-битные) |
При работе в 32-битном режиме Athlon 64 (FX) даёт операционной системе то же самое число регистров, что и старый Athlon XP. Большее число регистров доступно только в 64-битном режиме.
Socket 462 заменяется: Sockets 754 и 940/939
Socket 462 существует уже довольно долгое время. Однако, с запуском линейки Athlon 64, дни Socket 462 сочтены. “Нормальный” Athlon 64 использует новый Socket 754, а Athlon 64 FX – Socket 940. Различное число контактов двух процессоров Hammer связано с тем, что Athlon 64 FX использует двухканальный интерфейс памяти и два порта HyperTransport. Стандартный Athlon 64 довольствуется только одноканальным интерфейсом памяти и одним портом HyperTransport. Все процессоры Hammer используют упаковку mPGA, как и процессоры Intel Pentium 4 и Xeon.
Встроенный интерфейс памяти: без вмешательства северного моста
Принцип многопроцессорной системы Hammer заключается в наличии на каждом процессоре локальной памяти, чтобы другие процессоры смогли получать доступ к локальной памяти данного процессора по шине HyperTransport. Изначально только серверная версия Hammer – Opteron была оснащена двумя 72-битными каналами DDR SDRAM. При восьми слотах DIMM каждый процессор мог адресовать 8 Гбайт. Двухканальный интерфейс памяти Athlon 64 FX-51 обеспечивает пропускную способность 6,4 Гбайт/с. По-прежнему, наличие встроенного контроллера памяти можно рассматривать как ограничение гибкости.
Стоимость контроллера: производство Athlon 64/FX в Дрездене
На заводе в Дрездене: рядом, в том же самом месте, Infineon уже перешла на подложки диаметром 300 мм. У AMD этот переход что-то затянулся. Сегодня для производства процессоров Athlon XP и Hammer используются только подложки с диаметром 200 мм. Ядра Barton (Athlon XP) и Hammer (Athlon 64, FX, Opteron, Mobile Athlon 64) изготавливаются по техпроцессу 130 нанометров. Чтобы выдержать грядущую конкуренцию, необходимо снизить себестоимость производства. Это можно сделать лишь с помощью перехода на подложки большего размера (300 мм) и использования более тонких техпроцессов. С выпуском преемника P4, процессора Prescott, Intel станет первым производителем в мире, выпускающим процессоры по технологии 90 нанометров. AMD пока ещё не готова и планирует переход на 90 нанометров в середине 2004 года. Даже с чисто финансовой точки зрения, технология 90 нанометров повысит долю выхода годных кристаллов с подложки, что снизит себестоимость процессоров.
Ядро процессора | Стоимость подложки | Материал подложки | Стоимость упаковки | Упаковка и тестирование | Итоговая стоимость ядра |
Barton | $3000 | $20 | $10 | $8 | $38 |
Hammer | $3000 | $38 | $12 | $8 | $58 |
Специалисты по производству в Дрездене осуществили простые вычисления, исходя из стоимости подложки и числа процессоров на подложку. Добавьте к этому стоимость упаковки, тестирования и сборки. Просто замечание: специалисты упоминают стоимость около $3000 на подложку. Это позволяет довольно точно рассчитать себестоимость 130-нанометровых ядер. В нашей таблице показано различие стоимости ядер Barton и Hammer.
Основная цель AMD заключается в управлении прибылью и ценой процессора Hammer, а также в одновременном снижении себестоимости производства. Ведь, в конце концов, меньшие производственные издержки дают большую гибкость в ценовой политике производителя чипов, особенно при больших объёмах поставок для сегмента low-end. Массовый рынок подразумевает конкурентоспособные цены, в то время как Opteron, неплохой с виду, всё ещё должен получить широкое признание среди OEM.
Доля выхода годных кристаллов на Fab30 в Дрездене: 73 процессора Athlon 64 на подложку!
AMD использует только подложки диаметром 200 мм, в результате чего площадь подложки составляет 31.416 мм². Отношение площади подложки к площади ядра процессора даёт теоретический выход без геометрических потерь. При использовании подложек диметром 200 мм средние потери составляют 18%. Если выход годных кристаллов будет 100%, то мы получим 122 процессора на подложку. Как показывает практика, за двухлетнюю отладку техпроцесса можно получить выход годных кристаллов около 60%, что даёт 73 процессора на подложку. Информация о точном числе годных кристаллов строго конфиденциальна, однако наши подсчёты наверняка близки к истине.
Подложка с процессорами Hammer: если всё идёт путём, то AMD может получить примерно 73 процессора Hammer с одной подложки. Число базируется на внутренних расчётах THG, а также и на других источниках.
Пока ещё не вышло: программное обеспечение для 64 бит
Хотя AMD уже опубликовала обширную документацию по поводу поддержки Athlon 64, лишь несколько издателей программ планируют выпустить в ближайшей перспективе 64-битные приложения.
Что касается видео, то скоро появится финальная версия кодера DivX с поддержкой 64-битных вычислений. Игровые издатели тоже колеблются, хотя, по данным AMD, компании типа Epic, Valve, Crytek и SCI предлагают игры с 64-битным кодом. Ну а компании вроде id Software, известные играми типа Quake3 и Unreal Tournament 2003, пока ещё не готовы к 64-битным вычислениям.
В то же время, неизвестно, когда Microsoft выпустит финальную версию Windows XP 64. Как мы можем предположить, система будет готова к лету 2004. Пре-альфа версия Windows XP 64, которую мы используем, содержит лишь несколько встроенных драйверов.
Все процессоры AMD и Intel одним взглядом.
64 бита – немного теории никогда не повредит!
Чтобы обрабатывать данные, хранить промежуточные результаты или осуществлять косвенную адресацию, каждый процессор обладает рядом встроенных ячеек памяти, к которым он может осуществлять доступ, называемые регистрами. Каждый регистр имеет фиксированную ширину, которая показывает, какой объём данных может быть обработан одной командой. 32-битные процессоры, типа Intel Pentium 4 или AMD Athlon XP, могут, к примеру, складывать числа от 0 до более 4 миллиардов за одну операцию, в то время как старые 16-битные процессоры (например, Intel 80286), за одну операцию могли складывать только числа до 65535, а для больших чисел им требовалось два шага. Впрочем, в каждом случае скорость может быть выше при использовании широких внутренних регистров, чем при комбинации меньших регистров. Также каждый процессор должен записывать данные из регистров в память. Лучше всего, когда шина данных имеет ту же ширину, что и регистр. Напомним, что Intel Pentium 4 использует 64-битную шину данных, что позволяет вызывать больше данных из памяти.
Лишь немногие 64-битные процессоры имеют 64-битное адресное пространство. К примеру, Intel Itanium (1) имеет 44-битное адресное пространство. Большое адресное пространство критично для многих приложений, в частности, для серверов с большими базами данных, которым никогда не хватает памяти. Часто 4 Гбайт, возможных при 32 битах, бывает недостаточно.
Так называемые, операции SIMD (SSE, SSE2) получают преимущество от 64-битной обработки. 64-битный процессор может изначально просчитывать числа в 64-битном формате с плавающей запятой (“двойная точность” – до 15 знаков) и в итоге может работать быстрее – именно поэтому 64-битные процессоры показывают своё превосходство в тестах с интенсивным использованием чисел с плавающей запятой.
Тестовое аппаратное обеспечение
Для нашего сравнения мы использовали как Athlon 64 3200+, предназначенный для массового рынка, так и Athlon 64 FX-51, нацеленный на элитных геймеров. Чтобы отобразить масштабируемость, мы протестировали Athlon 64 FX-51 на разных тактовых частотах. Поясним: сегодня на рынке практически нет регистровой памяти DDR400 или DDR333. В результате Athlon 64 FX будет встречаться крайне редко. На момент тестирования лишь некоторым изданиям были поставлены образцы машин. Они содержали специально отобранную регистровую память DDR400, которая недоступна в розничной продаже.
Модули DDR400 (регистровые) для Athlon 64 FX
Новая память от Corsair
Несколько слов стоит сказать о платах для отдельных платформ: процессоры Intel P4 тестировались на новой плате Asus P4C800-E Deluxe с чипсетом 875P. Во время тестирования с агрессивными задержками памяти мы обнаружили несколько проблем. Мы не смогли провести тестирование с двумя модулями Corsair (512 Мбайт, DDR433, CL2.0, XMS3500) при установке экстремальных задержек – работа была возможна лишь при задержке CL2,5. Затем мы установили четыре модуля по 256 Мбайт (Corsair XMS 3200, DDR400, CL2), которые работали безупречно и на агрессивных задержках (режим turbo в BIOS). Однако при этом мы несколько потеряли в производительности памяти, по сравнению с конфигурацией при использовании двух модулей: пропускная способность 5,1 Гбайт/с против 4,95 Гбайт/с.
Asus P4C800-E Deluxe: версия платы 1.02, BIOS 1011 Beta 006
Основа для платформы P4: Asus P4C800-E
Все процессоры Athlon XP тестировались на платформе nForce2 Ultra (Asus A7N8X). Мы использовали два новых модуля памяти DDR433 (Corsair XMS3500, CL2). Однако возникли и ограничения: экстремальные задержки (CL2.0-2-2-5) были возможны лишь при частоте FSB 166 МГц. При частоте FSB 200 МГц мы смогли получить лишь задержки CL2.0-3-3-6.
Asus A7N8X Deluxe: версия платы 2.00, BIOS 1006 Final
Основа для платформы Athlon: Asus A7N8X
Asus SK8N: версия платы 1.03, BIOS 1003 Beta 003 (настройки nVidia)
Платформа (полученная от AMD) изначально требовала подстройки для AMD Athlon 64 FX-51: плата Asus SK8N поставлялась с версией BIOS 1001 Beta, однако она не распознавала процессор при загрузке. После обновления BIOS до версии 1003 Beta 1, производительность памяти упала с 5,65 Гбайт/с до 5,5 Гбайт/с – однако Athlon 64 FX уже распознавался корректно. Возникли и нарекания: поскольку на плате не оказалось перемычки для очистки CMOS, нам пришлось её добавить. Наконец, из-за потерь производительности мы получили третью версию SK8N вместе со специальным BIOS от nVidia. По сравнению с двумя другими образцами, эта плата была оснащена перемычкой сброса CMOS, и проблем с загрузкой не возникало. Однако производительность всё ещё была ниже наших ожиданий. Кстати, ручное замыкание перемычки CMOS тоже привело к сюрпризу: в воздухе запало жжёным пластиком. Мы осуществили прошивку BIOS с помощью соответствующего инструмента (Asusupdate) через Интернет – в результате чего плата останавливалась в процессе загрузки. Пришлось осуществлять обновление BIOS из-под DOS. Сетевые функции не работали. Память 1 Гбайт состоит из двух модулей 512 Мбайт (DD400, регистровые). Задержки сохранялись на уровне CL2.5-3-3-6, в то время как напряжение было повышено до 2,7 В.
MSI MS-9130: версия платы 1.0, BIOS 1.0BD
Как уже упоминалось, чипсет K8T800 на данный момент является лучшей основой для Athlon 64 и Athlon 64 FX. Наша тестовая плата MS-9130была получена от MSI. По раскладке плата представляла собой двухпроцессорную платформу Socket 940. В целом, она прекрасно подойдёт в роли платы для рабочих станций, при этом она также поддерживает и процессоры Opteron. Мы использовали ту же память, что и на материнской плате Asus SK8N с чипсетом nForce3: 2 модуля по 512 Мбайт DDR400 (регистровая) от Legacy Electronics. В любом случае, память изготовлена Infineon и имеет время доступа 5 нс. Ручная регулировка задержек невозможна: в BIOS можно выставить только тактовую частоту. В итоге в BIOS были выбраны следующие задержки: CL2.5-3-3-7. Несмотря на относительно худшие задержки, пропускная способность чуть поднялась: 5,6 Гбайт/с против 5,5 Гбайт/с на nForce3.
Двухпроцессорная раскладка: MSI MS-9130
MSI 8KT Neo MS-6702: версия платы 1.0, BIOS 1.0
“Маленький” Athlon 64 для массового рынка использует Socket 754. Мы рассмотрели несколько плат на базе Socket 754 на чипсете VIA K8T800, который устанавливается также (см. выше) и для “больших” процессоров с Socket 940. Даже в самом начале мы столкнулись с проблемами: ни одна из плат не захотела работать с 1 Гбайт памяти. На самом деле, конфигурацию отнюдь нельзя назвать тривиальной: два двухсторонних модуля по 512 Мбайт должны безупречно работать в одноканальном интерфейсе Athlon 64. Одновременно необходимо держать открытыми 8 рядов. Лишь одна плата, MSI 8KT Neo, всё-таки заработала с 1 Гбайт памяти. Однако при этом пришлось поднять напряжение питания памяти со стандартных 2,5 В до 2,7 В. Что касается задержек: хотя память от TakeMS работала CL2.0-4-4-8, мы отметили несколько случайных сбоев.
Для обычного Athlon 64: плата MSI на чипсете VIA K8T800.
Северный и южный мосты чипсета K8T800.
Gigabyte GA-8KNNXP: версия платы 0.2, BIOS 1.0
Плата Gigabyte GA-8KNNXP базируется на чипсете nForce3 для Socket 754
Платы на чипсете nVidia nForce3 также доступны и для Socket 754. Здесь мы протестировали GA-8KNNXP.
Общее аппаратное обеспечение: больше без влияния производительности жёсткого диска
Serial ATA RAID 0: два раза по 80 Гбайт от Maxtor.
Приводы DVD для отдельных тестовых платформ.
Прежде в тестах процессоров и материнских плат мы использовали жёсткие диски 40 Гбайт от Maxtor с кэшем 2 Мбайт. Но, как показал наш опыт, при работе с мощным процессором одного жёсткого диска перестаёт хватать. Кодирование видео (MPEG-2 или MPEG-4) является прекрасным примером. По этой причине мы решили использовать два жёстких диска в комбинации RAID-0, что позволяет достичь более высокой скорости чтения/записи (производительности ввода/вывода) без влияния на производительность процессора. Несколько примеров: время кодирования в случае Main Concept с P4 3,2 ГГц упало с 192 до 174 секунд – то есть производительность увеличилась на 9,3 процента. Ещё одним примером является Sysmark 2002, которая работает не меньше часа: прирост производительности оказался 7,9 процента (от 315 до 342 очков). На платформе Intel мы использовали встроенный ICH5-R (FW82801ER). Поскольку Serial ATA RAID не интегрирован в южный мост на платформе AMD (VIA K8T800 или nForce3, nForce2 Ultra), мы использовали внешний контроллер Fast Trak S150 TX2plus PCI от Promise.
Контроллер SATA в виде карты PCI для систем, не имеющих встроенного контроллера.
Звуковая карта high-end: Terratec Aureon 7.1
Пробежимся по тестовым платформам AMD
Тестовая платформа для AMD Athlon 64 FX
Тестовая платформа для AMD Athlon XP
Тестовая платформа для AMD Athlon 64
Впервые мы решили использовать в тестировании интегрированные сетевые чипы, расставшись с внешними картами.
Для тестирования мы использовали различные модули памяти.
Хорошая производительность: два модуля DDR433 по 512 Мбайт
Тестовая конфигурация
Процессоры Intel (Socket 478) | |
200 МГц FSB (двухканальная DDR400) | Pentium 4 3,20 ГГц Extreme Edition (3200 МГц 12-8/512/2048 кбайт) |
200 МГц FSB (двухканальная DDR400) | Pentium 4 3,20 ГГц (3200 МГц 12-8/512 кбайт) Pentium 4 3,00 ГГц (3000 МГц 12-8/512 кбайт) Pentium 4 2,80 ГГц (2800 МГц 12-8/512 кбайт) Pentium 4 2,60 ГГц (2600 МГц 12-8/512 кбайт) Pentium 4 2,40 ГГц (2400 МГц 12-8/512 кбайт) |
133 МГц FSB (двухканальная DDR333) | Pentium 4 3,06 ГГц (3066 МГц 12-8/512 кбайт) Pentium 4 2,80 ГГц (2800 МГц 12-8/512 кбайт) Pentium 4 2,66 ГГц (2666 МГц 12-8/512 кбайт) |
Процессоры AMD (Socket A) | |
200 МГц FSB (двухканальная DDR400) | Athlon XP 3200+ (2200 МГц 128/512 кбайт) Athlon XP 3000+ (2100 МГц 128/512 кбайт) |
166 МГц FSB (двухканальная DDR333) | Athlon XP 3000+ (2166 МГц 128/512 кбайт) Athlon XP 2800+ (2083 МГц 128/512 кбайт) Athlon XP 2700+ (2166 МГц 128/256 кбайт) Athlon XP 2600+ (1917 МГц 128/256 кбайт) Athlon XP 2500+ (1833 МГц 128/512 кбайт) |
Процессоры AMD (Socket 940) | |
200 МГц FSB (двухканальная DDR400) | Athlon FX-51 (2200 МГц 128/1024 кбайт) |
Процессоры AMD (Socket 754) | |
200 МГц FSB (одноканальная DDR400) | Athlon 64 3200+ (2000 128/1024 кбайт) |
Память | |
DDR433 (216 МГц) | 4 x 256 Мбайт/ 5 нс/ 64 бита (Corsiar TwinX) XMS3200 (CMX256A-3200C2 CL2 T1) |
DDR400 (200 МГц) | 2 x 512 Мбайт/ 5 нс/ 64 бита (Corsiar) CMX512-3500C2 CL2 |
DDR400 (200 МГц) | 2 x 512 Мбайт/ 5 нс/ 64 бита (Legacy Eletronics Inc.) Reg. ECC (88S6HDAR-1TDG 5733) Infineon |
DDR400 (200 МГц) | 2 x 512 Мбайт/ 5 нс/ 64 бита (TakeMS) MS64D64020U-5 |
Материнские платы | |
Intel 875 (Socket 748) |
Asus P4C800-E Deluxe Rev: 1.02 Bios: 1011 BETA 006 4 x 256 Мбайт CL 2.0-2-2-5 (200 МГц) 4 x 256 Мбайт CL 2.0-2-2-5 (133 МГц) |
nVidia nForce2 (Socket 462) Ultra |
Asus A7N8X Rev: 2.00 Bios: 1006 2 x 512 Мбайт CL 2.0-3-3-6 (200 МГц) 2 x 512 Мбайт CL 2.0-2-2-5 (166 МГц) 2 x 512 Мбайт CL 2.0-2-2-5 (133 МГц) |
nVidia nForce3 150 (Socket 940) |
Asus SK8N Rev: 1.03 Bios: 1003 BETA 002 2 x 512 Мбайт CL 2.5-3-3-6 (200 МГц) |
VIA K8T800 (Socket 940) |
MSI K8T Master 1-FAR (MS-9130) Bios: 1.0Bd Rev: 1 2 x 512 Мбайт CL 2.5-3-3-7 (200 МГц) |
VIA K8T800 (Socket 754) |
MSI 8KT Neo (MS-6702) Bios: 1.0 Rev: 1.0 2 x 512 Мбайт CL2.0-4-4-8 (200 МГц) |
Общее аппаратное обеспечение | |
Звуковая карта | Terratec Aureon 7.1 Space частота дискретизации 96,00 кГц |
Видеокарта | MSI FX5900U-VTD256 GPU: NVIDIA GeForce FX 5900 Ultra Память: 128 Мбайт DDR-SDRAM Частота памяти: 620 МГц (256 бит) Частота чипа: 325 МГц |
Жёсткий диск (система AMD) | FastTrak S150 TX2plus (Bios: 1.00.0.30) 2 x SATA Maxtor 6Y080M0 (Raid 0) 80 Гбайт/ кэш 8 Мбайт/ 7200 об/мин |
Жёсткий диск (система Intel) | Intel FW82801ER ICH5R 2 x SATA Maxtor 6Y080M0 (Raid 0) 80 Гбайт/ кэш 8 Мбайт/ 7200 об/мин |
DVD/CD-ROM | MSI MS-8216 16x DVD |
Сеть (Intel – I875) | Intel 82547ET (CSA) |
Сеть (AMD – nForce 3) | Сетевой контроллер NVIDIA nForce MCP |
Сеть (AMD – nForce 2) | Сетевой контроллер NVIDIA nForce MCP |
Сеть (AMD – VIA 8KT800) | Broadcom BCM5705KFB |
Программное обеспечение | |
Intel Chipset | V 5.00.1012 SATA – IAA V 3.51 |
Nvidia nForce | Nvidia V2.45 |
Nvidia Graphic | Detonator V 45.23 |
VIA K8T800 | V 14.49 |
DirectX | Версия: 9a |
ОС | Windows XP, Build 2600 SP1 |
Тесты и настройки OpenGL |
|
Quake III Arena | Patch V1.16 640×480 – 16 bit / 1024 x 768 – 32 bit Timedemo1 / demo demo001 / nv15demo command line = +set cd_nocd 1 +set s_initsound 0 Graphics detail = Normal |
Quake III Team Arena | Version 1.32 640×480 – 32 bit Timedemo1 / demo thg3 “custom timedemo” Graphics detail = Normal |
SPEC viewperf 7.1a | Version 7.1 Patch 7.1a 1280×1024 32 Bit |
Serious Sam | Version 1.07 |
The Secound Encounter | Graphics API: Open GL Preferences: Quality Resolution: 640×480 no Audio Bits per Pixel: 32 Bit Execute Addon: 32bit_HQ++-ansio8-24z.ini Demo: Valley fo the Jaguar |
Wolfenstein | Version: 2.55 |
Enemy Territory | 1024 x 786 – 32 bit timedemo 1 / demo demo4 Graphics detail = Normal |
DirectX 7 | |
3DMark 2001 SE | Version 1.1 – Patch Build 330 1024 x 786 – 32 bit, Default Benchmark |
DirectX 8 | |
Comanche 4 Demo | 1024 x 768 / 32 bit / Audio = off |
Unreal Tournament 2003 | Version 2206 system/benchmark.exe 1024 x 768 / 32 bit / Audio = off Texture Detail = Normal Character Detail = Normal World Detail = Highest Physics Detail = High all = on, Decal Stay = High |
Splinter Cell | Version 1.2b 2_2_1_KalinatekDemo 1024×786 32 Bit / no sound Shdow resolution: low Shadow detail: low Effects quality: low |
Blizzard Warcraft III | Version 1.12 |
The Frozen Thorne | 1024×786 32 Bit / no sound Detail settings: high Replay: 3v3 esonlzerter average frames from minutes 1 to 14 FPS captured with FRAPS |
DirectX 9a | |
3DMark 2003 | Version 3.3.0 Graphics and CPU Default Benchmark 1024 x 786 – 32 bit |
X2-The Threat Rolling | Demo – bechmark Graphic Settings: all off 1024x768x32 (X8R8G8B8) |
Gun Metal | Version: 1.20S (benchmark version) Benchmark 2 640×480 – 16 bit / 2 X FSAA Video Quality LOW Terrain Detail LOW Draw Distance HIGH Cloud Shadows OFF Lens Flare OFF Sun Glare OFF |
AquaMark3 | 1024 x 768 – 32 bit Audio = off Advanced Measurement Antialiasing mode: off Anisotropy: off Level Detail: very low |
Video | |
Mainconcept MPEG Encoder | Version 1.3.1 1.2 GB DV to MPEG II (720×576, Audio) converting |
Pinnacle Studio 8 SE | Version 8.8.17 Rendering – DVD Compatible no Audio |
Xmpeg 5.0.1 | build 5.0.8.82 |
Vdivx 5.10 Pro | AMD: Otimized MMX iDCT Intel: Otimized SEE2 iDCT DivX 5.10 Pro Audio: off Psychovisual Enhancements: off Resize: 720×576 Restore Defaults 780 kbps feedback windows: off |
Windows Media Encoder 9 | Version: 9.00.00.2980 436 MB AVI File convert to WMV Windows Media server (streaming) |
Discreet Cleaner XL | Version 6.0.2.402 SP1 416 MB DV to MPEG II NTSC DVD 4:3 Apple Quick Time 6.3 Real One Player V2 Gold |
Microsoft Movie Maker | Version 2.0 416 MB DV to WMV |
Audio | |
magix mp3 maker 2004 | Version 4.11 Build 19593 |
diamond | 65 minutes/44.100 KHz wave file (688,4 MB) Format: MP3 High Quality |
Steinberg Nuendo 2.0 | Version: 2.0.0 – Build on May 6 2003 VST Multitrack ASIO Driver: Aureon sky/space (96.000 kHz) Clock Source: Internal Resulution: 32 bit (float) Smaple Rate: 96.000 kHz File of type: Wave File (.wav) Channels (Stereo Splite) |
Lame | Version 3.93.1 65 minutes/44.100 KHz wave file (688,4 MB) to mp3 |
Applications | |
Bapco Sysmark 2002 | Version 1.0 (Patch) Script Patch for fast CPU from Bapco |
Winrar | Version 3.20 178 MB Wave file, Compression = Best Dictionary = 4096 KB |
Newtek Lightwave | Version 7.5c – Build 572 Render First Frame = 1 Render Last Frame = 60 Render Frame Step = 1 Rendering Bench “variations.lws” Show Rendering in Progress = 320×240 Ray Trace Shadows, Reflection Refraction, Transparency = on Multithreading = 8 Threads |
Maxon Computer | Version 8.100 |
Cinema 4D XL 8 | Rendering in 1028 x 1024, “Stairs.c4d” |
Seti@home | client: V 3.03 (text version) Work Unit with Angle Range: 0,417 HT: bench with two same Work Units |
Discreet | Characters “Dragon_Charater_rig” |
3D Studio Max 5.1 | Rendering Single, 1024×768 |
Wolframresearch | Version 5.0.0.0 |
Mathematica 5 | MMA 40 Test |
Synthetic | |
PCMark 2002 Pro Pack | Build 101 CPU and Memory Tests |
SiSoftware Sandra MAX3! | Version 2003.7.9.73 CPU MultiMedia / CPU Arithmetic Memory Bandwidth Benchmark |
Мы радикально переработали наш тестовый набор. Мы намного увеличили долю тестов, базирующихся на реальных приложениях, не говоря уже о том, что мы обновили все тестовые приложения. Среди интенсивных тестов появилась программа Steinberg Nuendo 2.0: она просчитывает аудио проект объёмом выше 2 Гбайт на high-end звуковой карте (Terratec Aureon 7.1 Space) с частотой дискретизации 96 кГц и 32 битами. Самый быстрый процессор – Intel Pentium 4 – тратит на эту задачу почти 3 минуты! В случае Mathematica 5.0 используется сложная формула, значительно нагружающая процессор: Athlon 64 FX требуется для этого 5,7 секунд! Конечно же, мы включили в тестирование три профессиональные программы рендеринга: 3D Studio Max 5.1 (скоро выйдет Version 6), Cinema 4D XL 8.1 и Lightwave 7.5c (скоро выйдет Version 8).
Sysmark 2002: зачем использовать старые приложения?
Широко известный тест Sysmark 2002 от Bapco сегодня очень популярен, хотя он использует смесь приложений, которую вряд ли можно назвать современной: MS Office 2002 без пакетов обновления, Windows Media Encoder 7.1 – сегодня уже вышла Version 9. Что мы и показали в таблице.
Старые приложения в Sysmark 2002 | Доступные приложения на сегодня |
MS Office 2002 | MS Office 2002 Service Pack 2 |
Adobe Photoshop 6.01 | Adobe Photoshop 7.0 |
Adobe Premiere 6.0 | Adobe Premiere Pro (7.0) |
MS Media Encoder 7.1 | MS Media Encoder 9 |
Macromedia Dreamweaver 4 | Macromedia Dreamweaver MX 6.1 |
Macromedia Flash 5 | Macromedia Flash MX 6 |
Netscape Communicator 6.0 | Netscape Communicator 7.1 |
Dragon NaturallySpeaking Preferred 5 | Dragon NaturallySpeaking 7 |
WinZip 8.0 | WinZip 9.0 |
McAfee VirusScan 5.13 | McAfee VirusScan 7.0 |
Как насчёт выпуска пакета обновления для Sysmark? Если Bapco не выпустит обновления в ближайшие недели, мы, без всяких колебаний, уберём этот тест из нашего репертуара.
Тесты – делаем правильно!
На данный момент следует прокомментировать некоторые тесты. Высокая частота кадров (489,5 FPS (Athlon FX) в Quake III, 73,07 FPS в Comanche 4 и 91,1 FPS в Splintercell) воспринимается в порядке вещей. Однако при выборе меньшего графического разрешения нагрузка перераспределяется от графической карты к центральному процессору. На практике, конечно, вряд ли кто-то пожелает играть с подобными настройками. Но целью нашего тестирования является масштабирование процессора в соответственной программе.
Поскольку на практике (=реальная игра, пользователь против ПК) нагрузка на видеокарту оказывается существенно выше, то частота кадров при разрешениях типа 1024×768 или 1280×1024 будет значительно падать по сравнению с нашим тестированием (проведённом при низких разрешениях). Кроме того, тесты, если их повторить при тех же настройках, всегда дают тот же самый результат. При этом на результат не влияют такие параметры, как “съедающий” производительность AI (искусственный интеллект), ведь в тесте мы просто повторяем прогон демо игры. Во время реальной игры AI влияет на меняющуюся игровую ситуацию. Конечно же, эти вычисления “съедают” дополнительные ресурсы процессора.
Критики игровых тестов часто указывают (и довольно правильно), что решающим фактором является не только максимальная частота кадров, но и средняя. Кто не испытывал ситуации, когда в 3D-стратегии реального времени, проходящей по сетевому подключению, наблюдается дёрганье, если внезапно появляются большие объекты, на что влияют и факторы типа AI, помимо других.
Впервые мы решили включить в наше тестирование стратегию реального времени – Warcraft III “The Frozen Throne” (Version 1.12). Тестирование было проводить довольно сложно, поскольку официального теста Warcraft III не существует. Мы проигрывали турнир со скоростью 8x и за 13 минут замеряли среднюю частоту кадров с помощью утилиты “Fraps”.
Тестовые приложения обычно демонстрируют большее практическое значение. Поэтому мы постарались сконцентрировать своё внимание на high-end приложениях.
Игры OpenGL: Quake 3 Arena
На обоих тестах Quake, Athlon 64 FX-51 обгоняет обычный P4 на 25 кадров в секунду. Явно заметна высокая производительность памяти.
SPECviewperf 7.1
Широко известный тест SPEC позволяет измерить производительность приложений для рабочих станций. Шина AGP (канал HyperTransport на 800 МГц для Athlon 64) подвергается сильной нагрузке. Intel P4 не может угнаться за Athlon 64 FX-51 в трёх тестах. Недостатки чипсета nVidia nForce3 отчётливо видны!
Игры OpenGL: Serious Sam
Тест Serious Sam доказывает, что Athlon 64 FX-51 является прекрасным игровым процессором: он обгоняет самый быстрый “обычный” P4 на 15 процентов. Даже Athlon 64 3200+ демонстрирует 5-процентное преимущество.
Игры OpenGL: Wolfenstein Enemy Territory
В этой игре Athlon 64 FX-51 выходит в лидеры, обгоняя “обычный” P4 3,2 на 3,9 процента.
Синтетические тесты: 3D Mark 2001 SE
Архитектура Athlon прекрасно себя показывает в старом движке DirectX: с отрывом в 2000 очков от “обычного” P4 3,2 ГГц (на 10,7 процентов), Athlon 64 FX-51 является явным лидером. Также P4 3,2 ГГц отстаёт от Athlon 64 3200+ на 848 очков.
Игры: Comanche 4
Схожий сценарий: с отрывом на 8,1 процента, Athlon 64 FX-51 обгоняет P4 3,2 ГГц. “Маленький” Athlon 64 не может побить P4.
Игры: Unreal Tournament 2003
Оба процессора Athlon 64 смогли обойти “обычный” P4 3,2 ГГц в этой игре: FX-51 идёт в отрыв на 18 процентов, а 3200+ – на 9,7 процента.
Игры: Splinter Cell
Схожий сценарий: “обычный” Intel Pentium 4 3,2 ГГц вновь проигрывает. Athlon 64 FX-51 обгоняет его на 21 процент – в то время как “массовая” версия даёт на 11,3 процента большую производительность.
Игры: Warcraft III – The Frozen Thorne
Данная стратегия реального времени даёт схожие результаты для обоих процессоров.
Синтетические: 3D Mark 2003
В тесте процессора Athlon 64 FX-51 вырывается вперёд на 15,2 процента.
Игры: X2 – The Threat Rolling
На платформе nForce3 Athlon 64 FX-51 смог чуть-чуть (1 процент) дистанцировать себя от Intel P4 3,2 ГГц по производительности. Тест не запустился в комбинации платформы VIA K8T800 и Socket 940, выдав “синий экран”.
Игры: Gun Metal
Без вопросов: оба процессора Athlon 64 работают явно быстрее Intel P4 3,2 ГГц. FX-51 уходит вперёд на целых 16,3 процента.
Игры: AquaMark3
При игре в AquaMark3 Athlon FX-51 даёт 104,8 fps против 100,8 fps у P4 3,2.
Кодирование MPEG: Main Concept MPEG Encoder
Поскольку программа по кодированию видео оптимизирована под архитектуру P4 (Hyper-Threading), “обычный” P4 3,2 уходит вперёд на 7,6 процента.
Кодирование MPEG: Pinnacle Studio 8.8
Кодирование MPEG-2 облегчается при использовании Pinnacle Studio 8.8: Athlon 64 FX-51 работает примерно на одном уровне с Intel P4 3,2 ГГц. В связи с меньшей тактовой частотой 2000 МГц, “маленький” Athlon 64 3200+ отстаёт от FX-51.
Кодирование MPEG: Xmpeg и Divx 5.1 Pro
Очевидно, что даже у Athlon 64 нет никаких шансов против P4 в приложениях потокового видео: FX-51 на 5,3 процента медленнее.
Кодирование MPEG: Windows Media Encoder 9
Победителем в этом раунде выходит Intel: P4 3,2 ГГц работает на целых 9,6 процента быстрее.
Кодирование MPEG: MS Movie Maker 2
Та же самая ситуация: благодаря оптимизации, Intel P4 обгоняет оба процессора Athlon 64.
Magix MP3 Maker 2004 Diamond
Ещё одно приложение, оптимизированное под Intel Pentium 4. Athlon 64 FX-51 отстаёт на 25,6 процента, в то время как Athlon 64 – на 45,3 процента. Сенсация: Athlon XP 3200+ оказался в этом тесте быстрее, чем Athlon 64 3200+. Причина очевидна: более высокая тактовая частота.
Lame MP3 Encoder
Используя кодер Lame MP3, P4 3,2 ГГц оказался на 10 секунд быстрее.
Steinberg Nuendo 2
Эта профессиональная программа работает со сложным проектом, занимающим объём больше 2 Гбайт. Athlon FX-51 оказывается на 6,5 процента медленнее, чем P4 3,2 ГГц. Здесь вновь Athlon XP 3200+ работает быстрее, чем Athlon 64 3200+. Ещё одно доказательство, что тактовая частота имеет значение.
Sysmark 2002
Данный тест немного устарел и мало отражает реальную производительность.
Winrar 3.2
В популярной программе по сжатию данных WinRAR P4 3,2 ГГц оказывается на 6,5 процента быстрее, чем Athlon 64 FX-51.
Newtek Lightwave 7.5
Старая крепость Intel пала: Athlon 64 FX-51 обгоняет P4 3,2 ГГц на 4,5 процента. Athlon 64 3200+ даёт чуть худшую производительность: он на 5,2 процента медленнее, чем P4 3,2 ГГц. Причина: тактовая частота имеет значение!
Cinema 4D XL 8.1
Технология P4 Hyper-Threading прекрасно показывает себя в этом тесте: Athlon 64 FX-51 отстаёт на 19,6 процента.
Seti@home 3.03
Да, P4 с Hyper-Threading побить не удалось: даже 64-битная версия под Linux даёт не лучшие результаты при использовании Athlon 64 FX-51 и Athlon 64 3200+.
3D Studio Max 5.1
Что касается профессионального рендеринга, то P4 3,2 ГГц и Athlon 64 FX-51 примерно равны по силам.
Mathematica 5
Прекрасные показатели процессоров AMD: даже Athlon 3200+ обгоняет “обычный” Intel P4 3,2 ГГц.
PC Mark 2002 Pro
P4 3,2 ГГц побеждает в тесте процессора, в то время как Athlon 64 FX-51 показывает неплохие результаты в тесте памяти.
SiSoft Sandra Max 3
Данный тест процессора не обеспечивает весомых результатов. Тест памяти демонстрирует, что Athlon 64 FX-51 обеспечивает вполне достойные 5,6 Гбайт/с.
Защита от перегрева: теперь и от AMD, тоже
Способ работы встроенного термодиода интересен: за тепловую защиту процессора Athlon 64 отвечает внешний чип, к примеру, Maxim 6657 (AD1032 или LM90/LM86). По данным Maxim, чип может замерять температуры от 60°C до 100°C с максимальной частотой 16 Гц (16 проверок в секунду). Наши тесты (см. видео) доказали, что механизм защиты процессора действительно работает. Что интересно, логику чипа Maxim можно обойти с помощью сигнальной линии “THERMTRIP_CPU”. На следующей диаграмме показана схема.
Ценовое сравнение четырёх систем, использованных в тестировании
Athlon 64FX-51 | Athlon 64 3200+ | Athlon XP 3200+ | Intel P4 3,2 EE | |
Процессор | $799 | $499 | $359 | $849 |
Кулер | $50 | $50 | $50 | $50 |
Материнская плата | $229 | $199 | $119 | $214 |
Память DDR400, 1 Гбайт | примерно $450 | примерно $450 | $399 | $356 |
Видеокарта – GeForce FX 5900 Ultra | $599 | $599 | $599 | $599 |
Звуковая карта – Terratec Aureon 7.1 | $99 | $99 | $99 | $99 |
Контроллер SATA – Promise FastTrak S150T | $94 | $94 | $94 | Встроен |
Жёсткие диски- 2x Maxtor 80 Гбайт SATA | $208 | $208 | $208 | $208 |
DVD-ROM 16x MSI MS-8216 | $39 | $39 | $39 | $39 |
Дисковод | $13 | $13 | $13 | $13 |
Блок питания Enermax 460 Вт | $99 | $99 | $99 | $99 |
Общая цена | $2679 | $2349 | $2078 | $2526 |
Мы собрали системы с учётом максимальной производительности, то есть на основе самых быстрых компонентов, доступных на сегодняшний момент. В тестовых системах мы использовали 1 Гбайт памяти (DDR 400), состоящий из двух разных модулей памяти, в зависимости от тестовой конфигурации. Это также объясняет разницу в цене. Обратите внимание, что система на Athlon 64 FX-51 требует специальной памяти DDR400 (регистровая) для своей работы. Жёсткие диски достигали оптимальной производительности лишь в массиве RAID 0.
Заключение: P4 3,2 EE побеждает 32 раза, Athlon 64 FX-51 – 15 раз, а 64-битное будущее для AMD – в тумане
После четырёх недель напряжённого тестирования, бессонных ночей, пропущенных телефонных звонков, многочисленных обновлений, мучительных конференций и переговоров с производителями, результат налицо: благодаря идеально подобранной конфигурации и использованию самых лучших компонентов, P4 3,2 Extreme Edition (по сути, Xeon, перемаркированный в P4) получает корону производительности. Былая слабость P4 по игровым приложениям была нивелирована с помощью добавления 2 Мбайт кэша L3. Но AMD Athlon 64 FX-51 лишь чуть медленнее. В 3D-играх 1 Мбайт кэша L2 и быстрый доступ к памяти (HyperTransport) помогают победить главного конкурента – Intel P4 3,2 (стандартное издание).
Мы пока не можем оценить производительность Athlon 64 в чистой 64-битной среде, поскольку альфа-версия Windows XP 64, протестированная нами, а также недостаток готовых приложений не дают сделать чётких выводов. AMD предлагает архиватор GZIP, оптимизированный под 64 бита, который работает намного быстрее по сравнению с 32-битной версией. Но при внимательном рассмотрении мы попадаем в маркетинговую ловушку: если оптимизировать код под P4, то, как и случилось в нашем тестировании, процессоры Intel работают быстрее в обычных 32-битных приложениях. Так что пока для использования 64 бит весомых аргументов нет. AMD попала в типичную ловушку “курица/яйцо”. Как только на рынке появится достаточное число процессоров Athlon 64, программная индустрия отреагирует соответствующим образом. За исключением солидной производительности в 32-битном окружении, пользователям следует принимать совместимость с x86-64 как приятный бонус, поскольку использовать его на данный момент вы всё равно не сможете.
Если вы желаете в должной мере насладиться нашим тестированием, то не упустите возможность скачать видеоролик THG номер 10.
Новый видеоролик 10 можно скачать по следующим адресам:
Он содержит множество интересных моментов относительно наших тестов. Видео также можно рассматривать в качестве своеобразного введения в данную тему.
Intel пока ещё не решила, когда компания пожелает вынести на настольный рынок сложную архитектуру IA-64. Или пойти путём x86-64, подобно AMD. Но если рынок всё же сдвинется в сторону 64 бит, то у производителя есть в рукаве секретный козырь – проект “Yamhill”.
Поскольку Intel уже подозревала, чем закончится вечная дуэль между Athlon 64 и P4, производитель несколько дней назад, на IDF (Форум Intel для разработчиков 2003) в Сан-Хосе, в спешке анонсировал P4 Extreme. Мы там тоже были: процессор не представляет собой ничего большего, чем Intel Xeon с этикеткой P4 на нём, дополненный кэшем 2 Мбайт L3 и работающим на частоте FSB800 (реальная частота FSB 200 МГц) и 3,2 ГГц. Чтобы обеспечить возможность работы на высоких частотах, в процессоре была отключена проверка ECC. За несколько часов до публикации статьи Athlon 64 обходил стандартное издание Pentium 4. Но с выпуском P4 Extreme Edition Intel существенно подпортила объявление AMD. Сейчас последний процессор от Intel побеждает в большинстве тестов. Честно ли было со стороны Intel делать подобные косметические изменения перед выпуском Athlon 64? Здесь можно дискутировать вечно.
Заключение: P4 3,2 EE побеждает 32 раза, Athlon 64 FX-51 – 15 раз, а 64-битное будущее для AMD – в тумане, продолжение
Если посмотреть на доступные платформы для обоих процессоров Athlon 64, то nVidia следует доработать чипсет nForce3. С одной стороны, туннель HyperTransport AGP работает на пониженной скорости, с другой – сетевой чип тоже проделывает фокусы. На данный момент лучшим решением является чипсет VIA K8T800, причём он доступен как для Socket 754 (Athlon 64), так и для Socket 940 (Athlon 64 FX-51). Пользователям не нужно беспокоиться: оба чипсета уже включены в наши тестовые таблицы. Насчёт Athlon 64 FX-51 следует отметить одну не очень приятную особенность: вместе с этим процессором необходимо использовать дорогую и редкую особую память (регистровую DDR400). AMD или производители материнских плат ничем здесь помочь не могут. Подобные модули выпускают Corsair и Kingston.
Технически говоря, то, что говорилось насчёт Opteron, точно так же можно отнести и к двум Athlon 64: AMD не пошла путём значительных усилий, интегрировав 64-битные расширения в существующую концепцию x86. Архитектура Hammer не имеет каких-либо реальных изменений в дизайне ядра или обработке инструкций в 32-битной среде, по сравнению со старым ядром Athlon Barton. Однако в ядре были сделаны модификации для достижения высоких тактовых частот 2,4 ГГц и выше. 12-ступенчатый конвейер вместе с технологией SOI дают прекрасный потенциал для увеличения тактовых частот. Скоро нам следует ждать появления Athlon 64 FX-53 с частотой 2,4 ГГц.
Комбинация удвоенного кэша L2 и встроенного на кристалл контроллера памяти существенно повышает производительность во многих приложениях. Однако прогрессивная архитектура Hammer может в полной мере продемонстрировать своё преимущество над Intel Netburst в двухпроцессорной, или, что ещё лучше, четырёхпроцессорной средах. Рекордсменом по тепловыделению сегодня можно назвать P4 Extreme с почти 94 ваттами, в то время Athlon 64 FX-51 выделяет всего 89 ватт.
Вкратце о числе транзисторов: в связи с добавлением 2 Мбайт кэша L3 число транзисторов на P4 EE выросло до 178 миллионов – против 105,9 миллионов на Athlon 64. Напомним, что Intel Pentium 100 из 1994 года имел 3,3 миллиона транзисторов и выделял около 12 ватт.
Несколько слов о чистых 64-битных операциях: никому не нужно подобное расширение для чисто офисных приложений. AMD лучше нацелиться на рынок хардкорных геймеров. Неплохой рекламой стала бы культовая игра Doom III (или Half Life II) для 64 бит. Убежденные игроки с лёгкостью бы отдали сумму в 2500 евро за новый компьютер, чтобы ублажить себя. Однако, если посмотреть на уже имеющееся на компьютере программное обеспечение, то 64 бита не дают каких-либо преимуществ. Программы необходимо полностью переделывать, чтобы они смогли получать преимущество от работы под Windows XP 64. В том, что производитель осуществит это в ближайшее время, – мы сомневаемся.
История процессоров