Тест и обзор AMD A10 | APU AMD на базе Trinity
APU для десктопов на базе Llano AMD выпустила в 2011 году, и мы рассматривали их в обзоре “AMD A8-3850: обзор процессора Llano для недорогих настольных компьютеров”. То, что процессор ориентирован на десктопы подразумевает, что производительность его мобильных версий будет весьма высока. Мы по-прежнему впечатлены мощностью встроенного графического движка и временем автономной работы, и не сомневаемся, что с помощью Llano AMD отберёт у Intel определённую часть рынка.
Однако, если проанализировать продажи за 2011 год, становится видно, что изменения не так существенны, как могло показаться: по данным IDC (International Data Corporation) процессоры AMD установлены в 16 процентах всех ноутбуков, выпущенных за год. Получается, что с момента появления APU продажи возросли на 2,5%. Intel продолжает лидировать, её доля в мобильном сегменте составляет около 84%. Из 564 ноутбуков на Newegg, 108 на базе AMD (19%) и 456 используют платформы Intel (81%). Если архитектура Llano так хороша, почему их доля увеличилась так слабо?
Очевидно, что APU только набирают обороты на рынке мобильных устройств. Тем не менее, решение новое и заставить разработчиков писать софт по-новому очень тяжело, такое сопротивление мы видели, когда двух и четырёхъядерные процессоры постепенно начали вытеснять одноядерные. Кроме того, слабость Llano – это производительность ядер x86. Intel просто обходит AMD и в большом количестве тестов, и в реальных приложениях. Вспоминается последняя фраза из нашего обзора Llano: “… нам придётся дождаться Trinity, чтобы посмотреть, способна ли AMD выпустить APU, которое сможет одновременно и победить Intel по вычислениям, и выйти в лидеры по интегрированной графике. Такой процессор почти гарантировано будет более успешным, чем нынешний Llano.”
Ну вот и дождались. AMD представила архитектуру Trinity, и хотя мы почти уверенны, что она обойдёт Intel по графике, нам больше любопытно увидеть, как AMD улучшила ядра x86. CPU Trinity основан на микроархитектуре Piledriver, которая нам знакома по линейке процессоров FX. Как мы выяснили в обзоре процессора AMD FX-8150, его модульная концепция очень близка к чипам на базе архитектуры Sandy Bridge, которую впоследствии заменила Ivy Bridge. Мы приблизительно знаем, как AMD планировала доработать Bulldozer и маловероятно, что эти усилия сильно улучшат позиции AMD по сравнению с последними решениями Intel.
Тем не менее, когда в прошлом месяце мы были на Trinity Tech Day в Остине, AMD отметила несколько любопытных моментов. Естественно, презентация приводилась так, чтобы основные недостатки были как можно меньше заметны. Однако, в словах маркетинговых представителей AMD был смысл: бенчмарки не дают полную картину.
Конечно, не удивительно, что компания, чьи процессоры пытаются догнать конкурентов во многих тестах, говорит такое. И естественно, мы не согласны с утверждением, что объективные результаты сравнительных тестов не важны, напротив, они являются сердцем хорошего обзора. Однако из презентации мы взяли несколько основных идей: во-первых, если функция или технология не поддаётся тестированию или оценке в привычном нам виде, скорее всего, она не так важна, и не имеет значения насколько она влияет на производительность; во-вторых, надо учитывать, как люди используют свой ПК, и опираться на это при формировании наших выводов в обзорах.
Как нам кажется, оба аспекта можно принять во внимание при написании обзора про любое “железо”. Конечно, они не должны относиться только к одному конкретному производителю, и мы ещё посмотрим, помогут ли данные утверждения AMD при формировании выводов о новых APU, или напротив, помешают.
Теперь, давайте поближе ознакомимся с новой архитектурой AMD, которую мы все с нетерпением ждали.
Тест и обзор AMD A10 | CPU на ядре Piledriver
APU объединяют в себе ядра x86 и графические ресурсы. Поэтому давайте начнём с исследования компонента, который обычно называется CPU.
Когда год назад нам представили APU Llano, мы уже знали, что архитектура Stars находилась на последнем издыхании. В будущем AMD планировала полностью перейти на дизайн Bulldozer, который мы увидели на десктопах только в прошлом октябре.
С премьерой Trinity ситуация обратная. Самая современная архитектура процессоров AMD вначале представлена в мобильном APU. Это обновлённый дизайн Bulldozer под названием Piledriver, который доберётся до настольных компьютеров ближе к концу этого года.
Какие главные отличия между ядрами Husky в архитектуре AMD Llano и Piledriver в Trinity? Четырёхядерные APU Llano используют четыре отдельных исполнительных ядра, а четырёхядерные чипы Trinity два модуля Bulldozer. Каждый модуль содержит два исполнительных ядра. Недостаток в том, что они имеют общие блоки, которые в более традиционных многоядерных решениях дублированы, это блоки выборки и декодирования инструкций, блоки вычислений с плавающей запятой и кэш второго уровня. Напоминаем, что более подробно с архитектурой Bulldozer вы можете ознакомиться в обзоре “AMD FX-8150: от Bulldozer к Zambezi и FX”.
Наиболее очевидным отличием между десктопными процессорами FX и компонентом CPU в APU Trinity является кэш. Каждый модуль APU имеет 2 Мбайт кэша L2, а общего 8-Мегабайтного кэша L3 у Trinity нет, поэтому модульная архитектура суммарно содержит только 4 Мбайт кэша второго уровня, что соответствует характеристикам Llano.
Инженеры AMD ясно дают понять, что одной из важнейших целей в дизайне Piledriver было улучшение IPC по сравнению с Bulldozer. Об этом мы знали ещё после первой презентации Bulldozer, поэтому никого это не удивило. В процессорах серии FX прослеживалось существенное отставание по производительности на такт по сравнению с предшественником, и это необходимо было исправлять. Вместо того, чтобы делать упор на какой-либо один аспект, команда разработчиков использовала различные стратегии, что в результате подправило ситуацию.
Ниже перечислены основные улучшения ядра Piledriver:
Во-первых, модуль предсказания ветвлений был существенно пересмотрен и разделён на два уровня. AMD не сообщила каких-либо подробностей по этому вопросу, сказав лишь, что новый модуль улучшает загрузку конвейера, что способствует общему росту производительности.
В дополнение инженеры увеличили размер окна инструкций, чтобы можно было обрабатывать увеличенные группы. Это в свою очередь улучшает производительность и помогает более эффективно обрабатывать код системного уровня. К тому же было добавлено больше инструкций ISA, включая совмещённое умножение-сложение (FMA3) и 16-битную конвертацию с плавающей запятой (F16C). Архитектура Bulldozer уже поддерживает FMA4, поэтому включение FMA4 обеспечивает поддержку возможностей, которые Intel также представит в архитектуре следующего поколения. По словам AMD сократилось время исполнения инструкций, в результате чего ускорились операции с плавающей запятой и целочисленные вычисления.
Ещё одним ключевым компонентом производительности является подсистема памяти. Ранее мы видели, что важным недостатком архитектуры Bulldozer были высокие задержки у кэш-памяти. Инженеры AMD потратили немало сил для улучшения кэша L2 и аппаратной предвыборки, которые уменьшают задержки во время чтения данных из памяти. Потоковое прогнозирование тоже было улучшено по сравнению с предыдущим поколением APU.
Блок чтения/записи тоже подвергся оптимизациям с целью снижения задержек. Буфер быстрого преобразования адреса L1 (TLB) увеличен вдвое, то есть до 64 записей, чтобы избежать возможного увеличения задержки, так как увеличенный TLB обеспечивает более эффективную структуру. И наконец, планировщик работы с плавающей запятой и планировщик целочисленных операций были усовершенствованы для более эффективного использования всех аппаратных блоков, которые может предложить Piledriver.
Учитывая увеличение тактовой частоты (об этом мы поговорим чуть позже), AMD утверждает, что APU A10-5800K на базе Trinity на 26% лучше десктопного A8-3850 на архитектуре Llano, а A10-4600M на 29% лучше, чем A8-3500M для ноутбуков.
Все вышеупомянутые доработки весьма существенны, и мы будем иметь это ввиду во время проведения тестов. Но сначала, давайте разберёмся с графической частью Trinity.
Тест и обзор AMD A10 | Подробно о GPU (VLIW4 больше VLIW5)
Несмотря на то, что Trinity – это новейшая разработка в портфолио процессоров AMD, APU использует графическую архитектуру прошлого поколения (т.е. она не использует дизайн Graphics Core Next карт серии Radeon HD 7000). Однако, GPU на кристалле Trinity под зловещим названием Devastator – это не просто переделка старой компоновки VLIW5, которую мы впервые видели в видеокарте Radeon HD 2900 XT. GPU основан на более эффективном дизайне VLIW4, представленном в моделях серии Radeon HD 6900.
Исходя из названия можно предположить, что VLIW4 – это VLIW5 минус один и посчитать, что новый движок не улучшен. Однако VLIW4 лучше использует доступные ресурсы в современных играх. Давайте разберёмся почему.
Аббревиатура VLIW нам уже давно знакома (very long instruction word — “очень длинная машинная команда”), а цифра в конце указывает на количество ALU в каждом потоковом процессоре. Согласно анализу AMD, современные игры, зачастую, используют три-четыре ALU на каждом такте. В VLIW4 пятый неэффективный ALU удалён, а остальные четыре улучшены, в результате доступные ресурсы используются лучше, а освободившееся пространство на кристалле позволяет установить больше потоковых процессоров. VLIW4 обеспечивает улучшенную производительность на квадратный миллиметр, лучшее управление потоком и улучшенные вычисления на GPU по сравнению с VLIW5. В новом дизайне также усовершенствован аппаратный тесселятор, с улучшенной системой управления потоками и поддержкой буферизации.
GPU Devastator содержит шесть движков SIMD, каждый состоит из четырёх текстурных блоков и шестнадцати потоковых процессоров. Каждый потоковый процессор имеет четыре ALU, в итоге мы имеем 384 ALU и 24 текстурных блока. Два конвейера рендеринга контролируют вывод, каждый рендерер может обрабатывать четыре полноцветных растровых операции за такт на совокупном интерфейсе памяти 128-бит и восьми блоках ROP.
С первого взгляда эти характеристики похожи на таковые у ядра Sumo в архитектуре Llano, однако у Devastator на шестнадцать ALU меньше, а текстурных блоков на четыре больше. Тем не менее, в движке VLIW5 80 ALU архитектуры Llano могут вообще не использоваться. Таким образом мы ожидаем, что новый APU обгонит своего предшественника как в играх, так и в вычислительных операциях.
Также есть несколько менее значительных отличий. Например, Trinity поддерживает три независимых выхода на дисплей (четыре, если подключать дисплеи напрямую друг к другу через DisplayPort), в то время как Llano ограничен двумя выходами и DisplayPort 1.1a. Каждый из четырёх дисплеев поддерживает свой собственный защищённый аудио поток 7.1, также доступно и группирование мониторов.
В дополнение ко всему новая модель включает логику с фиксированными функциями, связанную с кодированием H.264 – AMD Video Codec Engine (VCE), которую мы не имели возможности протестировать в видеокартах серии Radeon HD 7000, поскольку функция не была включена программно. В данном обзоре мы её протестируем, но чуть позже.
Тест и обзор AMD A10 | APU Trinity в целом
Теперь давайте разберёмся, как совмещаются CPU и GPU . Но сначала советуем вам ознакомиться со статьёй “AMD A8-3500M: обзор APU Llano”, чтобы разобраться, как AMD собирает свои APU, поскольку далее мы будет говорить исключительно про Trinity.
В новом APU 1,303 миллиарда транзисторов расположены на кристалле размером 226 квадратных миллиметров. Размер кристалла Llano составляет 228 мм². Как и Llano, Trinity произведён по техпроцессу SOI 32 нм от GlobalFoundries. Заводская частота масштабируется гораздо больше, чем у Llano, потолком для CPU является 3,8 ГГц и 800 МГц для GPU у топовых моделей. TDP маломощных моделей находится на уровне 17 Вт. В особенности продуктовой линейки мы углубимся позже, но сейчас известно, что Trinity масштабируется выше и ниже Llano. Стоит добавить, что новый APU поставляется с одним или с двумя модулями, т.е. с двумя или четырьмя ядрами, поэтому шести или восьмиядерных APU в этом поколении не будет.
Только взглянув на кристалл можно сразу сказать, что в Trinity AMD отводит больше места под графику. Похожая ситуация наблюдается у Ivy Bridge и Sandy Bridge. Однако нас это нисколько не удивило, поскольку в архитектуре Piledriver основной упор сделан на совместное использование некоторых блоков.
Новый объединённый северный мост (Unified Northbridge (UNB))
Llano использует стандартную шину CPU-to-Northbridge и Fusion Control Link для работы GPU с памятью. В Trinity новый объединённый северный мост (UNB) заменяет старое “железо”. Это первая реализация UNB от AMD вне области серверов. Технический директор AMD Боб Макри (Bob Macri) сравнивает это с постовым в центре дороги. Этот компонент связывает остальные с памятью и подсистемой ввода/вывода. Он должен обслуживать различные функциональные блоки, каждый из которых делает особенные запросы со специфическими параметрами.
Например, CPU отправляет относительно мало запросов на UNB, однако им даётся высокий приоритет, поскольку дополнительная задержка может серьёзно повлиять на производительность. С другой стороны, GPU создает тысячи связей и для нормальной работы требует активного использования DRAM. В этом случае UNB оптимизирует и перенаправляет запросы, и GPU может получить доступ к подсистеме памяти наиболее эффективным способом. Также UNB играет важную роль в понижении мощности и меняет частоту памяти в зависимости от нагрузки, чтобы обеспечить оптимальное энергопотребление для каждого рабочего модуля.
Новый контроллер памяти
Подсистема памяти особенно важна для APU, так как много функциональных блоков соперничают за пропускную способность. Контроллер памяти Trinity разработан по-новому с поддержкой модулей DIMM 1,25 В, которые потенциально экономят энергию. Возможна установка модулей DDR3-1866 для настольных систем и DDR3-1600 для ноутбуков, впрочем, как и у Llano. В настольную платформу можно установить до 64 Гбайт памяти с пиковой пропускной способностью системы 29,8 Гбайт/с. Мобильная конфигурация поддерживает до 32 Гбайт с пропускной способностью 25,6 Гбайт/с.
Ускоренные вычисления и IOMMUv2
Вычислительная мощность Llano составляла 572 гигафлоп, однако потенциал Trinity увеличился до 736. Увеличение, в большей степени, связано с улучшениями GPU Devastator, однако в глаза бросается и новый блок IOMMUv2.
Этот модуль добавляет виртуальную адресацию для дискретной графики, тем самым позволяя внешнему GPU получать доступ к тому же виртуальному адресному пространству, как CPU через таблицы страниц. Как вы понимаете, это ключевая часть модели программирования архитектуры гетерогенных систем AMD (Heterogeneous Systems Architecture (HAS)).
Turbo Core 3.0
Turbo Core третьего поколения – это последняя версия технологии, которая впервые была представлена в процессорах Phenom II X6 на базе архитектуры Thuban. Теперь она якобы динамично меняет частоту CPU и GPU. На слайде с презентации AMD показано, что питание и частоты могут переключаться у CPU и GPU в зависимости от типа нагрузки.
К сожалению, с помощью утилиты системного мониторинга от AMD мы такого поведения не увидели, напротив, номинальная частота CPU находилась на уровне 2,3 ГГц, независимо от нагрузки. Однако скорость GPU колебалась и падала до уровня 334 МГц во время работы однопоточного теста Cinebench. Возможно, что Turbo Core 3.0 работает неверно, либо утилита мониторинга от AMD показывает частоту CPU некорректно. Этот вопрос мы задали AMD, где нам сказали, что на данный момент нет утилиты, которая может точно отследить частоту чипа в данном режиме. Между прочим, такой же ответ мы получили год назад, когда компания представила Llano. В ближайшем будущем мы уделим этой проблеме больше внимания.
Управление питанием
Как и Llano, дизайн Trinity разработан с учётом нересурсоемких приложений. В таблице выше выделены все основные улучшения по энергопотреблению, которые AMD сделала в новом APU. Сюда входит оптимизация питания режима CC6, в котором могут выключаться отдельные модули Piledriver, когда в трёх или четырёх исполнительных ядрах нет необходимости. Также есть возможность отключать модули целиком.
При нормальном использовании APU активно задействует оба канала памяти DDR3 для графических данных. Но когда графическая нагрузка минимальна, активность APU понижается и вывод переопределяется на один канал памяти. Чип даже может отправить неиспользуемый канал в режим сна и понизить тактовую частоту активного канала до минимума, необходимого для дисплея.
Инженеры AMD также увеличили буферизацию памяти на кристалле так, чтобы к DRAM не было много запросов, поэтому “прожорливая” память остаётся в состоянии низкого энергопотребления как можно дольше.
Тест и обзор AMD A10 | Чипы и платформы
Как и в случае с чипами Llano, AMD предлагает Trinity сначала в мобильной версии, а затем в десктопной. Поскольку APU лучше всего подходят для мобильных устройств, это даёт AMD возможность показать новые чипы с самой выгодной стороны.
Ноутбукам потребуется новый сокет FS1r2 (или интерфейс FP2 для моделей с низким напряжением), однако для большинства пользователей ноутбуков, которые не обновляют свои процессоры – это не так важно. К сожалению, для пользователей настольных систем обновление будет более проблематичным, поскольку Trinity нужна материнская плата с Socket FM2. Владельцам платформ Socket FM1 придётся сменить платы всего за одно поколение. Не очень приятно.
На сегодня у нас есть информация о первых мобильных моделях A6, A8 и A10.
Как видите, чипы A8 и A10 на базе Trinity имеют четыре ядра, а A6 уже только два. Это одновременно удивительно и странно, так как в A6 на архитектуре Llano было четыре ядра.
Модели A10 используют GPU с 384 ядрами, а в A8 – 256 ядер. A6 включают 256 или 192 в зависимости от энергопотребления модели: 35 Вт или модели с TDP 17 Вт.
Говоря о низком энергопотреблении стоит упомянуть про APU LV и ULV. Модели A10-4655M с TDP 25 Вт и A6-4455M с TDP 17 Вт можно будет увидеть в мобильной концепции “Ultrathin” от AMD, которая будут противостоять Intel Ultrabook и Apple MacBbook Air. Первые OEM-ноутбуки Ultrathin, работающие с этими APU, можно будет увидеть в течение месяца или около того, их толщина будет составлять 18 и 22 мм.
К сожалению, по поводу десктопных чипов Trinity информации у нас нет. AMD говорит, что модели будут представлены с двумя вариантами TDP: 65 Вт и 100 Вт, к тому же частота CPU будет колебаться между 2,0 ГГц и 3,8 ГГц, а частота графического движка в пределах 424 и 800 МГц. В пресс-релизе представители AMD также отмечали модель APU A10-5800K. Это, вероятно, флагман с TDP 100 ВТ, частотой ядра 3,8 ГГц и частотой GPU 800 МГц. Суффикс K указывает на разблокированный множитель.
Позиционирование и цены
На диаграмме выше показано, как AMD позиционирует ноутбуки с Trinity. Конкурирующие позиции AMD в отношении производительности процессора кажутся оптимистичными, но в то же время графический потенциал может быть недооценён по сравнению с решениями на архитектуре Sandy Bridge (хотя это изменится, когда закончатся чипы Core второго поколения и начнутся поставки ноутбуков с процессорами Core i5 третьего поколения).
Dual Graphics
Технология Dual Graphics позволяет совмещать графическое ядро APU с дискретным GPU. Она досталась чипам Trinity от предыдущей архитектуры. AMD не ограничивает работоспособность только в пределах одной архитектуры. Вы можете комбинировать дизайн VLIW4 с внешними картами с архитектурой VLIW5, включая переименованные GPU от Radeon HD 7400 до 7600.
Также возможны и другие комбинации Dual Graphics, конечно те, в которых AMD видит смысл.
Тест и обзор AMD A10 | Тестовая конфигурация и бенчмарки
В данном обзоре мы сравним три мобильных платформы. AMD обеспечила нас ноутбуком с топовым APU A10-4600M, который будет стоить примерно $600, когда попадёт на полки магазинов (хотя во время презентации указывалась цена $700).
Аналогичные по цене модели с процессорами Ivy Bridge ещё не появились, поэтому в качестве участника со стороны Intel мы использовали ноутбук с Core i5-2450M на борту. Несмотря на то, что цены на ноутбуки с одинаковыми процессорами варьируются в пределах от $550 до $1000, большинство моделей находятся в диапазоне $660-$900.
Чтобы сравнить Trinity с Llano, к тестам мы добавили ноутбук с A8-3500M. В качестве дополнительного бонуса эта модель укомплектована Dual Graphics, мы сможем протестировать её с дискретной видеокартой Radeon 6630M.
Тестовый стенд для APU Trinity имел SSD на 128 Гбайт и два модуля памяти DDR3-1600. Мы не уверенны, что вы найдёте такой дорогой SSD в ноутбуке за $700. Поэтому, чтобы всё было по-честному, мы используем одинаковый SSD и память для всех трёх платформ. К нашему удивлению, на системе с A8-3500M нам не удалось заставить работать память как DDR3-1600, и поэтому мы оставили её работать на скорости 1333 с низкими задержками. Поскольку в BIOS нет опции по ручной настройки скорости передачи данных, такая настройка осталась для всех тестов.
Разрешение 1366×768 наиболее популярно для моделей данного ценового диапазона, однако тесты мы проводили на разрешении 1280×800, потому что оно лучше поддерживается внешними мониторами. Некоторые модели поддерживают разрешение 1600×900, поэтому его мы тоже протестируем. И наконец, ко всему прочему, мы добавим разрешение 1024×600. Прежде чем вы скажете, что никто не играет на таком разрешении учтите, что плотность пикселей на мониторе 27″ с разрешением 1080p составляет около 80 DPI. 1024×600 на экране 15″ даёт 85 DPI, что немного выше.
AMD Llano A8-3500M | AMD Trinity A10-4600M | Intel Core i5-2450M | |
CPU | AMD A8-3500M (Llano) четыре ядра, 4 Мбайт L2 1.5 ГГц (2.4 ГГц Max Turbo) | AMD A10-4600M (Trinity)четыр е ядра, 4 Мбайт L2 2.3 ГГц (3.2 ГГц Max Turbo) | Intel Core i5-2450M (Sandy Bridge) два ядра, Hyper-Threading вкл., 3 Мбайт L3 2.5 ГГц (3.1 ГГц Max Turbo) |
Материнская плата | Compal PCL10 чипсет: AMD A70 Fusion Controller Hub с поддержкой USB 3.0 | Платформа AMD Trinity Comal FF чипсет: AMD A70M | HP 1695 чипсет: Intel HM65 |
Сеть | встроенный контроллер Gigabit LAN | встроенный контроллер Gigabit LAN | встроенный контроллер Gigabit LAN |
Память | 4 Гбайт DDR3 1346 МГц 2 x 2 Гбайт, CL 9-9-9-23-1T Micron MT8KTF25664HZ-1G6M1 | 4 Гбайт DDR3 1600 МГц 2 x 2 Гбайт, CL 11-11-11-28-1T Micron MT8KTF25664HZ-1G6M1 | 4 Гбайт DDR3 1600 МГц 2 x 2 Гбайт, CL 11-11-11-28-1T Micron MT8KTF25664HZ-1G6M1 |
Графика | Radeon HD 6620G (встроенная) 444 МГц GPU, общий DDR3 на 667 МГц Radeon HD 6630M 444 МГц GPU, общий DDR3 на 667 МГц |
Radeon HD 7660G (встроенная) 444 МГц GPU, 1 Гбайт DDR3 на 667 МГц | Intel HD Graphics 3000 (встроенная) 650 МГц GPU, общий DDR3 на 667 МГц |
Накопитель | Samsung SSD 830 Series 128 Гбайт | Samsung SSD 830 Series 128 Гбайт | Samsung SSD 830 Series 128 Гбайт |
ПО и драйверы | |
Операционная система | Microsoft Windows 7 x86, Service Pack 1 |
DirectX | DirectX 11 |
Видео драйвер | Intel Core i5-2520M:Intel Graphics Driver 15.26.8.64.2696 AMD Llano A8-3500M: AMD Catalyst 12.4 Mobility BETA AMD Trinity A10-4600M: 8.945-120328a-136239E BETA |
Тесты и настройки | |
3D игры | |
Metro 2033 | Версия 1.0.0.1, DirectX 9, утилита для тестов, низкая дестализация, без AA, 4x AF, advanced physX выкл., тесселяция выкл.,DOF выкл. |
Crysis 2 | Adrenaline benchmark tool, самые низкие настройки |
The Elder Scrolls V: Skyrim | Обновление до 1.4.27, Celedon Aethirborn уровень 6, Fraps 25 секунд |
DiRT 3 | V1.01, запуск с праметром -benchmark example_benchmark.xml |
Аудио/видео тесты | |
iTunes | Версия: 10.4.1, 64-bit Audio CD (“”Terminator II”” SE), 53 мин., конвертация в аудио формат AAC |
Lame MP3 | Версия 3.98.3 Audio CD “”Terminator II SE””, 53 мин., конвертация WAV в MP3, Комманда: -b 160 –nores (160 кбит/с) |
HandBrake CLI | Версия: 0.9.5 Видео: Big Buck Bunny (720×480, 23.972 кадров) 5 минут, Аудио: Dolby Digital, 48 000 Гц, шесть каналов, Английский, в Видео: AVC Audio: AC3 Audio2: AAC (High Profile) |
Cyberlink MediaEspresso | Версия: 6.5 |
Arcsoft MediaConverter | Версия: 7.5 |
Тесты – приложения | |
WinRAR | Версия 4.1: THG-Workload (650 Мбайт) в RAR, Параметры коммандной строки “winrar a -r -m3” |
WinZip | Версия 16.5:THG-Workload (650 Мбайт) в ZIP, Параметры коммандной строки “-a -ez -p -r” |
7-Zip | Версия 9.22: THG-Workload (650 Мбайт) в.7z, Параметры командной строки “a -t7z -r -m0=LZMA2 -mx=5” |
Cinebench | Версия 11.5 Build CB25720DEMO тесты CPU и OpenGL |
Adobe Photoshop CS 6 (64-Bit) | Версия CS6 x64: Фильтр: изображение 15.7 Мбайт в формате TIF: Radial Blur, Shape Blur, Median, Polar Coordinates |
ABBYY FineReader | Версия: 10.0.102.82 Чтение PDF сохранение в Doc, Источник: Political Economy (J. Broadhurst 1842) 111 страниц |
Autodesk 3ds Max 2012 | Версия 12.0 x64: Space Flyby Mentalray, 248 кадров, 1440×1080 |
Синтетические тесты | |
PCMark 7 | Версия: 1.0.4 |
3DMark 11 | Версия 1.0.3 |
3DMark Vantage | Версия 1.0.2 |
SiSoftware Sandra 2012 SP3 | CPU Test=CPU Arithmetic/Multimedia, тест памяти=тест пропускной способности, криптография, задержки кэша |
Тест и обзор AMD A10 | Тесты графики: 3DMark
Поскольку процессор Core i5-2450M не поддерживает DirectX 11, нам пришлось вернуться к тестовому пакету 3DMark Vantage:
В этом старом тесте A10-4600M лидирует с большим отрывом, даже в сравнении с APU с дискретной видеокартой Radeon HD 6630M. Интегрированная графическая система Core i5-2450M сильно отстаёт, хотя вычислительные ядра этого процессора превосходят конкурентов.
Напомним, что нам не удалось добавить Core i5-2450M в тест 3DMark 11, поскольку тест требует поддержи DirectX 11. Тем не менее интересно посмотреть, как Llano противостоит Trinity. Как и ожидалось, встроенный движок 6620G в A8-3500M остался далеко позади, а встроенная графика Radeon HD 7660G в A10-4600M обошла даже дискретную 6630M.
Тест и обзор AMD A10 | Результаты тестов: DiRT 3
DiRT 3 может использовать DirectX 11. Но поскольку Intel HD Graphics поддерживает максимум DirectX 10, мы использовали DirectX 9 для всех решений, чтобы сравнение было справедливым.
На разрешении 1024×600 с 4x MSAA A10-4600M удерживает минимальный уровень 30 FPS, за ним, с небольшим отрывом, следует A8-3500M. Результат Intel Core i5-2450M можно назвать приемлемым и, вероятно, он будет ещё лучше, если выключить сглаживание.
На разрешении 1280×800 Trinity и Llano всё ещё предоставляют приемлемый уровень FPS c MSAA, пониженным до 2x. Intel находится ниже предела 20 FPS.
На более высоком разрешении с выключенным сглаживанием Trinity поддерживает частоту кадров на уровне 30 FPS, а чип на базе Llano отстаёт лишь немного. Однако ядро Intel HD Graphics 3000 просто вне конкуренции.
Тест и обзор AMD A10 | Результаты тестов: The Elder Scrolls V: Skyrim
Elder Scrolls V: Skyrim – это красивая игра (не говоря о её популярности). Поэтому нам само-собой интересно, как с ней справятся мобильные системы со встроенными графическими решениями.
На уровне графики Medium A10-4600M легко справляется с Skyrim при включённом 4x MSAA и 8x AF. Однако A8-3500M не смог обеспечить минимальный уровень 30 FPS, а графическая часть процессора Intel Core i5-2450M слишком медленная для этой игры.
С повышением разрешения до 1280×800 и понижением MSAA до 2x, платформа на базе Trinity по-прежнему обеспечивает относительно высокий уровень частоты кадров, но остальные участники этим похвастаться не могут.
На разрешении 1600×900 мы выключили MSAA в пользу FXAA – алгоритма сглаживания на базе CPU, который размазывает картинку при низких разрешениях, но делает её более чёткой на высоких. Новый APU всё ещё обеспечивает комфортный уровень FPS, если не считать небольшое падение ниже 30 FPS. A8-3500M и Core i5-2450M справляются куда хуже.
Тест и обзор AMD A10 | Результаты тестов: Crysis 2
Crysis 2 не предназначена для видеокарт начального уровня, но мы попробовали играть на разрешении 1024×600.
Для стабильных условий мы используем утилиту Adrenaline. И хотя мы выставили самые низкие настройки детализации, с помощью этой утилиты отключить размытие движений невозможно. Однако в игре эту функцию убрать можно.
На разрешении 1024×600 A10-4600M обходит A8-3500M, но Intel Core i5-2450M с ними сравниться не может. Trinity предоставляет минимум 27 FPS, мы считаем, что это вполне приемлемо для нормальной игры, особенно если учесть, что в самой игре можно выключить размытие движений, что ещё добавит производительности. Как бы там ни было, A8-3500M ещё хоть как-то справляется, в то время как на i5-2450M играть невозможно.
С увеличением разрешения ситуация сильно ухудшается. Конечно, здесь лидирует A10-4600M, но ни одно решение для нормальной игры на 1280×800 не походит.
Исключительно для полноты сравнения мы протестировали игру на разрешении 1600×900. Что тут сказать? Чем дальше, тем хуже.
Тест и обзор AMD A10 | Результаты тестов: Metro 2033
Теперь перейдём к одной из самых требовательных игр – Metro 2033.
Система на базе Trinity почти достигла удовлетворительного уровня частоты кадров на разрешении 1024×768, но минимальная граница слишком низкая. Как видно из графиков, в большинстве тестов результаты похожи. Это может означать, что игра ограничена производительностью GPU на Intel Core i5-2450M, и CPU на APU.
Очевидно, что ни одна из этих платформ не подходит для данной игры.
Тест и обзор AMD A10 | Тесты CPU: PCMark и Sandra 2012
Возможно это не справедливо, но PCMark указывает в пользу Intel. Мы озадачены тем, что производительность A10-4600M очень близка, а иногда и вплотную приближается к Intel Core i5-2450 во всех отдельных подтестах, а вот общий балл получается достаточно низким.
В арифметическом тесте Sandra процессор Core i5-2450M ведёт с существенным отрывом, а расширение iSSE4.2 совсем не помогает A10-4600M. Модель A8-3500M далеко позади остальных участников.
Обращаем ваше внимание, что мы не строим наши выводы на основе результатов таких диагностических утилит как Sandra. Конечно, оценивать потенциал производительности интересно, но основой для наших рекомендаций служат результаты тестов на реальных приложениях.
FMA3 не смог обеспечить A10-4600M победу над Intel Core i5-2450M.
Результаты теста Sandra Cryptography на удивление близки, вероятно, из-за AES-NI на платформах Trinity и Sandy Bridge. A8-3500M в этом тесте гораздо слабее.
GPGPU/GPCPU вычисления
Дизайн AMD Trinity просто блистает в тесте Sandra GPGPU/GPCPU Cryptography, он обгоняет и Llano, и Sandy Bridge. Оба APU выигрывают от изначальной поддержки OpenCL через драйвер AMD. Тем временем Sandy Bridge может только эмитировать поддержку на вычислительных ядрах x86.
В тесте пропускной способности памяти результаты кажутся низкими как для Trinity, так и для Llano, однако бывали случаи, когда тест выдавал неточные результаты, особенно на свежеанонсированном “железе”.
Тест и обзор AMD A10 | Тесты CPU: продуктивность
Архитектура ядер x86 Intel помогает лидировать Sandy Bridge в многопоточном тесте FineReader. AMD Trinity остановилась посередине между Llano и Sandy Bridge.
WinZip 16.5 предлагает для APU ускорение OpenCL, благодаря которому A10-4600M может немного обойти Intel Core i5-2450M.
Мы долго ждали приложений, которые задействуют OpenCL и продемонстрируют преимущества ускорения универсальных вычислений, и это, как нам кажется, лучший пример увеличения производительности в столь доступном и популярном приложении.
WinRAR и 7-Zip поддерживают многопоточность. Они не пользуются ускорением OpenCL, а опираются на эффективность работы архитектуры. Не удивительно, что в данном тесте лучше всех справился процессор компании Intel.
Тест и обзор AMD A10 | Тесты CPU: создание контента
Мы перешли на новую версию Photoshop CS6, однако стандартная многопоточная нагрузка из шести фильтров осталась. Результаты не отражают выгоды поддержки OpenCL. Тем не менее, AMD A10-4600M справляется гораздо лучше, чем система на базе Llano. Но всё же A10-4600M примерно на 33% медленнее Intel Core i5-2450M.
Несмотря на то, что тест не использует поддержку OpenCL, реализованную в приложении, мы хотим отметить, что функция помогает обрабатывать отнюдь не все задачи. Кроме того, любое устройство с поддержкой OpenCL (включая HD Graphics 3000), может использовать алгоритмы ускорения с их программной эмуляцией.
Intel зарабатывает ещё одну победу, уже в 3ds Max. В этом тесте результаты A10-4600M ближе к A8-3500M.
Cinebench основан на программе Cinema 4D от Maxon – этот тест хорош не только тем, что отражает производительность реальных приложений, но и обеспечивает измерение скорости обновления окна и скорости рендеринга. Архитектуры Trinity и Llano опережают Intel Sandy Bridge в первой дисциплине, но отстают в окончательном рендеринге.
Тест и обзор AMD A10 | Тесты CPU: кодирование мультимедиа
В тестах кодирования мультимедиа мы рассчитываем проверить логику с фиксированными функциями VCE от AMD. Тестирование мы начнём с CyberLink MediaEspresso 6.5.
Интересные получились результаты. Похоже, что VCE не очень-то помогает Trinity справиться с форматом 480×720 для iPhone 3G. Тем не менее, аппаратная обработка формата 1280×720 для Asus TF101 прошла в два раза быстрее, чем программная.
К несчастью AMD, технология Quick Sync помогает Intel завершить задачу гораздо быстрее.
Arcsoft MediaConverter 7.5 тоже поддерживает VCE, но ускорение кодирования для профиля iPhone 3G на Sandy Bridge и Llano программа не включала.
Похоже, что VCE снова не помогает ноутбуку на базе Trinity обрабатывать целевое разрешение для iPhone, хотя время рендеринга сильно улучшилось. Однако Quick Sync опять достигает более высокого результата, хотя и не так разительно как в предыдущем тесте.
Lame, iTunes и HandBrake не поддерживают OpenCL или VCE. В результате, они быстрее работают на исполнительных ядрах x86 процессора Intel. Но в то же время A10-4600M существенно обгоняет A8-3500M. Мы с нетерпением ждём версии HandBrake с поддержкой OpenCL-ускорения, которая должна появиться в этом году.
Тест и обзор AMD A10 | Расширенное ПО для APU
Вы вероятно уже знакомы с нашими попытками работы с AMD по изучению сегодняшнего состояния ускорения универсальных вычислений, по статьям “Что технология DirectCompute значит для геймеров?” и “OpenCl: приложения с ускоренной постобработкой”. Мы планируем ещё несколько статей на эту тему. Но если честно, у нас не было уверенности в потенциале ускоренных приложений, пока мы не увидели действительно работающие варианты на презентации AMD Trinity.
Одни приложения могут работать с любым оборудованием, поддерживающим OpenCL, другие оптимизированы для функций AMD. Некоторые уже готовы, другим ещё только предстоит увидеть свет.
Во многих случаях улучшения качественные, а не количественные. В результате, мы не можем их протестировать. Об этом мы говорили на первой странице данной статьи и AMD надеется, что при выборе следующей покупки люди это учтут. Давайте рассмотри некоторые приложения, которые читатели THG смогут использовать.
AMD Steady Video
Steady Video – утилита улучшения видео в реальном времени, которая помогает понизить эффект дрожания. Она использует APP-ускорение. Смысл обработки будет понятен, как только вы увидите эту программу в действии. AMD выпустила плагины Steady Video 2.0 для IE, Firefox, Chrome и Windows Media Player.
Так ли она необходима? Есть ли преимущества перед Intel Quick Sync? Вряд ли. По сути, большая часть видеоконтента, который мы просматриваем, не является “любительской трясучкой”. На самом деле мы даже не уверенны, работала ли она когда мы смотрели ролики. Как бы там ни было, новое приложение для технологии AMD, несомненно, интересно смотрится в действии. Если ввести в поисковике запрос “AMD Steady Video”, то вы сможете найти множество демонстрационных роликов.
VLC Media Player
VLC Media Player – это открытый кроссплатформенный бесплатный мультимедиа-проигрыватель. AMD с умом поддерживает VLC, поскольку открытость проекта означает, что большое количество пользователей могут выиграть от поддержки ускорения. Оптимизации включают фильтр шумоподавления в реальном времени на базе OpenCL и поддержку AMD Steady Video. Эти дополнения нельзя назвать необходимыми функциями, но они разработаны для пользователей VLC, которые хотят их опробовать.
WinZip 16.5
Это, возможно, самая широко востребованная из доступных программа с поддержкой OpenCL, и наши тесты доказали, что ускорение оказывает существенное влияние на скорость сжатия. Кажется, AMD действительно выиграла от сотрудничества с Corel, хотя если разобраться в результатах более подробно, новый APU всё же не смог обойти Intel Sandy Bridge. Хотя данная функция подняла производительность A10-4600M вплотную к уровню Core i5-2450M. Однако ускорение выглядит не так впечатляюще, когда оно только уравнивает участников.
Тем не менее, OpenCL – это отраслевой стандарт. И поскольку для поддержки OpenCL AMD работает с Corel, обе компании блокируют Intel и Nvidia. Хотя фанаты AMD не против, если роли в спектакле поменяются, но будут и протестующие. Возможно, даже хорошо, что различия не так существенны.
Media Encode Acceleration – OpenCL и VCE
Arcsoft MediaConverter 7.5, CyberLink MediaEspresso 6.5 и x264 HandBrake (в следующей ревизии) могут выгодно использовать программируемые шейдеры AMD и логику с фиксированными функциями VCE для ускорения кодирования видео. Функция отлично подходит владельцам оборудования AMD. К сожалению, согласно данным наших тестов, производительность улучшается не так сильно, как с технологией Intel Quick Sync.
MotionDSP vReveal
Это приложение улучшает качество видео и отлично демонстрирует возможности AMD Steady Video и рендеринг с GPU-ускорением. Единственный недостаток данной программы, которая, кстати, базируется на профессиональном софте в том, что она решает очень специфические задачи и не применима для широкого круга пользователей. Тем не менее, если для улучшения качества вашего видео вы всё время работаете с vReveal, возможно, имеет смысл рассмотреть в качестве покупки APU или дискретную видеокарту от AMD.
Photoshop CS6
Photoshop CS6 использует около тридцати функций с GPU-ускорением включая плавление, трансформацию, искривление и размытие. В зависимости от того, какую работу вы проводите с помощью приложений Adobe, эти функции могут и вовсе не использоваться. Но если именно они вам и нужны, OpenCL-ускорение может сыграть важную роль. Конечно при условии, если GPU-ускорение работает на устройстве, поддерживающем OpenCL, включая движок Intel HD Graphics 3000, который мы сегодня тестировали. Из нашего опыта, фильтры в реальном времени, такие как плавление, быстрее работают на процессоре Core i5-2450M, а не на APU A10-4600M. Мораль такова: не думайте, что APU быстрее только потому, что приложения используют GPU-ускорение.
GIMP
GIMP – это ещё одна популярная открытая программа, которая позволяет редактировать изображения в стиле Photoshop, она тоже использует мощные функции и у неё немало поклонников. В будущем релизе предусмотрена поддержка девятнадцати фильтров с ускорением OpenCL. У нас не было времени протестировать её из первых рук и она пока недоступна в сети. Поэтому сказать что-нибудь конкретное о её работе мы не можем. Но приятно видеть в нашем списке приложение из обоймы open source.
Adobe Flash Player 11
Adobe Flash Player имеет огромную пользовательскую базу, и новая версия плагина поддерживает 3D-графику.
Мы просмотрели демо игры “Танки онлайн” и нового движка Unreal Engine 3, и были приятно удивлены уровнем детализации, который обеспечивает Flash плеер в окне браузера.
Не забывайте, что Adobe Flash Player ускоряется любым GPU, и хотя AMD APU выглядят сильнее мы заметили, что движка Intel HD Graphics 3000 также достаточно для воспроизведения демо, о которых мы упоминали.
AMD Quick Stream Technology
Данное приложения распределяет приоритет сетевого трафика и отдаёт самый высокий потоковому видео, минимизируя притормаживания. Идея отличная и мы ещё не видели утилит, разработанных специально для потокового видео. Стоит отметить, что раньше мы использовали утилиты, контролирующие приоритет пропускной способности сети, и впечатления остались положительные.
Качество изображения в играх
Для большинства игроков качество изображения – важная составляющая любой игры, и Intel здесь имеет плохую репутацию, предоставляя низкий уровень анизотропной фильтрации. Хотя на сайте SemiAccurate сообщают, что в Ivy Bridge ситуация значительно улучшилась, Sandy Bridge по-прежнему славиться ужасным качеством фильтрации.
Тест и обзор AMD A10 | Энергопотребление
В прошлом году в тестах с измерениями мощности APU Llano выглядел довольно хорошо, поэтому в этот раз нам очень интересно взглянуть на Trinity, особенно после всех разговоров AMD насчёт минимизации утечек. Несмотря на то, что производительность нового APU не превзошла Intel Core i5-2450M в тестах на реальных приложениях и тестах создания контента, для мобильной платформы это, в какой-то степени, может быть простительно, если APU обеспечит более длительную работу от батареи.
Мы проводили следующие тесты с подключённым внешним монитором, дабы убрать возможные колебания, связанные с дисплеем ноутбука. В момент тестирования ноутбук был подключён к розетке, а аккумулятор удалён.
Это, вероятно, самый интересный график во всём обзоре. Несмотря на большое преимущество в производительности A10-4600M в играх, он потребляет примерно на 4 Вт меньше мощности, чем A8-3500M, и примерно на 10 ВТ меньше, чем Intel Core i5-2450M.
Если вы любите играть в “лёгкие” для системы игры на ноутбуке, то APU Trinity точно достоин вашего внимания.
Больше всех энергии во время интернет-сёрфинга потребляет платформа Llano. APU Trinity и Intel Sandy Bridge оказались гораздо эффективней.
Кроме того, энергопотребление у этих платформ примерно одинаковое. Вы заметили, как на последнем этапе теста линии стали прямыми? Здесь мы просматривали видео с YouTube. A10-4600M, похоже, потребляет меньше энергии при просмотре интернет-страниц, чем Core i5-2450M, но немного больше при воспроизведении потокового видео. A8-3500M потребляет больше всех электричества в обоих случаях.
Измерения энергопотребления системы при воспроизведении H.264-видео на разрешении 1080p подтверждает то, что мы видели в конце теста интернет-сёрфинга, хотя мы немного удивлены. AMD утверждает, что энергопотребление Trinity близко к Sandy Bridge при воспроизведении видео. Но наши результаты показывают, что APU потребляет больше энергии (хотя и меньше чем Llano). Мы специально удостоверились, что функции типа AMD Steady Video были выключены перед тестом, поэтому возложить на них вину за такую разницу нельзя.
Тест и обзор AMD A10 | Подводим итоги
Прежде чем перейти к заключению, давайте сравним общую производительность трёх решений.
Похоже что APU на архитектуре Trinity не смог выгнать Sandy Bridge с позиции лидера по производительности. Тем более он не сможет это сделать с Ivy Bridge, когда появятся ноутбуки с процессорами Core i5 третьего поколения. Но он, безусловно лучше, чем Llano.
Однако более важно то, что новый APU значительно увеличивает производительность графики. GPU Trinity намного лучше HD Graphics 3000 и архитектура сможет использовать этот запас преимуществ против движка HD Graphics 4000 у Ivy Bridge. Если вы любите компьютерные игры, вам вполне оправданно можно рекомендовать A10-4600M вместо Intel Core i5-2450M. С другой стороны, если вы не планируете играть на ноутбуке, лучше выбрать Core i5 на Sandy Bridge. В принципе, такой же вывод мы сделали по поводу архитектуры Llano.
Как и в жизни сделать правильный выбор не так уж легко. Есть множество других факторов, которые необходимо учитывать, например, выход ноутбуков с процессорами Core i5 на архитектуре Ivy Bridge ожидается буквально через пару месяцев. Средние по цене процессоры Intel на техпроцессе 22 нм тоже будут включать движок HD Graphics 4000, который, как мы считаем, станет первым серьёзным шагом против доминирования графики AMD. В дополнение ко всему, Ivy Bridge будет иметь более низкий тепловой пакет и чуть более высокую производительность в приложениях. У нас ещё не было возможности протестировать Trinity против Ivy Bridge Core i5, цена которых будет примерно одинаковой, но, в конце концов, различия между новыми чипами обоих компаний могут остаться на таком же уровне, который мы видим между старыми платформами. Мы поделимся с вами результатами, как только у нас появиться соответствующее оборудование.
А что насчёт возможностей, которые нельзя протестировать? Мы действительно впечатлены тем, что AMD приложила гораздо больше усилий для взаимодействия с разработчиками программного обеспечения для реализации GPU–ускорения в нескольких различных сегментах и играх, чем в прошлом году. Но есть одна проблема – ни одно из этих приложений не имеет универсального применения. Например, AMD Steady Video отлично стабилизирует дрожащее видео. Но что если у вас нет видео-материала такого качества, зачем нужна эта функция? Но мы всё равно поощряем стремление AMD распространять ускоренные графическим процессором приложения на более широкую аудиторию. Оптимизация GIMP, HandBrake, vReveal, WinZip и других приложений – это отличный способ продемонстрировать преимущества вычислительных оптимизаций. Есть два но: во-первых, мы хотели бы видеть более определённое влияние GPU-ускорения на производительность конкурирующих процессоров, которые не поддерживают его, и во-вторых, не хотелось бы видеть, как блокируется доступ остальных производителей к программным продуктам, которые должны существовать в открытой экосистеме.
И наконец, что насчёт рекомендаций для распространённых задач? Даже профессиональные пользователи тратят много времени на просмотр почты, интернет-сёрфинг, работу в Word и, конечно, игры. Честно говоря, в большинстве задач трудно проследить различия между вслепую сконфигурированными платформами от Intel и AMD. За исключением игр, где дизайн AMD Trinity действительно блистает.
Остается пара неотвеченных вопросов: как покажет себя Trinity против ноутбука на базе Ivy Bridge по схожей цене, и когда можно будет увидеть ноутбуки на архитектуре Trinity в продаже? Мы постараемся ответить на них как можно скорее.