Обзор Snapdragon S4 Pro | Введение
C самого начала эры компьютерной техники настоящие энтузиасты всегда хотели знать как можно больше о “железе”, на базе которого построены их машины. Электронные компоненты, из которых собраны вычислительные устройства, всегда имели большое значение, даже если мы наслаждались вовсе не ими, а самими гаджетами, будь то антикварный Tandy 1000 c процессором Intel 8088 или современный планшет на чипе с архитектурой ARM.
Благодаря стандартизации, в 80-х годах прошлого столетия у пользователей появилась возможность заменять отдельные части IBM-совместимых компьютеров. И хотя многие вспомогательные компоненты впаивались в печатные платы, мы всё ещё помним, что можно было установить в компьютер карту расширения для мыши с COM-интерфейсом, модем или “высокопроизводительный” винчестер на 20 Мбайт.
Спустя какое-то время мы уже с восторгом приветствовали появление модернизируемых процессоров (даже с помощью “набортных” модулей кэш-памяти L2), стандартизированные форматы памяти, более быстрые графические интерфейсы и широкий спектр подключаемой периферии. Это был поистине золотой век для опытных пользователей – тех, кто точно знал, сколько нужно потратить и на что именно, чтобы получить систему с требуемой производительностью.
Эта модель работает и сегодня – в десктопах компьютерных энтузиастов. Однако по мере того как мы продвигаемся в эпоху мобильности, форм-факторы компактных планшетов и смарфонов лишают нас той гибкости, которую предоставляли домашние игровые машины. Сегодня при покупке мобильного устройства выбор фактически сводится к объёму нерасширяемой памяти, предназначенной для хранения музыки, фильмов и фотографий.
В каком-то смысле, мы вернулись назад. Мы приносим в жертву портативности возможность играть в игры с тем качеством, к которому привыкли. И чем меньше становится устройство, чем хуже его производительность. И поскольку эти миниатюрные платформы высокоинтегрированы, у энтузиастов обычно нет ни единого шанса заставить гаджет работать быстрее.
В этом и заключается суть проблемы. Разработчики больше не пишут программы для iOS или Android – они оптимизируют свой софт для конкретных аппаратных платформ. Компания Nvidia, возможно, добилась самых значительных успехов на ниве сотрудничества с программистским сообществом: игры, “заточенные” под “систему на чипе” Tegra 3, попросту не будут работать на устройствах Android на основе любых других процессоров.
Независимые программисты делают действительно потрясающие вещи для Tegra 3, тем не менее, доля Nvidia на рынке смарфонов в 2011 году оставалась сравнительно небольшой (по данным Strategy Analytics, она занимала 6 место). Ведущим игроком выступает фирма Qualcomm, выпускающая семейство “систем на чипе” Snapdragon. И естественно, что любой шаг, который предпримет эта компания, будет иметь значительное влияние на развитие мобильного рынка.
Платформа для разработчика S4 Pro MDP
Недавно представители Qualcomm пригласили нас на семинар, где мы получили возможность самостоятельно оценить перспективные процессоры Snapdragon S4 Pro, доступные в дву- и четырёхъядерных вариантах.
Через некоторое время после этого мы обзавелись собственным экземпляром платформы S4 Pro Mobile, благодаря которой мы смогли провести доскональное сравнение производительности Snapdragon S4 Pro с планшетами, построенными на конкурирующих платформах. Впереди много цифр, так что пристегните ремни!
Обзор Snapdragon S4 Pro | Линейка процессоров: ЦП Krait и графика Adreno
Портфолио Qualcomm чрезвычайно обширно. Первые мобильные “системы на чипе” под маркой Snapdragon появились ещё в 2008 году, когда была выпущена платформа S1. Сегодня, в 2012 году, перед нами серия S4, представляющая уже четвёртое поколение микросхем.
S4 Play | S4 Plus | S4 Pro | S4 Prime | |
ЦП | 2 ядерный ARM Cortex A5 до 1,2 ГГц | 2 ядерный Krait до 1,7 ГГц | 2 или 4 ядерный Krait до 1,7 ГГц | 4 ядерный Krait до 1,7 ГГц |
ГП | Adreno 203 | вплоть до Adreno 305 | Adreno 320 | Adreno 320 |
Видео | FWVGA | до 1080p | HD 1080p | HD 1080p |
Связь | 3G/4G/LTE | 3G/4G/LTE | 3G/4G/LTE | 3G/4G/LTE |
Камера | 8 Мпикс | до 20 Мпикс, набор для 3D | до 20 Мпикс, набор для 3D | до 20 Мпикс, набор для 3D |
GPS | gpsOne Gen7 | gpsOne Gen8A | gpsOne Gen8A | gpsOne Gen8A |
USB | 2.0 High Speed | 2.0 High Speed OTG (480 Мбит/с) | 2.0 High Speed OTG (480 Мбит/с) | 2.0 High Speed OTG (480 Мбит/с) |
Bluetooth | дискретный чип 3.x | встроенный 4.0* | встроенный 4.0* | встроенный 4.0* |
Wi-Fi | дискретный чип 802.11n (2,4 ГГц) | встроенный 802.11n (2,4/5 ГГц)* | встроенный 802.11n (2,4/5 ГГц)* | встроенный 802.11n (2,4/5 ГГц)* |
Техпроцесс | 45 нм | 28 нм | 28 нм | 28 нм |
- * В отдельных модификациях
Под общим названием Qualcomm S4 скрываются четыре семейства продуктов, каждое из которых состоит из отдельных чипов, ориентированных на различное применение.
К примеру, S4 Prime позиционируется в качестве решения для “умных” TB и телевизионных приставок. “Система на чипе” MPQ8064 – единственный чип, входящий в эту серию, и он может похвастаться четырёхъядерным ядром с микроархитектурой Krait и графическим ускорителем Adreno 320.
Гвоздь нашей сегодняшней программы, семейство Snapdragon S4 Pro, включает в себя две разных микросхемы, MSM8960T и APQ8064. Первая из них представляет собой двуядерный процессор Krait, а вторая – четырёхъядерный. Оба чипа выполнены по 28-нм технологии и снабжены одинаковой графикой высшего класса Adreno 320. При этом модель MSM8960T дополнительно снабжена встроенным модулем 3G/4G/LTE, который отстутствует в APQ8064.
Семейства S4 Plus и S4 Play, предназначенные для смартфонов и планшетов, состоят из 14 различных “систем на чипе” со встроенными модулями беспроводной связи и без них.
Микросхемы Snapdragon S4 Pro занимают высшее положение в иерархии чипов Qualcomm S4, предназначенных для мобильных устройств, поэтому неудивительно, что в основу платформы для разработчиков, которую мы приобрели для нашей лаборатории, был положен чип APQ8064.
Блок-схема “системы на чипе” MSM8960
И хотя формально микросхемы Snapdragon S4 Pro лишь вторые в “табели о рангах” линейки S4, эти системы, безусловно, относятся к высокопроизводительным. Как мы уже говорили, APQ8064 построен на основе четырёхъядерного центрального процессора Krait, работающего на тактовой частоте от 1,5 до 1,7 ГГц. В Qualcomm не смогли предоставить нам блок-диаграмму именно чипа APQ8064, поэтому представьте себе, что на схеме MSM8960 появились два дополнительных ядра, а модуль связи стал намного меньше (только Wi-Fi и Bluetooth, без доступа к сотовым сетям).
Каждое ядро Krait снабжено 16 Кбайтами кэш-памяти L1 для данных и 16 Кбайтами L1 для инструкций, и каждые два ядра делят общий кэш второго уровня объёмом 1 Мбайт. Вычислительные ядра Qualcomm Krait унаследовали основные особенности архитектуры Scorpion, которую мы описывали в статье Third-Generation Snapdragon: The Dual-Core Scorpion (англ.). В нижеследующей таблице мы приводим более подробные сведения об архитектурах Krait и Scorpion в сравнении с ARM Cortex-A9 и ARM Cortex-A15.
Сравнение архитектуры | ||||
Cortex-A9 | Cortex-A15 | Scorpion | Krait | |
Длина конвейера | 8 ступеней | 15/17-24 ступени (целочисленный, с плавающей запятой) | 10 ступеней | 11 ступеней |
Внеочередное исполнение инструкций | Да | Да | Частично | Да |
Техпроцесс | 45/30/32 нм | 32/28 нм | 65/45 нм | 28 нм |
Число ядер | 1/2/4 | 2/4 | 1/2 | 2/4 |
Кэш-память | L1: 32+32 Кбайт L2: 1 Мбайт |
L1: 32+32 Кбайт L2: до 4 Мбайт |
L1: 32+32 Кбайт L2: 256 Кбайт (на ядро) |
L1: 16+16 Кбайт L2: 1 Мбайт (на два ядра) |
DMIPS/МГц | 2,5 | 3,5 | 2,5 | 3,3 |
В отличие от многих конкурентов, компания Qualcomm тратит множество времени и вкладывает значительные средства в разработку собственных процессорных ядер на базе ARM. К примеру, в основу конструкции Scorpion положена та же самая архитектура ARMv7-A, что используется в ядрах Cortex-A8 и Cortex-A9. Однако в варианте Qualcomm конвейер исполнения инструкций разбивается на иное число ступеней, применяется внеочередное исполнение инструкций и обеспечивается поддержка 128-битных SIMD-команд. Благодаря столь существенным доработкам, Scorpion заметно отличается от стандартного Cortex-A9, и это помогает объяснить некоторые его победы в тестах производительности.
В ядре Krait была ощутимо повышена скорость работы за счёт усложнения архитектуры (плюс более тонкий 28-нм техпроцесс). Каждое ядро теперь может декодировать до трёх инструкций за такт (по сравнению с двумя в Scorpion) – как и чип ARM Cortex-A5. Конвейер целочисленных операций в Krait состоит из 11 ступеней – на одну длиннее, чем у Scorpion, но не настолько длинный, как 15-ступенчатый конвейер A15. На практике, более длинный конвейер означает возможность добиться более высокой тактовой частоты.
Инженеры Qualcomm также реализовали в Krait возможность работы каждого ядра на различных тактовых частотах, что улучшает показатели энергосбережения в приложениях, когда не требуются вычислительные ресурсы всех ядер “системы на чипе”. Полезная функция, но она далеко не нова: подобная возможность была предусмотрена ещё в ядре Scorpion. Кроме того, пятое “дополнительное” ядро в NVidia Tegra 3 работает по тому же принципу.
Обзор Snapdragon S4 Pro | Производительность Scorpion и Krait: разница поколений
GeekBench v2
Оставив в стороне технические подробности, зададимся простым вопросом: насколько различается производительность ядер Qualcomm Scorpion и Krait? Пакет GeekBench поможет оценить эту разницу в целом.
Баллы Geekbench
Система на чипе | Целочисленные вычисления | Вычисления с плавающей запятой | Память |
Nvidia Tegra 3 (T30L) (4 ядра Cortex-A9 @ 1,3 ГГц) | 1298 | 2288 | 1222 |
TI OMAP 4430 (2 ядра Cortex-A9 @ 1 ГГц) | 750 | 1298 | 853 |
Apple A5/A5X (2 ядра Cortex-A9 @ 1 ГГц) | 691 | 921 | 830 |
Qualcomm S3 (APQ8060) (2 ядра Scorpion @ 1,2 ГГц) | 594 | 708 | 946 |
Qualcomm S4 Plus (MSM8960) (2 ядра Krait @ 1,5 ГГц) | 964 | 2251 | 1666 |
Qualcomm S4 Pro (APQ8064) (4 ядра Krait @ 1,5 ГГц) | 1400 | 3292 | 1276 |
Судя по полученным результатам, Krait почти втрое мощнее предшественника, причём наибольший прирост производительности отмечается в операциях с плавающей запятой. Интерес представляет и сравнение Krait с чипом Nvidia Tegra 3, работающим в таких планшетах, как Nexus 7 и Transformer Pad.
Выдающаяся производительность в операциях с плавающей запятой – отличный подарок для разработчиков игр, и мы надеемся, что первенство Qualcomm в этой дисциплине послужит дальнейшему совершенствованиию мобильных игр. В документации Google на операционную систему Android рекомендуется с осмотрительностью использовать вычисления с плавающей запятой, поскольку на “гуглофонах” они выполняются примерно вдвое медленнее, чем целочисленные. И, тем не менее, мы видим, как процессор OMAP 4430 компании Texas Instruments обходит Apple A5/A5X в тесте GeekBench на расчёты с плавающей запятой – несмотря на тот факт, что обе микросхемы построены на двуядерном Cortex-A9 с тактовой частотой 1 ГГц. Так что там говорят о высокой производительности в iOS?
Разработчики программного обеспечения всё ещё вынуждены писать код для нескольких аппаратных платформ, одни из которых быстрее других, и очень может быть, что именно устройства на базе Krait будут демонстрировать наилучшую производительность, доступную на рынке.
SiSoft Sandra, Android Edition
Sandra – одно из тех диагностических приложений, которые позволяют покопаться в недрах настольных систем, чётко разбирая все показатели производительности по полочкам. В будущем компания-разработчик SiSoftware планирует выпустить специальную версию этой программы для устройств под управлением Android. Нам была любезно предоставлена ранняя бета-версия, которую мы и использовали для этого обзора.
Общая производительность SiSoftware Sandra
OMAP 4430 | Tegra 3 (T30L) | S3 (APQ8060) | S4 Plus (MSM8960) | S4 Pro (APQ8064) | |
ЦП | 2 ядра Cortex-A9 @ 1 ГГц | 4 ядра Cortex-A9 @ 1,3 ГГц | 2 ядра Scorpion @ 1,2 ГГц | 2 ядра Krait @ 1,5 ГГц | 4 ядра Krait @ 1,5 ГГц |
Арифметическая (MOPS) | 463 | 1133 | 365 | 593 | 1194 |
Мультимедийная (кПикс/с) | 2301 | 5912 | 3297 | 5067 | 9642 |
Арифметическая Java (MOPS) | 90 | 225 | 86 | 171 | 278 |
Память (Мбайт/с) | 603 | 968 | 1265 | 3308 | 4104 |
Разумеется, четырёхъядерная архитектура располагает врождённым преимуществом при любой многопоточной нагрузке. Поэтому мы также провели сводные тесты производительности на каждое ядро, чтобы выявить возможности каждого вычислительного блока.
И вновь процессор Krait и платформа Snapdragon S4 Pro перехватывает инициативу у соперников Cortex-A9 и Scorpion.
Общая производительность SiSoftware Sandra из расчета на ядро
OMAP 4430 | Tegra 3 (T30L) | S3 (APQ8060) | S4 Plus (MSM8960) | S4 Pro (APQ8064) | |
ЦП | 2 ядра Cortex-A9 @ 1 ГГц | 4 ядра Cortex-A9 @ 1,3 ГГц | 2 ядра Scorpion @ 1,2 ГГц | 2 ядра Krait @ 1,5 ГГц | 4 ядра Krait @ 1,5 ГГц |
Арифметическая (MOPS/поток) | 231,5 | 283,2 | 182,5 | 296,5 | 298,5 |
Мультимедийная (кПикс/с/поток) | 1150,5 | 1478,0 | 1648,5 | 2533,5 | 2410,5 |
Арифметическая Java (MOPS/поток) | 45,0 | 56,2 | 43,0 | 85,5 | 69,5 |
Память (Мбайт/с/поток) | 301,5 | 242,0 | 632,5 | 1654,0 | 1026,0 |
Обзор Snapdragon S4 Pro | Сухие факты: производительность вычислительного ядра на такт
Производительность на такт рабочей частоты
До этого момента мы сравнивали производительность разных “систем на чипе” в различных устройствах. Но нам известно – хотя бы из официальных спецификаций Qualcomm APQ8064, – что ядра Krait могут работать на тактовых частотах от 1,5 до 1,7 ГГц. Мы также знаем, что Tegra 3 работает на частотах от 1,2 до 1,6 ГГц.
Поэтому все те выводы, к которым мы приходим в нашей лаборатории, не могут быть автоматически применены к другим планшетам или смартфонами, в особенности, если их “системы на чипе” работают на более высоких или низких частотах. Именно поэтому столь ценен индекс производительности ядра за такт, рассчитываемый пакетом Sandra: он позволяет повысить точность измерений, перейдя от производительности на ядро к производительности на ядро при постоянной тактовой частоте.
Производительность ядра на заданной тактовой частоте
OMAP 4430 | Tegra 3 (T30L) | S3 (APQ8060) | S4 Plus (MSM8960) | S4 Pro (APQ8064) | |
ЦП | 2 ядра Cortex-A9 @ 1 ГГц | 4 ядра Cortex-A9 @ 1,3 ГГц | 2 ядра Scorpion @ 1,2 ГГц | 2 ядра Krait @ 1,5 ГГц | 4 ядра Krait @ 1,5 ГГц |
Арифметическая (MOPS/MГц) | 0,23 | 0,21 | 0,15 | 0,20 | 0,20 |
Мультимедийная (кПикс/с/МГц) | 1,15 | 1,14 | 1,37 | 1,69 | 1,60 |
Арифметическая Java (MOPS/МГц) | 0,045 | 0,043 | 0,035 | 0,057 | 0,051 |
Память (Мбайт/с/МГц) | 0,301 | 0,19 | 0,53 | 1,10 | 0,75 |
Разумеется, в этом тесте процессорная архитектура Qualcomm Krait демонстрирует хорошие результаты, но за них ответственна, в значительной степени, высокая тактовая частота в 1,5 ГГц (по крайней мере, в нашей мобильной платформе), которая позволяет добиться преимущества над OMAP 4430. Что же касается производительности на такт, то здесь преимущество уже за “системой на чипе” производства TI.
Конечно, это не повод преуменьшать достоинства Qualcomm APQ8064: для этой “системы на чипе” 1,5 ГГц – это минимальная тактовая частота. Микросхема TI работает на частотах от 1 до 1,2 ГГц, поэтому даже если она демонстрирует чуть лучшую арифметическую производительность на такт, её конкретная реализация просто не может угнаться за более современным воплощением на базе ядер Kraig.
Производительность ядра на заданной тактовой частоте: арифметический тест
OMAP 4430 | Tegra 3 (T30L) | S3 (APQ8060) | S4 Plus (MSM8960) | S4 Pro (APQ8064) | |
ЦП | 2 ядра Cortex-A9 @ 1 ГГц | 4 ядра Cortex-A9 @ 1,3 ГГц | 2 ядра Scorpion @ 1,2 ГГц | 2 ядра Krait @ 1,5 ГГц | 4 ядра Krait @ 1,5 ГГц |
Dhrystone (MIPS/МГц) | 2,34 | 2,21 | 1,92 | 2,55 | 2,64 |
Whetstone (ФЛОПС/МГц) | 0,023 | 0,021 | 0,012 | 0,15 | 0,015 |
Whetstone Плав. Зап. (ФЛОПС/МГц) | 0,031 | 0,029 | 0,016 | 0,16 | 0,022 |
Whetstone Плав. Зап./Двойн. (ФЛОПС/МГц) | 0,026 | 0,025 | 0,011 | 0,15 | 0,018 |
Проведя арифметическую часть теста, мы можем определить причины преимуществ OMAP 4430, которые нашли отражение в первой таблице. И хотя Qualcomm APQ8064 достигает выдающейся производительности в целочисленных вычислениях за такт, его показатели в тесте Whetstone на вычисления с плавающей запятой неизменно хуже, чем у OMAP 4430.
Повторим, что все эти результаты – полностью синтетические. OMAP 4430 и APQ8064 никогда не смогут посоревноваться на одной и той же тактовой частоте. Мы же просто интересуемся, откуда берутся сильные стороны той и другой процессорных архитектур.
Производительность ядра на заданной тактовой частоте: мультимедийный тест
OMAP 4430 | Tegra 3 (T30L) | S3 (APQ8060) | S4 Plus (MSM8960) | S4 Pro (APQ8064) | |
ЦП | 2 ядра Cortex-A9 @ 1 ГГц | 4 ядра Cortex-A9 @ 1,3 ГГц | 2 ядра Scorpion @ 1,2 ГГц | 2 ядра Krait @ 1,5 ГГц | 4 ядра Krait @ 1,5 ГГц |
Мультимедийный целочисленный [NEON] (кПикс/с/МГц) | 1,15 | 1,14 | 1,23 | 1,34 | 1,38 |
Мультимедийный Плав. Зап. [NEON] (кПикс/с/МГц) | 1,16 | 1,09 | 1,53 | 2,13 | 1,81 |
Мультимедийный Двойн. [FPU] (кПикс/с/МГц) | 0,56 | 0,54 | 0,40 | 0,33 | 0,42 |
Мультимедийный Плав.Зап./Двойн.Двойн. (кПикс/с/МГц) | 0,80 | 0,77 | 0,77 | 0,83 | 0,87 |
И если провести подобное сравнение в мультимедийном тесте Sandra, мы увидим, за счёт чего архитектура Krair опережает, во-первых, Scorpion, и, во-вторых, OMAP Cortex-A9.
В тех случаях, когда APQ8064 может воспользоваться 64- и 128-разрядными инструкциями ARM NEON, он легко вырывается вперёд. И только когда Sandra возвращается к измерению производительности в векторном режиме с плавающей запятой, Snapdragon S4 Pro уступает лидирующие позиции. Вряд ли стоит беспокоиться по этому поводу: поскольку NEON намного более мощный набор инструкций, у него куда больше шансов получить поддержку в реальных приложениях.
Эффективность многоядерных вычислений на ядро
Много лет назад в Intel и AMD перестали делать упор на быстрые одноядерные настольные процессоры и начали конструировать ЦП с несколькими ядрами в одном корпусе. Программистам пришлось научиться использовать дублирующиеся ресурсы для извлечения из такой конструкции какой-то пользы.
То же самое сейчас происходит на рынке мобильных чипов, когда многоядерные “системы на чипе” продвигают вычислительный параллелизм в энергоэффективные архитектуры. Впрочем, как и у дестопных процессоров, производительность дву- или четырёхъядерных чипов не нарастает линейно. Синтетические измерения позволяют получить наилучший результат такого масштабирования, но в реальном мире не всё так идеально.
Частично причина в том, каким образом эти ядра взаимодействуют друг с другом. Для работы многопоточных приложений используется распределение данных между ядрами, и если это распределение организовано неэффективно, то общая производительность падает. Существенное значение для эффективности многопоточной обработки данных имеет пропускная способность каналов и низкий уровень задержки. Процессор TI OMAP 4430 способен за секунду перемещать большую часть данных между ядрами, Nvidia Tegra 3 буквально дышит ему в спину – но уже благодаря минимальной латентности.
Обзор Snapdragon S4 Pro | Производительность в графике: Adreno 320 в тестах GLBenchmark 2.1 и 2.5
К счастью, производительность графического ядра Adreno 320 оценить гораздо проще. Начнём с внеэкранного теста в программном пакете GLBenchmark 2.1.
GLBenchmark 2.1
Результаты говорят сами за себя. Графическое ядро SGX543MP4, используемое в планшете Apple iPad 3, это чемпион по производительности при разрешении экрана 1280×720 точек. Ядро Qualcomm Adreno 320 почти не уступает творению Imagination Technologies в тесте Egypt, но отстаёт примерно на 30% в тесте Pro.
Скорость заполнения сцены у графических процессоров PowerVR очень хороша, и это большое преимущество Imagination Technologies, поскольку, как рассказали нам разработчики мобильных игр, именно филлрейт – основное “бутылочное горло” для таких видеоигр.
И хотя Adreno 320 отстаёт от SGX543MP, Qualcomm всё же заслуживает уважения за улучшение своей графической архитектуры. Adreno 320 выдаёт в три-четыре раза больше кадров в секунду, чем Adreno 220, а его скорость заполнения пикселями в шесть раз выше.
GLBenchmark 2.5, OpenGL ES 2.0 для разрешения 1080p
Со временем, популярные сегодня экранные разрешения эволюционируют до дисплеев высокой чёткости. Нам уже известен планшет Apple iPad третьего поколения с экраном 2048х1536 точек, требующий более мощного графического ускорителя. Очевидно, что тесты мобильных графических архитектур в значительно более требовательных приложениях становятся всё более актуальными. Лучшее, что мы можем сделать сегодня, это воспользоваться самым свежим пакетом Kishonti GLBenchmark 2.5, который, как и предшественник, тестирует преимущественно работу с программным интерфейсом OpenGL ES 2.0, но при этом уделяет особое внимание разрешению 1920х1080 точек и текстурам высокого качества.
После суровых испытаний, которым GLBenchmark 2.5 подверг каждую тестируемую графическую подсистему, результаты поменялись. На сей раз Qualcomm Adreno 320 вышел победителем над SGX543MP4. В действительности, разница в производительности очень невелика, а тест Pro, который ранее отдавал предпочтение графике PowerVR, больше не является частью этого пакета. Поэтому победу Adreno 320 нельзя признать убедительной. Но, по крайней мере, интересно видеть, что Adreno способен выдавать более высокий филлрейт в условиях повышенной нагрузки.
К сожалению, графика Qualcomm неспособна приблизиться к скорости заполнения, которую обеспечивает технология “отложенной мозаичной отрисовки” (Tile Based Deferred Rendering, TBDR), реализованная в графике Imagination Technologies. Тем не менее, Adreno 320 демонстрирует существенное превосходство над чипом предыдущего поколения Adreno 220.
Обзор Snapdragon S4 Pro | Qualcomm снова в игре
Платформа Snapdragon S4 Pro, демонстрирующая кардинальный рост общей и графической производительности, вооружает компанию Qualcomm нужными цифрами для схватки с нынешними тяжеловесами, в которых используются “системы на чипе” на базе Cortex-A9.
Но так уж устроен мир высоких технологий, что Qualcomm вскоре придётся столкнуться с ещё большей конкуренцией. Дело в том, что уже в ближайшем будущем ожидается появление чипов Nvidia Tegra следующего поколения и TI OMAP 5430. Обе микросхемы будут построены на ядрах Cortex-A15 и, вне всяких сомнений, смогут похвастаться намного более производительной графикой.
При этом перед Qualcomm встаёт целый ряд препятствий. Первое из них – недостаточное количество игр, в которых могут проявиться сильные стороны архитектуры Adreno. Вспомним уже ставший легендарным ход Nvidia по привлечению независимых поставщиков программного обеспечения для поддержки платформы Tegra, оказавшийся более чем плодотворным для продвижения на мобильном рынке. Существует несколько оптимизированных под Tegra видеоигр (например, RipTide и Shadowgun). Более того, версии некоторых игры вроде Sonic the Hedgehog 4: Episode II для Tegra, были выпущены раньше вариантов для других устройств под управлением Android.
Энтузиасты настольных компьютеров, скорее всего, не относятся серьезно к играм, написанным специально для смартфонов и планшетов. Тем не менее, они очень важны для поставщиков аппаратного обеспечения, которым необходима демонстрация возможностей графических процессоров. Например, компания Apple использует игры серии Infinity Blade для рекламы необычайных способностей планшетов iPad. И, как мы все знаем, производителям нужен софт, чтобы оправдать разработку ещё более мощного оборудования.
Второе препятствие заключается в том, что сами устройства на базе Snapdragon S4 Pro могут появиться на рынке намного позже, чем хотели бы в Qualcomm. Микросхема APQ8064, на которой построена наша мобильная платформа, – чрезвычайно привлекательная “система на чипе”: она может похвастаться новой архитектурой центрального процессора Krait, графикой Adreno 320 и модулем Wi-Fi. Но для того, чтобы использовать эту микросхему в смартфонах, придётся устанавливать дополнительный чип для подключения к сотовым сетям, а это практически наверняка негативно скажется на энергопотреблении.
Сравнение тепловыделения Snapdragon S4 с конкурентами и “тест с кусочками сливочного масла”
Микросхема MSM8960T, в которую уже встроен модуль сотовой связи, демонстрирует лучший баланс между производительностью и энергопотреблением (по целому ряду причин). Однако никаких телефонов на базе этой “системы на чипе” до сих пор нет. И остаётся только предполагать, как будут смотреться нынешние достоинства Snapdragon S4 Pro на фоне новых микросхем Nvidia и TI.
Что же касается краткосрочных перспектив, то мы с удовольствием дождёмся серийных планшетов или смартфонов на основе платформы Snapdragon S4 Pro, которая быстрее любой другой, когда-либо существовавшей в этом сегменте. Судя по планам конкурентов, которые нам довелось увидеть, с сильными соперниками Qualcomm придётся столкнуться не раньше 2013 года. Хочется надеяться, что за это время компания сумеет привлечь независимых программистов, способных правильно использовать многообещающие возможности графического ускорителя Adreno 320.