|
Обзор Snapdragon S4 Pro | Введение
C самого начала эры компьютерной техники настоящие энтузиасты всегда хотели знать как можно больше о "железе", на базе которого построены их машины. Электронные компоненты, из которых собраны вычислительные устройства, всегда имели большое значение, даже если мы наслаждались вовсе не ими, а самими гаджетами, будь то антикварный Tandy 1000 c процессором Intel 8088 или современный планшет на чипе с архитектурой ARM.
Благодаря стандартизации, в 80-х годах прошлого столетия у пользователей появилась возможность заменять отдельные части IBM-совместимых компьютеров. И хотя многие вспомогательные компоненты впаивались в печатные платы, мы всё ещё помним, что можно было установить в компьютер карту расширения для мыши с COM-интерфейсом, модем или "высокопроизводительный" винчестер на 20 Мбайт.
Спустя какое-то время мы уже с восторгом приветствовали появление модернизируемых процессоров (даже с помощью "набортных" модулей кэш-памяти L2), стандартизированные форматы памяти, более быстрые графические интерфейсы и широкий спектр подключаемой периферии. Это был поистине золотой век для опытных пользователей – тех, кто точно знал, сколько нужно потратить и на что именно, чтобы получить систему с требуемой производительностью.
Эта модель работает и сегодня - в десктопах компьютерных энтузиастов. Однако по мере того как мы продвигаемся в эпоху мобильности, форм-факторы компактных планшетов и смарфонов лишают нас той гибкости, которую предоставляли домашние игровые машины. Сегодня при покупке мобильного устройства выбор фактически сводится к объёму нерасширяемой памяти, предназначенной для хранения музыки, фильмов и фотографий.
В каком-то смысле, мы вернулись назад. Мы приносим в жертву портативности возможность играть в игры с тем качеством, к которому привыкли. И чем меньше становится устройство, чем хуже его производительность. И поскольку эти миниатюрные платформы высокоинтегрированы, у энтузиастов обычно нет ни единого шанса заставить гаджет работать быстрее.
В этом и заключается суть проблемы. Разработчики больше не пишут программы для iOS или Android – они оптимизируют свой софт для конкретных аппаратных платформ. Компания Nvidia, возможно, добилась самых значительных успехов на ниве сотрудничества с программистским сообществом: игры, "заточенные" под "систему на чипе" Tegra 3, попросту не будут работать на устройствах Android на основе любых других процессоров.
Независимые программисты делают действительно потрясающие вещи для Tegra 3, тем не менее, доля Nvidia на рынке смарфонов в 2011 году оставалась сравнительно небольшой (по данным Strategy Analytics, она занимала 6 место). Ведущим игроком выступает фирма Qualcomm, выпускающая семейство "систем на чипе" Snapdragon. И естественно, что любой шаг, который предпримет эта компания, будет иметь значительное влияние на развитие мобильного рынка.
Недавно представители Qualcomm пригласили нас на семинар, где мы получили возможность самостоятельно оценить перспективные процессоры Snapdragon S4 Pro, доступные в дву- и четырёхъядерных вариантах.
Через некоторое время после этого мы обзавелись собственным экземпляром платформы S4 Pro Mobile, благодаря которой мы смогли провести доскональное сравнение производительности Snapdragon S4 Pro с планшетами, построенными на конкурирующих платформах. Впереди много цифр, так что пристегните ремни!
Обзор Snapdragon S4 Pro | Линейка процессоров: ЦП Krait и графика Adreno
Портфолио Qualcomm чрезвычайно обширно. Первые мобильные "системы на чипе" под маркой Snapdragon появились ещё в 2008 году, когда была выпущена платформа S1. Сегодня, в 2012 году, перед нами серия S4, представляющая уже четвёртое поколение микросхем.
S4 Play | S4 Plus | S4 Pro | S4 Prime | |
ЦП | 2 ядерный ARM Cortex A5 до 1,2 ГГц | 2 ядерный Krait до 1,7 ГГц | 2 или 4 ядерный Krait до 1,7 ГГц | 4 ядерный Krait до 1,7 ГГц |
ГП | Adreno 203 | вплоть до Adreno 305 | Adreno 320 | Adreno 320 |
Видео | FWVGA | до 1080p | HD 1080p | HD 1080p |
Связь | 3G/4G/LTE | 3G/4G/LTE | 3G/4G/LTE | 3G/4G/LTE |
Камера | 8 Мпикс | до 20 Мпикс, набор для 3D | до 20 Мпикс, набор для 3D | до 20 Мпикс, набор для 3D |
GPS | gpsOne Gen7 | gpsOne Gen8A | gpsOne Gen8A | gpsOne Gen8A |
USB | 2.0 High Speed | 2.0 High Speed OTG (480 Мбит/с) | 2.0 High Speed OTG (480 Мбит/с) | 2.0 High Speed OTG (480 Мбит/с) |
Bluetooth | дискретный чип 3.x | встроенный 4.0* | встроенный 4.0* | встроенный 4.0* |
Wi-Fi | дискретный чип 802.11n (2,4 ГГц) | встроенный 802.11n (2,4/5 ГГц)* | встроенный 802.11n (2,4/5 ГГц)* | встроенный 802.11n (2,4/5 ГГц)* |
Техпроцесс | 45 нм | 28 нм | 28 нм | 28 нм |
- * В отдельных модификациях
Под общим названием Qualcomm S4 скрываются четыре семейства продуктов, каждое из которых состоит из отдельных чипов, ориентированных на различное применение.
К примеру, S4 Prime позиционируется в качестве решения для "умных" TB и телевизионных приставок. "Система на чипе" MPQ8064 – единственный чип, входящий в эту серию, и он может похвастаться четырёхъядерным ядром с микроархитектурой Krait и графическим ускорителем Adreno 320.
Гвоздь нашей сегодняшней программы, семейство Snapdragon S4 Pro, включает в себя две разных микросхемы, MSM8960T и APQ8064. Первая из них представляет собой двуядерный процессор Krait, а вторая – четырёхъядерный. Оба чипа выполнены по 28-нм технологии и снабжены одинаковой графикой высшего класса Adreno 320. При этом модель MSM8960T дополнительно снабжена встроенным модулем 3G/4G/LTE, который отстутствует в APQ8064.
Семейства S4 Plus и S4 Play, предназначенные для смартфонов и планшетов, состоят из 14 различных "систем на чипе" со встроенными модулями беспроводной связи и без них.
Микросхемы Snapdragon S4 Pro занимают высшее положение в иерархии чипов Qualcomm S4, предназначенных для мобильных устройств, поэтому неудивительно, что в основу платформы для разработчиков, которую мы приобрели для нашей лаборатории, был положен чип APQ8064.
И хотя формально микросхемы Snapdragon S4 Pro лишь вторые в "табели о рангах" линейки S4, эти системы, безусловно, относятся к высокопроизводительным. Как мы уже говорили, APQ8064 построен на основе четырёхъядерного центрального процессора Krait, работающего на тактовой частоте от 1,5 до 1,7 ГГц. В Qualcomm не смогли предоставить нам блок-диаграмму именно чипа APQ8064, поэтому представьте себе, что на схеме MSM8960 появились два дополнительных ядра, а модуль связи стал намного меньше (только Wi-Fi и Bluetooth, без доступа к сотовым сетям).
Каждое ядро Krait снабжено 16 Кбайтами кэш-памяти L1 для данных и 16 Кбайтами L1 для инструкций, и каждые два ядра делят общий кэш второго уровня объёмом 1 Мбайт. Вычислительные ядра Qualcomm Krait унаследовали основные особенности архитектуры Scorpion, которую мы описывали в статье
Сравнение архитектуры | ||||
Cortex-A9 | Cortex-A15 | Scorpion | Krait | |
Длина конвейера | 8 ступеней | 15/17-24 ступени (целочисленный, с плавающей запятой) | 10 ступеней | 11 ступеней |
Внеочередное исполнение инструкций | Да | Да | Частично | Да |
Техпроцесс | 45/30/32 нм | 32/28 нм | 65/45 нм | 28 нм |
Число ядер | 1/2/4 | 2/4 | 1/2 | 2/4 |
Кэш-память | L1: 32+32 Кбайт L2: 1 Мбайт |
L1: 32+32 Кбайт L2: до 4 Мбайт |
L1: 32+32 Кбайт L2: 256 Кбайт (на ядро) |
L1: 16+16 Кбайт L2: 1 Мбайт (на два ядра) |
DMIPS/МГц | 2,5 | 3,5 | 2,5 | 3,3 |
В отличие от многих конкурентов, компания Qualcomm тратит множество времени и вкладывает значительные средства в разработку собственных процессорных ядер на базе ARM. К примеру, в основу конструкции Scorpion положена та же самая архитектура ARMv7-A, что используется в ядрах Cortex-A8 и Cortex-A9. Однако в варианте Qualcomm конвейер исполнения инструкций разбивается на иное число ступеней, применяется внеочередное исполнение инструкций и обеспечивается поддержка 128-битных SIMD-команд. Благодаря столь существенным доработкам, Scorpion заметно отличается от стандартного Cortex-A9, и это помогает объяснить некоторые его победы в тестах производительности.
В ядре Krait была ощутимо повышена скорость работы за счёт усложнения архитектуры (плюс более тонкий 28-нм техпроцесс). Каждое ядро теперь может декодировать до трёх инструкций за такт (по сравнению с двумя в Scorpion) – как и чип ARM Cortex-A5. Конвейер целочисленных операций в Krait состоит из 11 ступеней – на одну длиннее, чем у Scorpion, но не настолько длинный, как 15-ступенчатый конвейер A15. На практике, более длинный конвейер означает возможность добиться более высокой тактовой частоты.
Инженеры Qualcomm также реализовали в Krait возможность работы каждого ядра на различных тактовых частотах, что улучшает показатели энергосбережения в приложениях, когда не требуются вычислительные ресурсы всех ядер "системы на чипе". Полезная функция, но она далеко не нова: подобная возможность была предусмотрена ещё в ядре Scorpion. Кроме того, пятое "дополнительное" ядро в NVidia Tegra 3 работает по тому же принципу.