Обзор Snapdragon 820 | Введение
Мобильную индустрию ждал сюрприз, когда компания Apple начала поставки iPhone 5s со специально разработанным 64-битным процессором. Переход на 64-бит был неизбежен, но никто не ожидал, что Apple сделает это так быстро. Не отстала и Qualcomm, чей 64-битный процессор был просто одной из точек на дорожной карте компании. Ввиду отсутствия собственного ядра, Qualcomm взяла штатные ядра ARM Cortex-A53 и Cortex-A57 для своего флагманского процессора Snapdragon 810, появившегося в прошлом году.
Поскольку начальные условия для работы были далеко не идеальными, получился далеко не идеальный SoC. Еще до официальной премьеры Snapdragon 810 появились слухи о перегреве и проблемах с контроллером памяти. Наше собственное тестирование подтвердило информацию о перегреве, который явился результатом выпуска энергоемкого ядра A57 по технологическим нормам 20 нм на TSMC. Кроме того мы пока не видели 810-й чип, который использовал бы всю доступную пропускную способность памяти LPDDR4-1600, даже в версии v2.1.
Но даже несмотря на то, что 810-й SoC был лишь “пробным камнем”, он оказался не так уж и плох. GPU Adreno 430 стал быстрее Adreno 420 в платформе Snapdragon 805, чип смог сохранить лидерство Qualcomm по производительности ALU, а более быстрый LTE-модем Category 9 X10 переехал поближе к процессору.
Тем не менее, SoC 810 вызывает лишь чувство разочарования. Чрезмерный тепловой троттлинг сдерживал производительность, заставляя ядра A57 простаивать без нагрузки. В некоторых случаях старые чипы Snapdragon 801 и 805, а также системы A53 среднего уровня, предлагали эквивалентную или более высокую производительность. Положение для флагманского продута было незавидным.
С помощью нового чипа Snapdragon 820 и первого фирменного 64-битного вычислительного процессора Kryo, компания Qualcomm надеется избавиться от этих недостатков. Однако цель Snapdragon 820 заключается не только в повышении производительности. Он предлагает инновационные подходы взаимодействия с пользователем путем применения гетерогенных вычислений, сочетающих в себе уникальные способности каждого процессора – CPU, GPU, DSP и ISP для максимизации производительности и минимизации энергопотребления. Машинное зрение, передовые технологии изображения и виртуальная реальность – вот его целевые приложения.
Zeroth
Новые способности во многом стали возможны благодаря Zeroth (англ.) – API машинного обучения и зрения, за счет которой разработчики могут использовать преимущества Snapdragon 820. Qualcomm называет ее “когнитивная вычислительная платформа”, в дальнейшем она должна совершенствовать возможности виртуальных помощников на смартфонах, а также любых элементов, подразумевающих похожий на человеческий интеллект. Один из способов это сделать – имитировать, как люди учатся с помощью позитивной мотивации. Мы уже можем видеть, как мобильные устройства демонстрируют зачатки интеллектуального поведения, но они, как правило, используют вычислительную мощность облачных систем. Однако Qualcomm считает, что с появлением 820-го SoC эту обработку теперь можно выполнять локально на устройстве, как следствие, повышая конфиденциальность, поскольку все уникальные пользовательские данные не будут обрабатываться на чужих серверах.
Демонстрация технологии Qualcomm Scene Detect
Технология Qualcomm Scene Detect (обнаружение сцены) – это приложение Zeroth для машинного зрения. Используя гетерогенные вычисления, она применяет нейронные сети для обнаружения сцены, распознавания объектов и сведения шаблоном неподвижных изображений и видео с камеры устройства. Для этой технологии есть много применений, в том числе автоматическая подпись фотографий для облегчения поиска и дополненная реальность. Видеоролик выше демонстрирует основные возможности этой системы.
Smart Protect будет одним из первых “революционных приложений” на базе Zeroth. Эта технология выходит за рамки традиционной антивирусной защиты на основе сигнатур. С помощью машинного обучения и анализа поведения пользователя она сможет определить “ненормальное поведение”, например, заметить, что телефон ведет съемку, когда экран заблокирован или отправляет SMS сообщения без взаимодействия с пользователем. Эта функция может быть использована для идентификации вредоносных программ нулевого дня или “трансформационного вредоносного ПО”, которое создается для обхода популярных антивирусных программ.
Эта функция имеет компонент низкого уровня, работающий в ядре Android, и компонент, работающий в защищенной среде исполнения Qualcomm SecureMSM, который вредоносным программам будет намного труднее обойти. Кроме того, благодаря этим двум компонентам Smart Protect может эффективно контролировать системные ресурсы, связь приложений и т.д.
Примеры гетерогенных вычислений
Кроме Zeroth Snapdragon 820 использует гетерогенные вычисления для множества других передовых функций обработки изображения. Одна из демонстраций задействует API OpenCL 1.2 и FastCV для постобработки видеопотока в режиме реального времени, разделения и размывания фона в целях повышения конфиденциальности во время видеоконференции. Объединяя вычислительные мощности CPU и GPU, Qualcomm заявляет о повышении производительности более чем в два раза по сравнению с работой одного центрального процессора, а также о снижении потребления энергии до 40%. Эта же технология используется для улучшения качества панорамных изображений, устраняя швы и артефакты двоения, вызванные движущимися объектами. В дальнейшем приложения могут включать функцию предварительного просмотра видеоэффектов во время записи или улучшать дополненную реальность.
Демонстрация Qualcomm improveTouch
Функция Qualcomm improveTouch, которая также присутствует в SoC Snapdragon 810, переносит обработку сигналов ввода с внешнего сенсорного контроллера на SoC. Используя DSP и ядра процессора с низким энергопотреблением, удается добиться снижения задержки сенсора и позволяет внедрять более сложные алгоритмы подавления “шумов” и ошибок ввода. Усовершенствованная обработка позволяет реализовать сложный механизм защиты от капель воды, который позволяет использовать экран, когда он мокрый, и улучшает чувствительность сенсора во время зарядки устройства, отфильтровывая электромагнитные помехи. Также есть функция пробуждения экрана по двойному касанию, потребляющая очень мало энергии.
Все эти специализированные процессоры эффективно связывает Qualcomm Symphony System Manager. Согласно Qualcomm, система Symphony предназначена для управления всей системой-на-чипе (SoC) в различных конфигурациях, в которых подбирается самая эффективная комбинация процессоров и специализированных ядер, чтобы работа выполнялась максимально быстро и с минимальным потреблением энергии. Это не простая задача, поэтому нам не терпится увидеть, как это отразиться на времени автономной работы на практике, когда первые продукты поступят в продажу.
Теперь, когда мы понимаем, как Qualcomm видит Snapdragon 820 и будущие SoC (если вы еще не догадались, они будут использовать гетерогенные вычисления), и их возможности, пришло время поближе взглянуть на само железо.
Обзор Snapdragon 820 | Архитектура
Qualcomm предпочитает не раскрывать подробностей строения своих последних процессоров. В отличие от открытой архитектуры ARM, Qualcomm в плане предоставления детальной информации ведет себя как Apple, особенно касательно GPU.
Несмотря на дефицит технических деталей, мы хотим поделиться тем что имеем относительно 64-битного процессора Kryo – самом интересном компоненте Snapdragon 820. Переход от планарного 20 нм техпроцесса HKMG к 14 нм техпроцессу Samsung FinFET должен привести к устранению проблем с нагревом, которые наблюдались в Snapdragon 810, и обеспечить 820-й модели более низкое энергопотребление и/или более высокие тактовые частоты. Согласно данным Qualcomm по сравнению с CPU A57 в Snapdragon 810, от процессора Kryo в чипе Snapdragon 820 можно ожидать двукратного прироста производительности и энергоэффективности. Это, конечно, смелое заявление, но учитывая проблемы с перегревом, которые мы наблюдали в 810-м, а также отличную производительность SoC Samsung Exynos 7420 (англ.), использующего первое поколение техпроцесса Samsung LPE (Low Power Early) FinFET 14 нм, такой результат вполне возможен. Пока не ясно будет ли 820-й использовать LPE или LPP – 14 нм FinFET процесс Samsung второго поколения (Low Power Plus), который, согласно Samsung, поможет добиться повышения тактовой частоты на 10% при более низком по сравнению с LPE энергопотреблении, достигаемом за счет улучшенных характеристик пластин.
С усложнением мобильных задач развиваются и мобильные SoC. Одним из параметров, который постоянного меняется, является оптимальное количество процессорных ядер. Например, в Apple A9 используется два процессорных ядра, а в MediaTek Helio X20, установлено десять процессорных ядер в трехкластерной организации big.LITTLE. Вице-президент по маркетингу Qualcomm Тим Макдон говорит, что людям на самом деле не нужно больше четырех ядер. Хотя это заявление, скорее всего, вызовет жаркие споры, оно наверняка связано с тем, что в Qualcomm Snapdragon 820 используется четыре процессорных ядра Kryo в гетерогенной конфигурации из двух кластеров. Базовая архитектура каждого ядра процессора осталась прежней, но сами кластеры оптимизированы для работы на разных частотах и уровнях мощности, наподобие подхода ARM big.LITTLE. Два ядра Kryo в “серебряном” кластере с меньшей потребляемой мощностью работают на частоте до 1,6 ГГц и делят между собой кэш L2 объемом 512 Кбайт. Вторая пара ядер Kryo работает в высокопроизводительном “золотом” кластере с тактовой частотой до 2,2 ГГц и общим кэшем L2 объемом 1 Мбайт. Хотя два кэша второго уровня не распределены между золотым и серебряным кластером, они используют механизм отслеживания для когерентности. В отличие от Apple A9 в SoC Snapdragon 820 не используется кэш третьего уровня. По словам представителей Qualcomm в компании просчитывали возможность использования кэша L3, но в конечном итоге решили, что преимущества не оправдывают дополнительные расходы по потребляемой мощности и занимаемому пространству на кристалле. Qualcomm не разглашает подробности архитектуры Kryo, поэтому мы попытаемся сделать хоть какие-то выводы по результатам наших тестов.
Флагманские SoC Qualcomm Snapdragon 8xx
Snapdragon 820 | Snapdragon 810 | Snapdragon 805 | Snapdragon 801 | |
Производственный процесс | 14nm FinFET | 20nm HKMG | 28nm HPm | 28nm HPm |
Архитектура | ARMv8-A (32/64-bit) | ARMv8-A (32/64-bit) | ARMv7-A (32-bit) | ARMv7-A (32-bit) |
CPU | Qualcomm Kryo (2x @ 2,15 ГГц + 2x @ 1,59 ГГц) | ARM Cortex-A57 (4x @ 2,0 ГГц) + ARM Cortex-A53 (4x @ 1,5 ГГц) [big,LITTLE] | Qualcomm Krait 450 (4x @ 2,65 ГГц) | Qualcomm Krait 400 (4x @ 2,45 ГГц) |
GPU | Qualcomm Adreno 530 @ 624 МГц | Qualcomm Adreno 430 @ 630 МГц | Qualcomm Adreno 420 @ 600 МГц | Qualcomm Adreno 330 @ 578 МГц |
Интерфейс памяти | LPDDR4-1866 2x 32-bit (29,9 Гбайт/с) | LPDDR4-1600 2x 32-bit (25,6 Гбайт/с) | LPDDR3-800 2x 64-bit (25,6 Гбайт/с) | LPDDR3-800/933 2x 32-bit (12,8/14,9 Гбайт/с) |
Процессор сигнала изображения с камеры | два ISP 14-bit (1,5 Гпикс/с , видеосенсоры до 2x 25 Мп) | два ISP 14-bit (1,2 Гпикс/с , видеосенсоры до 55 Мп) | два ISP 12-bit (1,2 Гпикс/с , видеосенсоры до 55 Мп) | два ISP (930 Мп/s , видеосенсоры до 21 Мп) |
Цифровой сигнальный процессор | Hexagon 680 @ менее 1 ГГц | Hexagon V56 @ 800 МГц | Hexagon V50 @ 800 МГц | Hexagon V50 @ 800 МГц |
Интегрированный модем | X12, LTE Cat 12/13, до 600 Мбит/с DL & 150 Мбит/с UL | X10, LTE Cat 9, до 450 Мбит/с | – | MDM9x25, LTE Cat 4, до 150 Мбит/с |
Информации по Kryo мало, а подробных сведений о строении графического процессора Adreno 530 вообще нет. Кроме названия нам известно лишь, что он будет работать при частоте 133-624 МГц. Расспрашивая Qualcomm о новом продукте, мы узнали, что компания сделала множество небольших архитектурных изменений в дизайне, то есть Adreno 530 представляет собой не полную переделку, а плавную эволюцию дизайна Adreno 430. Среди изменений было упомянуто более эффективное применение технологии сжатия данных при передаче информации с/на GPU с целью снижения потребления энергии.
Учитывая внимание Qualcomm к гетерогенным вычислениям совсем не удивительно, что CPU и GPU могут отслеживать кэш-память друг друга для более эффективного обмена данными, так как оба процессора используют 64-битные виртуальные адреса. Учитывая сильный акцент на вычислительные возможности, мы ожидаем, что Adreno 530 еще больше улучшит производительность ALU, к чему Qualcomm стремиться последние несколько поколений.
Adreno 530 имеет поддержку последних графических API, включая OpenGL ES 3.1 + Android Extension Pack, DirectX 12 и Vulkan. Для ускорения тесселяции в нем, как и в Adreno 430, используется отдельный специальный блок.
Snapdragon 820 оснащается совершенно новым вычислительным ядром Kryo, новым GPU Adreno 530, а также новым ISP (Spectra ISP) и цифровым сигнальным процессором (Hexagon 680 DSP). Каждый компонент значительно нарастил производительность в сравнении с предыдущим поколением, кроме того они могут кооперироваться с помощью гетерогенных вычислений, чтобы завершать задачи в два раза (и более) быстрее, по сравнению с выполнением задачи на одном только центральном процессора, при этом экономия энергии может достигать 40%.
Обзор Snapdragon 820 | Тестирование
Как обычно, нас пригласили в штаб-квартиру компании Qualcomm, чтобы продемонстрировать производительность Snapdragon 820. Так как розничные продукты на базе чипа Snapdragon 820 пока не доступны (и даже не анонсированы), мы имели дело с мобильной платформой, предназначенной для разработчиков (MDP).
Смартфон для разработчиков Qualcomm Snapdragon 820
MDP-смартфон это специальный телефон больших размеров, который специалисты Qualcomm используют для обкатки и тестирования. Сразу хотим перечислить стандартные для таких случаев предостережения: мы тестируем не серийное аппаратное и программное обеспечение, так что можем столкнуться с некоторыми отклонениями в результатах. Кроме того, поскольку корпус MDP-смартфона больше и толще тонких флагманских телефонов, которые будут оснащаться 820-м чипом, мы не можем оценить тепловой троттлинг. Кроме того, учитывая очень ограниченное время на тесты, мы не успели испытать платформу на эффективность расходования заряда батареи.
Данные в этом материале актуальны только в рамках предварительного обзора и подходят исключительно для предварительной оценки потенциала платформы Snapdragon 820. Хотя окончательные показатели могут измениться, наш опыт тестирования MDP-платформ для Snapdragon 805 и Snapdragon 810 (планшеты) показал неплохую корреляцию с реальными розничными продуктами.
Устройства, участвующие в тестировании
Модель | Qualcomm Snapdragon 820 MDP | OnePlus 2 | Motorola Moto X Pure Edition | Samsung Galaxy Note 4 | OnePlus One |
Цены в США, $ | н/д | 464 | 300 | 500 | 343 |
Цены в России, руб. | н/д | 27000 | 32000 | 35000 | 19500 |
SoC | Qualcomm Snapdragon 820 (MSM8996) | Qualcomm Snapdragon 810 (MSM8994) | Qualcomm Snapdragon 808 (MSM8992) | Qualcomm Snapdragon 805 (APQ8084) | Qualcomm Snapdragon 801 (MSM8974AC) |
CPU | Qualcomm Kryo (2x @ 2,15 ГГц + 2x @ 1,59 ГГц) | ARM Cortex-A57 (4x @ 1,77 ГГц) + ARM Cortex-A53 (4x @ 1,56 ГГц) [big.LITTLE] | ARM Cortex-A57 (2x @ 1,82 ГГц) + ARM Cortex-A53 (4x @ 1,44 ГГц) [big.LITTLE] | Qualcomm Krait 450 (4x @ 2,65 ГГц) | Qualcomm Krait 400 (4x @ 2,45 ГГц) |
GPU | Qualcomm Adreno 530 @ 624 МГц | Qualcomm Adreno 430 @ 630 МГц | Qualcomm Adreno 418 @ 600 МГц | Qualcomm Adreno 420 @ 600 МГц | Qualcomm Adreno 330 @ 578 МГц |
Память | 3 Гбайт LPDDR4-1866 (29,9 Гбайт/с) | 4 Гбайт LPDDR4-1600 (25,6 Гбайт/с) | 3 Гбайт LPDDR3-933 (14,9 Гбайт/с) | 3 Гбайт LPDDR3-800 (25,6 Гбайт/с) | 3 Гбайт LPDDR3-933 (14,9 Гбайт/с) |
Дисплей | 6.2 дюймов 2560×1600 (490 PPI) | 5.5 дюймов IPS @ 1920×1080 (401 PPI) | 5.7 дюймов IPS @ 2560×1440 (520 PPI) | 5.7 дюймов SAMOLED @ 2560×1440 (515 PPI) | 5.5 дюймов IPS @ 1920×1080 (401 PPI) |
ОС | Android 6.0 | Android 5.1.1 | Android 5.1.1 | Android 5.0.1 | Android 5.1.1 |
Модель | Apple iPhone 6s Plus | Samsung Galaxy S6 | Asus ZenFone 2 | BLU Pure XL |
Цены в США, $ | 300 (контракт на 2 года) | 606 | 270 | 350 |
Цены в России, руб. | 72000 | 33000 | 22000 | н/д |
SoC | Apple A9 | Samsung Exynos 7420 | Intel Atom Z3580 | MediaTek MT6795 Helio X10 |
CPU | Apple Twister (2x @ 1,85 ГГц) | ARM Cortex-A57 (4x @ 2,1 ГГц) + ARM Cortex-A53 (4x @ 1,5 ГГц) [big.LITTLE] | Intel Silvermont (4x @ 2,3 ГГц) | ARM Cortex-A53 (4x @ 1,95 ГГц) + ARM Cortex-A53 (4x @ 1,95 ГГц) [big.LITTLE] |
GPU | PowerVR GT7600 | ARM Mali-T760MP8 @ 772 МГц | PowerVR G6430 @ 533 МГц | PowerVR G6200 @ 700 МГц |
Память | 2 Гбайт LPDDR4-1600 (25,6 Гбайт/с) | 3 Гбайт LPDDR4-1600 (25,6 Гбайт/с) | 4 Гбайт LPDDR3-800 (12,8 Гбайт/с) | 3 Гбайт LPDDR3-933 (14,9 Гбайт/с) |
Дисплей | 5.5 дюймов IPS @ 1920×1080 (401 PPI) | 5.1 дюймов SAMOLED @ 2560×1440 (577 PPI) | 5.5 дюймов IPS @ 1920×1080 (401 PPI) | 6.0 дюймов SAMOLED @ 2560×1440 (490 PPI) |
ОС | iOS 9.0.2 | Android 5.0.2 | Android 5.0 | Android 5.1 |
Несмотря на то, что тестирование проходило за пределами нашей лаборатории, мы следовали нашей стандартной процедуре, насколько это возможно. Мы использовали наши собственные тестовые файлы и выполняли каждый тест минимум дважды, усредняя результаты. Но из-за ограничений по времени нам пришлось убрать паузы между тестами, во время которых тестовая платформа могла бы остыть. Однако сильных искажений результатов между последовательными прогонами не наблюдалось, так что тепловой сброс частоты, судя по всему, не включался.
Обзор Snapdragon 820 | Производительность CPU и системы
Поскольку это наше первое знакомство с первым фирменным 64-битным процессором Qualcomm Kryo возникает ряд вопросов. Например, как адекватно сравнить CPU из двух кластеров и четырех ядер с двухъядерной конфигурацией у Apple или восьмиядерными платформами big.LITTLE, применяемыми в современных смартфонах? Использует ли Kryo архитектуру, похожую на ARM А57/А72, или Qualcomm сделала ее шире и сложнее, наподобие Apple A9? Также нам интересно, получил ли Snapdragon 820 более быструю память, чем 810.
В одно- и многопоточных тестах System четыре ядра Kryo легко опережают старые ядра CPU Krait и все SoC Cortex-A53 Helio X10. Snapdragon 820 минимум на 19% превосходит шестиядерный Snapdragon 808 и восьмиядерный 810. Однако разница с SoC Exynos 7420, который более эффективно использует четыре ядра Cortex-A57 по сравнению с Snapdragon 810, очень мала. Но учитывая, что в запасе у Exynos 7420 есть дополнительные четыре ядра A53, кажется, что скорость выполнения инструкции за такт (IPC) у Kryo немного выше, чем у A57. Apple A9 здесь на 42% быстрее 820-го, что говорит о том, что Kryo является более узкой архитектурой и имеет больше общего с ARM А57, чем с процессором Apple Twister.
В графическом тесте на базе OpenGL ES 2.0 новый графический процессор Adreno 530 значительно опережает большинство своих соперников. Разница с Adreno 430 (Snapdragon 810) при одинаковых тактовых частотах составляет 59%. Такой результат впечатляет. Приблизиться к новому GPU (с отставанием 9%) смог только графический процессор PowerVR GT7600 в недавно появившемся Apple A9.
Хотя тест памяти предназначен для измерения скорости внутреннего NAND-хранилища, на топовых устройствах он измеряет, насколько эффективно ОС использует ОЗУ-кэш для буферизации доступа к хранилищу. Поэтому не удивительно, что устройства с ОЗУ LPDDR4 показывают более высокую скорость.
В целом Snapdragon 820 удается вырваться вперед в тестах AndEBench, но это не так важно, как результаты отдельных тестов. В модуле CoreMark-HPC, который измеряет производительность одно- и многоядерных процессоров с помощью задач целочисленных вычислений и вычислений с плавающей запятой, ядра Kryo в Snapdragon 820 работают хорошо, но восьмиядерный дизайн Exynos 7420 имеет преимущество при работе с большим числом одновременных потоков.
Snapdragon 810 в этом синтетическом тесте сталкивается с некоторыми проблемами. Из-за теплового троттлинга ядра A57 простаивают, и вместо них чип практически полностью опирается на четыре ядра A53 (график внизу страницы по ссылке). Даже Helio X10 превосходит его. 810-й также отстает от Snapdragon 808, который использует два ядра А57 и достигает только половины от уровня производительности чипа 820. Несмотря на обнадеживающие результаты, мы не можем делать какие-либо выводы о тепловыделении 820. Причины мы изложили на предыдущей странице.
Показания пропускной способности памяти Snapdragon 820 просто удивительные. По сравнению с контроллером памяти 810 разница в скорости составляет 2,6 раза. 820 на 62% быстрее Exynos 7420, который также использует современную память LPDDR4. В предыдущем тестировании мы заметили, что контроллеры памяти в последних SoC Qualcomm, в частности Snapdragon 808 и 810, похоже, сильно оптимизированы для последовательных схем доступа к памяти как те, что используются в тестах скорости памяти STREAM, включенных в пакет AndEBench. Опираясь на эти результаты можно с уверенностью сказать, что 820 еще шире практикует данный подход. Вот почему чипы 808, 810, 820 демонстрируют не очень хорошие показатели в тесте задержки памяти, в котором используется произвольное расположение данных. В теории этот тип оптимизации должен повысить производительность при работе с большими непрерывными блоками данных, например с графическими текстурами высокого разрешения и буфером кадра или при обработке фотографий и видео. Qualcomm – не единственная компания, которая пошла в этом направлении. Apple также устанавливает в новые SoC контроллеры памяти, оптимизированные для последовательного доступа.
Мы снова мы видим, как GPU Adreno 530 лидирует в графическом тесте. Этот тест более требовательный к железу, чем старый Basemark ОС II, но Adreno 530 все равно оказывается на 39% быстрее Adreno 430.
Хотя мы добавили результаты тестов Storage и Platform, на самом деле здесь они не актуальны, поскольку нас не сильно интересует скорость NAND. Следует отметить, что хранилище MDP-платформы для Snapdragon 820 зашифровано, в отличие от всех остальных протестированных устройств. Это могло бы объяснить низкую скорость системы хранения данных MDP (нам не удалось определить, выполняется ли шифрование с аппаратным ускорением), либо в этой платформе просто используется медленная NAND. Шифрование также повлияло на результат теста Platform, так как задача включает чтение и запись файлов во внутреннюю память.
Результаты одноядерного теста Geekbench подтверждают вывод, который можно сделать на основании других наших тестов: ядра процессора Kryo медленнее, чем у процессора Twister от Apple, но быстрее, чем ARM А57. После нормализации тактовой частоты вычислительная мощность Kryo была на 27% выше, чем у A57. Apple CPU Twister завершил тест на 38% быстрее Kryo. На основании того, что мы знаем об архитектуре Twister и А57, а также с помощью несложных расчетов, можно предположить, что Kryo имеет один целочисленный блок умножения/деления с задержкой в 3-цикла. Он очень похож на A57 и A72, которые также имеют по одному целочисленному блоку умножения/деления, но с более длинной задержкой в 4-цикла.
В одноядерном тесте Geekbench в задачах с плавающей запятой Kryo на 61% быстрее A57, который имеет два блока вычислений с плавающей запятой/NEON, как у A72. Среди прочих усовершенствований А72 снижает задержки выполнения операций с плавающей запятой на 25-40%, что должно помочь сократить разрыв, но мы считаем, что Kryo сохранит некоторое преимущество над A72 в операциях с плавающей запятой. Ядро Apple Twister только на 39% быстрее Kryo в этом тесте.
Geekbench 3 Pro Memory Bandwidth (одноядерный) | ||||
STREAM Copy (Гбайт/с) | STREAM Scale (Гбайт/с) | STREAM Add (Гбайт/с) | STREAM Triad (Гбайт/с) | |
Snapdragon 820 | 17,1 | 11,7 | 14,4 | 14,2 |
Snapdragon 810 | 6,54 | 6,5 | 5,45 | 5,6 |
Exynos 7420 | 7,88 | 7,31 | 6,39 | 6,35 |
Apple A9 | 13,6 | 9,26 | 10,3 | 10,35 |
Snapdragon 820 демонстрирует впечатляющие показатели скорости памяти в тесте STREAM. Если у Snapdragon 810 и имелись проблемы с контроллером памяти, в 820-й версии чипа они точно были исправлены.
В многопоточном тесте мы видим, что благодаря двум дополнительным процессорным ядрам 820-й обходит A9 по скорости вычислений с плавающей запятой. По скорости целочисленных операций новичок отстает от восьмиядерных SoC, но пока существует не так много реальных приложений, которые используют сразу восемь ядер, так что это вряд ли негативно повлияет на воспринимаемое пользователем быстродействие.
Бенчмарк PCMark запускает несколько реалистичных тестов и очень чувствителен к поведению диспетчера тактовой частоты процессора. По этой причине результаты теста, как правило, сильно варьируются в зависимости от устройства. Безусловно, нам приятно видеть Snapdragon 820 на вершине диаграммы по совокупному результату тестов PCMark, но следует помнить, что показатели, скорее всего, будут немного изменяться в зависимости от конкретной модели устройства.
По результатам отдельных тестов бенчмарка видно, что 820 хорошо выполняет задачи воспроизведения видео, но не очень хорошо показывает себя в тестах Web Browsing или Writing. Однако самый выдающийся результат он продемонстрировал в тесте редактирования фотографий (Photo Editing). Большая часть обработки изображения в этом тесте выполняется силами GPU с использованием API android.media.effect. В нашем отдельном обзоре Asus ZenFone 2, который также показал в этом тесте достойный результат, мы смогли подтвердить, что смартфон эффективно использует ресурсы GPU. Все другие устройства, которые мы тестировали, выполняют тест редактирования фотографий на мощностях CPU. Хотя из-за ограничений по времени нам не удалось полностью подтвердить этот факт, но, похоже, Snapdragon 820 использует вычислительную мощность графического процессора по аналогии с ZenFone 2 – очередной пример преимуществ гетерогенных вычислений.
Хотя не совсем справедливо сравнивать результаты А9 с другими SoC, мы добавили эти показатели, чтобы продемонстрировать, как программное обеспечение влияет на браузерные тесты. Благодаря тому, что Apple строго контролирует дизайн своих устройств и операционной системы, она может сильно оптимизировать работу веб-браузера Safari, что в результате дает существенный прирост производительности.
Старая версия браузера Opera, которую мы используем для тестирования устройств на Android, оптимизирована не так хорошо, поэтому мы наблюдает более низкие результаты. Тем не менее, этот браузер очень удобен для сравнения разнообразных устройств на базе ОС Android. Во всех трех браузерных тестах Snapdragon 820 одерживает победу, хотя и с не очень большим преимуществом.
Судя по результатам предварительных тестов новый CPU Qualcomm Kryo работает быстрее, чем ARM Cortex-A57, но медленнее, чем Apple Twister. Скорость целочисленных вычислений немного выше, чем у A57/A72, это может означать, что Kryo использует такое же количество целочисленных блоков как лучшие ядра ARM, но с более низкой задержкой. Kryo обгоняет A57 в задачах вычислений с плавающей запятой и, хотя нам труднее установить архитектурные различия на базе тестов системного уровня, полученные данные говорят о том, что Kryo больше похож на ядро Typhoon в Apple A8, нежели на A57.
Обзор Snapdragon 820 | GPU и производительность в играх
В предыдущем разделе мы видели, что Snapdragon 820 демонстрирует великолепную скорость последовательного доступа к памяти, что должно повысить общую производительность GPU. Учитывая то, что память вряд ли будет узким местом, всплывет ли слабое место в архитектуре Adreno 530? Покажет ли он повышенную производительность ALU, как мы ожидаем?
В бенчмарке 3DMark Ice Storm Unlimited GPU Adreno 530 в SoC Snapdragon 820 отстает от GPU PowerVR GT7600 в A9 и даже от предшественника Adreno 430 (Snapdragon 810). Любопытно, что Adreno 530 отстает от версии 430 в тестах как с пиксельной, так с и вершинной обработкой. Однако далее мы увидим, что эти результаты являются аномальными и связаны с особенностями MDP-платформы Snapdragon. Отклонения могут возникать из-за несостыковок в сырых графических драйверах.
Тест 3DMark Physics фокусируется на производительности процессора и, по аналогии с тестом AndEBench Memory Latency, использует структуру данных с произвольными элементами. Именно поэтому мы видим низкие показатели последних SoC Qualcomm, включая 808, 810 и 820, наряду с Apple A9. Их контроллеры памяти оптимизированы для упорядоченного, последовательного доступа к памяти.
Snapdragon 820 в тесте Basemark X справляется заметно лучше. Он показал преимущество в 29% над Snapdragon 810 и 7% над Exynos 7420. Основное преимущество Adreno 530 показывает в тесте Dunes, где заметно преобладает вершинная обработка. Исторически сложилось, что графические процессоры Qualcomm Adreno всегда были сильнее в пиксельных операциях, а обработка вершин была относительно слабым местом по сравнению с другими GPU. Похоже, Adreno 530 использует более сбалансированный дизайн.
Показатели Apple A9 не включены в тесты, потому что Basemark X не работает в iOS 9 из-за некоторых изменений в API.
При высоких настройках качества Snapdragon 820 демонстрирует преимущество в скорости памяти и увеличивает отрыв в производительности по сравнению со Snapdragon 810 до 57% и до 30% по сравнению с Exynos 7420. Даже в тестах с рендерингом на экране, где Snapdragon 820 приходится обрабатывать больше пикселей, чем любому другому соперничающему устройству, Adreno 530 работает достаточно хорошо. Таким образом, новый GPU подходит для работы с QHD-экранами, которые набирают популярность в современных смартфонах.
Мы использовали две версии теста GFXBench Manhattan. Старая версия Manhattan 3.0 запускает игровой движок на основе OpenGL ES 3.0 с обилием световых и пиксельных эффектов. Результаты закадрового рендеринга показывают, что Adreno 530 удваивает производительность по сравнению с Adreno 430 в Snapdragon 810 и ARM Mali-T760MP8 в Exynos 7420. Он даже на 20% быстрее, чем Apple A9.
Manhattan 3.0 использует для световых эффектов отложенный рендеринг, скорость которого сильно зависит от разрешения экрана. Вот почему iPhone 6s Plus (А9) и OnePlus 2 (Snapdragon 810) перешли вверх диаграммы при экранном рендеринге: оба используют родные дисплеи с разрешением 1920×1080 точек, в то время как в тестовую платформу (Snapdragon 820) установлен дисплей с разрешением 2560×1600 пикселей.
Manhattan 3.1 является расширенной версией теста Manhattan с использованием функций OpenGL ES 3.1. Преимущество по производительности Snapdragon 820 в этом тесте весьма впечатляет, он на 79% быстрее Snapdragon 810 и в 2,4 раза быстрее Exynos 7420.
В отличие от теста Manhattan, который подчеркивает производительность обработки пикселей, тест T-Rex на базе интерфейса OpenGL ES 2.0 использует более сбалансированный конвейер рендеринга. Snapdragon 820 снова предлагает впечатляющий прирост скорости по сравнению с 810, на этот раз около 77%. 820-й даже обходит лучший GPU Apple на 14%, который некоторое время являлся бесспорным лидером в этом бенчмарке.
Тест GFXBench Alpha Blending анализирует скорость растеризации и нагружает память. Учитывая превосходную скорость памяти SoC 820, не удивительно, что он превосходит Apple A9 на 25%. Тест Fill также подчеркивает пропускную способность памяти, плюс скорость обработки пикселей –снова две сильных стороны 820-го чипа.
Qualcomm уже несколько поколений улучшает производительность ALU в графических процессорах Adreno, и Adreno 530 не является исключением. К сожалению, нам неизвестно наверняка, добавились ли в 530-й GPU дополнительные ALU, также мы не в силах оценить общий показатель GFLOPS. В данной ситуации мы можем лишь подытожить, что Snapdragon 820 обеспечивает на 43% больше скорости ALU, чем Snapdragon 810, и весьма вероятно, что во многом разница связана с повышенной скоростью работы оперативной памяти. Производительность ALU с точки зрения Qualcomm имеет решающее значение для гетерогенных вычислительных, и, похоже, Snapdragon 820 с этой целью получил достаточно хорошее оснащение.
Обзор Snapdragon 820 | Подводим итоги
Прошлый год оказался сложным для Qualcomm. Четыре ядра Cortex-A57 на 20 нм плоском техпроцессе HKMG от TSMC оказались далеко не выигрышной комбинацией для Snapdragon 810, выполнявшего роль затычки. На ранних стадиях чип страдал от перегрева, преграждая Qualcomm путь к успеху. И хотя в поздней версии были сделаны некоторые улучшения, Snapdragon 810 так и не смог оправдать ожидания по производительности. К счастью для Qualcomm и ее OEM- партнеров, они нашли спасение в лице Kryo и FinFET.
Snapdragon 820 приносит ощутимые выгоды во все функциональные блоки: CPU, GPU, ISP, DSP и модем. Несмотря на некоторое опоздание, первый фирменный 64-битный процессор Qualcomm под названием Kryo, наконец, появился. Его архитектура действительно уникальна: она одновременно напоминает процессоры ARM Cortex-A57 и Apple Typhoon (англ.). Скорость целочисленных операций на одном ядре Fryo немного выше, чем у A57/A72, в то время как производительность вычислений с плавающей запятой значительно превосходит А57. Даже с учетом улучшений операций с плавающей запятой на A72, Kryo все равно должен обеспечить преимущество по значению IPC, что гарантирует ему конкурентоспособную позицию на рынке Android-устройств. Однако первенство по производительности из расчета на одно ядро сохраняет процессор Apple Twister в SoC A9, он обходит Kryo как по скорости исполнения целочисленных операций, так и по вычислениям с плавающей запятой.
Графические процессоры Qualcomm Adreno всегда отличались высокой производительностью ALU, дающей им преимущество в играх, которые свободно использовали пиксельные шейдеры. GPU Adreno 530 в SoC Snapdragon 820 продолжает эту традицию, еще больше повышая скорость ALU. В конвейере визуализации были сделаны улучшения, особенно по части обработки вершин, в итоге GPU стал гораздо более сбалансированным.
Контроллер памяти Snapdragon 820 также получил значительные усовершенствования, и теперь предлагает самую высокую пропускную способность памяти при последовательном доступе. Как и Snapdragon 808 и 810, система памяти Snapdragon 820 оптимизирована для перемещения больших непрерывных блоков данных, то есть она идеально подходит для передачи текстур высокого разрешения в GPU или потоковой передачи изображений и видео на расширенные блоки ISP и DSP.
В данном предварительном обзоре и тестировании Snapdragon 820 мы не обнаружили слабых мест. Хотя оценку тепловыделения и энергоэффективность нового SoC нам придется отложить до появления розничных продуктов на его базе. Проверенный техпроцесс FinFET 14 нм от Samsung помогает развеять опасения насчет перегрева, которые могли остаться со времен Snapdragon 810.