Обзор Qualcomm Snapdragon 805 | Ещё больше скорости
Процессоры Qualcomm Snapdragon успешны по всем критериям, и, по данным агентства Strategy Analytics, на их базе работают более 1350 готовящихся к продаже и уже доступных в продаже моделей устройств. На долю Snapdragon в третьем квартале 2013 года приходилось более половины прибыли всех чипов SoC для смартфонов. Процветание Snapdragon началось в 2008 году, когда компания представила общественности Snapdragon S1 с графикой Adreno 200 (на базе технологий, приобретённых в AMD) и процессорному ядру CPU с набором команд ARMv7. Ядро Scorpion имело собственную структуру на базе эталонной архитектуры ARM Cortex-A8, было разработано по технологическому процессу 65 нм и работало на частоте 1 ГГц. Каждое последующее поколение чипов, включая Snapdragon S2, S3 и S4, заметно прибавляло в производительности.
Затем в 2013 году компания Qualcomm представила новую архитектуру CPU под названием Krait, которая работала в паре с графическим ядром Adreno серии 3xx. Эта комбинация нашла место в чипах Snapdragon 400, 600 и 800.
Топовый Snapdragon 800 использовал GPU Adreno 330 (450 МГц) и четырёхъядерный CPU Krait 400 с тактовой частотой до 2,26 ГГц. Однако в начале текущего года Qualcomm подняла частоты ещё выше в SoC Qualcomm Snapdragon 801: 578 МГц для GPU, до 2,45 ГГц для CPU и 465 МГц для внутрисхемного программирования ISP (в Snapdragon 800 было до 320 МГц).
Рынок мобильных технологий отличается крайне высокой конкуренцией, и Qualcomm сохраняет на нём ведущую позицию, не переставая при этом развиваться. SoC Qualcomm Snapdragon 805 использует более быстрый CPU Krait 450, новый модем Gobi 9×35 с поддержкой стандарта LTE Advanced CAT6 300 Мбит/с и усовершенствованную ISP для улучшенной (по словам производителя) обработки изображений. Представители компании называют его первым коммерческим мобильным SoC с поддержкой формата 4K. Для её реализации в Qualcomm Snapdragon 805 установлен GPU Adreno 420 с обновлённой архитектурой, отличающейся значительным повышением пропускной способности памяти.
CPU и память
Последним дополнением к семейству Krait является CPU Krait 450 в Qualcomm Snapdragon 805, также это последний 32-битный SoC в “дорожной карте” продуктов Qualcomm. 64-разрядный CPU с поддержкой инструкций ARMv8 мы увидим в Snapdragon 810 в 2015 году. Таким образом, существенных изменений в Krait 450 нет. Он оснащён четырьмя ядрами, каждое имеет по 4 Кбайт + 4 Кбайт кэша L0 и 16 Кбайт + 16 Кбайт кэша L1, кроме того, есть и общий кэш второго уровня объёмом 2 Мбайт. CPU был разработан силами Qualcomm (которая, как и Apple, владеет лицензией на архитектуру для создания совместимых с ARM ISA продуктами) и имеет схожие с ARM Cortex-A15 черты.
Любопытно, как подход Qualcomm к построению CPU отличается от ARM и Apple (Nvidia и Samsung являются лицензиатами процессоров ARM; они пока не показали ничего уникального с точки зрения архитектуры). В Krait Qualcomm реализовала более узко ориентированную и упрощённую архитектуру, реализовав более высокую тактовую частоту. С другой стороны, хост-процессор Cyclone от Apple в SoC A7 больше похож на настольные чипы в плане широты исполнения и сложности архитектуры, но при этом он работает на гораздо более низких тактовых частотах. ARM Cortex-A15 по пропускной способности инструкций на такт и частоте находится между Krait и Cyclone.
Krait реализует свойственное суперскалярным архитектурам внеочередное спекулятивное исполнение команд (спекулятивное исполнение – это техника конвейеризации исполнительных устройств, при которой CPU использует предсказание ветвления для того, чтобы предугадать путь программы и выполнить команды прежде, чем они понадобятся) с 11 целочисленными этапами, по сравнению с 15 этапами в A15. В то время как исполнительный канал является внеочередным, первоначальные этапы выборки/кодирования – очередные, и инструкции также должны быть пересортированы в очередные. Krait 450 по-прежнему может выбирать и декодировать три инструкции за тактовый цикл, выполняя до четырёх инструкций в параллели. Для сравнения, Apple Cyclone предлагает двое больше инструкций на такт, чем Krait, отбирающий/декодирующий, исполняющий и сортирующий шесть инструкций за тактовый цикл. Cyclone также имеет более ёмкий буфер переупорядочения инструкций, содержащий 192 микрооперации против 128 у A-15 и всего 40 у Krait, что теоретически должно сократить число обрывов и обеспечить более эффективное использование канала. Даже при отсутствии изменений в архитектуре и количестве инструкций, выполняемых за такт, Krait 450 по-прежнему обеспечивает небольшой прирост скорости по сравнению с Krait 400 благодаря увеличению максимальной частоты с 2,45 до 2,65 ГГц (в публичной коммуникации Qualcomm округляет прирост частот до десятых долей ГГц).
Наверное, сейчас вы вспомнили про аналогичную ситуацию с переходом с Snapdragon 800 на Qualcomm Snapdragon 801. Почему же Krait получили в номенклатуре более высокое обозначение для Qualcomm Snapdragon 805, при этом сохранив старую номенклатуру Krait 400 для Qualcomm Snapdragon 801? Чтобы ответить, нужно задать ещё один вопрос. Если Krait 450 использует старую архитектуру и 28-нанометровый техпроцесс HPm, характерный для Krait 400, как Qualcomm смогла снова поднять его пиковую частоту? Хотя нам не удалось узнать это непосредственно от Qualcomm, вполне вероятной видится возможность, при которой была оптимизирована схема кристалла. С новым кристаллом появилось и новое обозначение.
Хотя Qualcomm Snapdragon 805 не обеспечивает существенного прироста в производительности CPU, он заметно прибавил в пропускной способности памяти. SoC Qualcomm Snapdragon 805 объединяет в себе 32-битную четырёхканальную шину и память LPDDR3-800, которые генерируют пропускную способность на уровне 25,6 Гбайт/с. Это в два раза больше максимума Snapdragon 800 (12,8 Гбайт/с) и примерно на 70% больше, чем у Qualcomm Snapdragon 801 (14,9 Гбайт/с). По сравнению с новым Snapdragon, у Apple A7 полоса пропускания тоже меньше. На самом деле, Qualcomm Snapdragon 805 в этом отношении приближается к возможностям интегрированных контроллеров памяти достаточно актуальных моделей настольных CPU. Однако дополнительная память предназначена отнюдь не для центрального процессора. Qualcomm отводит её под новый графический процессор Adreno 420.
Обзор Qualcomm Snapdragon 805 | GPU и революция 4K
Графический процессор Adreno 420
Новый GPU теперь имеет прямой доступ к основной памяти, в то время как контроллер в Qualcomm Snapdragon 805 использует техники обеспечения качества обслуживания (QoS), чтобы каждый вычислительный ресурс (GPU, CPU, ISP) получил пропускную способность и соответствующее время задержки, требуемые для обеспечения пиковой производительности. Наряду с приростом пропускной способности памяти увеличились и кэш для текстур и кэш второго уровня. Конвейер рендеринга Adreno 420 имеет преимущество за счёт реализации раннего тестирования z-буфера для более быстрой отбраковки пикселей по глубине и улучшений в блоках ROP внутреннего конвейера.
Qualcomm не предоставляет подробную информацию касательно графической архитектуры, кроме основных усовершенствований. Тем не менее, учитывая резкое повышение пропускной способности памяти и объёма кэша для текстур, можно смело предположить, что Adreno 420 имеет больше блоков текстурирования. Qualcomm не упоминает об изменениях в конструкции или количестве шейдерных блоков или даже в частоте GPU, но, судя по нашим тестам, какой-то из этих компонентов точно претерпел значительные улучшения. По данным Qualcomm, все проведённые усовершенствования обеспечивают на 40% более высокую производительность и на 20% меньшее энергопотребление, чем у Snapdragon 800 в тесте GFXBenchmark 2.7 T-Rex в разрешении 1920×1080 точек. Скоро мы узнаем, подтвердят ли наши бенчмарки заявления Qualcomm. Чтобы протестировать влияние SoC на время работы от батареи, нам придётся дождаться появления устройств на его базе.
Adreno 420 не только повышает предел производительности, GPU также повышает качество визуализации с поддержкой OpenGL ES 3.1 и DirectX 11 уровня 11_2 (с 9_3 в Adreno 3xx). Кроме того, внедрена поддержка геометрических шейдеров и динамическая аппаратная тесселяция, которая значительно снижает требования к пропускной способности памяти и уменьшает энергопотребление, в то же время повышая детализацию изображения. Вместо хранения данных дополнительной геометрической сетки в основной памяти и её последующей подачи на GPU, аппаратная тесселяция генерирует дополнительную геометрическую детализацию программно на чипе, даже не затрагивая основную память.
На изображении ниже продемонстрировано визуальное преимущество тесселяции, и, согласно Qualcomm, в отношении “этой простой сцены с мухой аппаратная тесселяция обеспечивает экономию пропускной способности приблизительно на 360 Мбайт/с и объёма занимаемой памяти приблизительно на 20 Мбайт. Для ресурсоёмких игр экономию памяти можно считать в гигабайтах”.
Ещё одним дополнением к Adreno 420, которое может разгрузить память или полосу пропускания и улучшить качество визуализации, является поддержка технологии адаптивного масштабируемого сжатия текстур (ASTC – Adaptive Scalable Texture Compression) – блочный формат сжатия текстур нового поколения, обеспечивающий сжатие с потерями качества. Он был представлен в OpenGL ES 3.0 (на данный момент поддержка включается опционально). ASTC предлагает разработчикам больше гибкости при выборе соответствующего размера и качества текстур, чем формат ETC2, используемый в процессорах Adreno предыдущего поколения.
Adreno 420 продолжает традицию Adreno по использованию технологии Qualcomm FlexRender для динамического выбора между двумя различными методами рендеринга: мгновенный или плиточный, отложенный рендеринг (Adreno использует отличную от Imagination Technologies технику). Цель FlexRender заключается в выборе наиболее эффективной методики визуализации для конкретной задачи.
Также нужно отметить функцию динамического масштабирования частоты и напряжения (DCVS – Dynamic Clock и Voltage Scaling), которая динамически изменяет частоты и напряжение для каждого вычислительного блока в SoC. Это не новая функция, однако в GPU Adreno 420 были реализованы новые уровни мощности для более точной регулировки и понижения потребления энергии.
Видео 4K
Телевидение ультравысокой чёткости (UHDTV) с разрешением 4K (3840×2160 пикселей) – это самый новый в мире потребительских технологий видеостандарт, который может заменить телевидение высокой чёткости (HDTV) с наиболее распространённым в отрасли разрешением 1920×1080 точек. Тем не менее, адаптация и внедрение стандарта происходят медленно в связи с высокой ценой телевизоров и отсутствием соответствующего контента. Но ситуация меняется в лучшую сторону. Сейчас некоторые 4K-телевизоры продаются дешевле $1000, а сервисы Netflix и YouTube уже раздают 4K-контент в потоке. Во второй половине этого года Amazon и Comcast также готовятся транслировать 4K-видео в потоке.
Qualcomm не задумывается о больших телевизорах, когда речь идёт о формате 4K. Напротив, компания нацелилась на маленькие мобильные дисплеи смартфонов и планшетов, а также 4K-камеры. Представив Qualcomm Snapdragon 805, Qualcomm надеется ещё больше продвинуть вперёд стандарт 4K. Новый Qualcomm Snapdragon 805 способен одновременно управлять дисплеем устройства с разрешением 4K (предположительно, на частоте обновления 60 Гц) и внешним монитором при разрешении 4K и частоте обновления экрана на уровне 24 Гц.
Snapdragon 800/Qualcomm Snapdragon 801 может аппаратно кодировать/декодировать Ultra HD видео в формате H.264, а стандарт H.265 обрабатывается программно. Qualcomm Snapdragon 805 способен декодировать видео в формате 4K H.265 на аппаратном уровне. Аппаратное кодирование компания обещает реализовать в Snapdragon 810, который должен появится в 2015 году. На сегодня Qualcomm Snapdragon 805 может захватывать/кодировать Ultra HD-видео с частотой обновления 30 Гц и контент в разрешении 1080p на частоте обновления до 120 Гц.
На представленном ниже слайде Qualcomm подчёркивает возможность 75%-ного снижения энергопотребления с помощью аппаратного декодирования.
Qualcomm Snapdragon 805 также оснащается движком Qualcomm Hollywood Quality Video (HQV). Данная технология была куплена у Integrated Device Technology в 2011 году. Движок HQV подразумевает улучшение качества изображения через понижение шумов и оптимизацию форматирования и перевода изображения из различных форматов. Также существуют алгоритмы оптимизации для улучшения качества изображения низкого разрешения.
ISP
Qualcomm Snapdragon 805 сохраняет два процессора ISP (Image Signal Processor), но повышает их производительность. Теперь они могут обрабатывать 1,2 гигапикселей в секунду и захватывать изображения до 55 мегапикселей через комбинацию четырёх камер (Snapdragon 800 поддерживает только две). Дополнительные входы ISP поддерживают стерео и камеру глубины.
Qualcomm Snapdragon 805 также поддерживает гироскопическую стабилизацию изображения, усовершенствованные алгоритмы подавление шумов и ускорение работы автофокуса.
Обзор Qualcomm Snapdragon 805 | Характеристики тестовой системы, тестовый пакет и методика
Характеристики тестовой системы
Таблица ниже содержит всю необходимую техническую информацию об участниках сегодняшнего сравнения.
Qualcomm Snapdragon 805 MDP Tablet | Samsung Galaxy S5 | Samsung Galaxy Note 10.1 (2014) LTE | Samsung Galaxy Note 10.1 (2014) Wi-Fi | EVGA Tegra Note 7 | Apple iPad Air | |
Лучшая цена в США, $, (в РФ, руб.) | 800 (н/д) | 650 (17730) | 600 (19500) | 500 (21000) | 176,5 (13070) | 437 (17600) |
ОC | Google Android 4.4 | Google Android 4.4 с Samsung TouchWiz UI | Google Android 4.4.2 с Samsung TouchWiz UI | Google Android 4.4.2 с Samsung TouchWiz UI | Google Android 4.2.2 | Apple iOS 7.1 |
SoC | Qualcomm Snapdragon 805 | Qualcomm Krait 400 (4 ядра) @ 2,45 ГГц | Qualcomm Snapdragon 800 (MSM 8974 AA) | Samsung Exynos 5 Octa (5420) | Nvidia Tegra 4 (T114) | Apple A7 |
Ядро CPU | Qualcomm Krait 450 (4 ядра) @ 2,7 ГГц | Qualcomm Krait 400 (4 ядра) @ 2,45 ГГц | Qualcomm Krait 400 (4 ядра) @ 2,26 ГГц | ARM Cortex-A15 (4 ядра) @ 1,9 ГГц + ARM Cortex-A7 (4 ядра) @ 1,3 ГГц | ARM Cortex-A15 (4 ядра) @ 1,8 ГГц | Apple Cyclone (2 ядра) @ 1,3 ГГц |
Ядро GPU | Qualcomm Adreno 420 | Qualcomm Adreno 330 (32 ALU) @ 578 МГц | Qualcomm Adreno 330 (32 ALU) @ 450 МГц | ARM Mali T628MP6 (6 ядер) @ 600 МГц | Nvidia GeForce ULP (72 ядра) @ 672 МГц | Imagination PowerVR G6430 (4 кластера) @ 200 МГц |
Память | 3 Гбайт LPDDR3 | 2 Гбайт LPDDR3 | 3 Гбайт LPDDR3 | 3 Гбайт LPDDR3 | 1 Гбайт LPDDR3 | 1 Гбайт LPDDR3 |
Дисплей | 10,06″ IPS @ 2560×1440 | 5,1″ SAMOLED @ 1920×1080 (432 PPI) | 10,1″ TFT @ 2560×1600 (299 PPI) | 10,1″ TFT @ 2560×1600 (299 PPI) | 7″ IPS @ 1280×720 (441 PPI) | 9,7″ IPS @ 2048×1536 (264 PPI) |
Аккумулятор | 3400 мА-ч (съёмный) | 2800 мА-ч (съёмный) | 8220 мА-ч (не съёмный) | 8220 мА-ч (не съёмный) | 4100 мА-ч (не съёмный) | 8820 мА-ч (не съёмный) |
Тестовый пакет
Мы протестировали SoC Qualcomm Snapdragon 805 по четырём ключевым параметрам: CPU, GPU, GPGPU и Web.
Тесты | |
Тесты ядра CPU | AnTuTu X (Anti-Detection), Basemark OS II Full (Anti-Detection), Geekbench 3 Pro (Anti-Detection) |
Тесты ядра GPU | 3DMark (Anti-Detection), Basemark X 1.1 Full (Anti-Detection), GFXBench 3.0 Corporate |
Тесты GPGPU | CompuBenchRS |
Web-тесты | JSBench, Peacekeeper 2.0, WebXPRT 2013 |
Методика
Все устройства тестируются при полностью обновлённом штатном программном обеспечении. Ниже представлен список настроек, которые мы стандартизируем перед тестированием.
Настройка оборудования | |
Bluetooth | выкл. |
Состовая связь | SIM-карта извлечена |
Режим дисплея | ПО умолчанию (не адаптивно) |
Сервисы обнаружения | выкл. |
Режим сна | никогда (или самый длительный из доступных интервалов) |
Уровень громкости | без звука |
Wi-Fi | вкл. |
Ко всему прочему, для тестирования скорости работы с браузером под управлением ОС Android мы используем статическую версию Opera на базе движка Chromium, чтобы исключить влияние различных версий на результаты тестируемых устройств. Ввиду ограничений платформы, лучшим решением для iOS является браузер Safari, а Windows RT работает только с Internet Explorer.
Обзор Qualcomm Snapdragon 805 | Результаты тестов
Тесты ядра CPU
Поскольку комплекс Krait 450 в Qualcomm Snapdragon 805 архитектурно не отличается от Krait 400 в Snapdragon 800/Qualcomm Snapdragon 801, производительность данных CPU относительно друг друга должна варьироваться в зависимости от тактовой частоты.
Для сравнения, Qualcomm Snapdragon 805 имеет преимущество в 8% перед Qualcomm Snapdragon 801 (2,65 против 2,45 ГГц) и 17% перед Snapdragon 800 (2,65 против 2,26 ГГц). Хотя у Qualcomm Snapdragon 805 огромное преимущество по пропускной способности памяти, в Snapdragon 800/Qualcomm Snapdragon 801 процессор от недостатка данных не страдает. Поэтому большого влияния на результаты тестов CPU память оказать не должна.
AnTuTu X
AnTuTu – бенчмарк для систем на Android, предназначенный для комплексной оценки производительности мобильных устройств. Он включает тесты подсистемы графики (охватывающие производительность 2D-графики, пользовательского интерфейса и простой 3D-графики), CPU (операции с фиксированной и плавающей запятой, тесты многопоточности), памяти (чтение и запись), операции ввода/вывода (чтение и запись).
Модуль RAM теста CPU выявляет увеличенную пропускную способность памяти Qualcomm Snapdragon 805, который имеет теоретическое преимущество перед Qualcomm Snapdragon 801. Однако в других субтестах Qualcomm Snapdragon 805 показал себя не так хорошо. Движок Qualcomm Adreno 420 показал самый низкий результат в тесте GPU как для графики 2D, так и для 3D. В частности, его показатель 3D-графики на 15% ниже, чем у Nvidia GeForce ULP в Tegra 4 (победитель в тесте трёхмерной графики в этом тесте). CPU Krait 450 также финишировал последним в тесте CPU, где набрал на 35% меньше, чем Qualcomm Snapdragon 801, победивший в данной категории.
Basemark OS II
Basemark OS II – это инструмент типа “всё в одном”, разработанный для тестирования общей производительности мобильных устройств. Он проверяет продукты по четырём критериям: System (система), Memory (память), Graphics (графика) и Web. Модуль System отражает скорость памяти и центрального процессора, в частности, он тестирует скорость целочисленных вычислений и вычислений с плавающей запятой, а также скорость обработки 32-битных изображений с разрешением 2048×2048 точек на одном или нескольких ядрах. Анализ скорости передачи данных на и с внутреннего NAND-накопителя (модуль Memory) выполняется посредством чтения и записи файлов фиксированного размера, файлов размером от 65 Кбайт до 16 Мбайт, а также различные файлы в случае высокой степени дефрагментации памяти. Для расчёта показателя Graphics используется смесь графики 2D/3D в одной сцене, применение шейдерных эффектов и отображение 100 частиц в одну команду прорисовки для тестирования обработки вершинных операций на GPU. Бенчмарки визуализируются при разрешении 1920×1080 точек с выключенным экраном 100 раз, затем изображение выводится на экран. И, наконец, подтест Web нагружает CPU, выполняя трёхмерные трансформации и изменения размеров объектов с помощью CSS. Также он включает тест с физическими частицами HTML5 Canvas.
Тест Basemark OS II Graphics показал противоположные результаты. Здесь Qualcomm Adreno 420 продемонстрировал самый высокий результат, а Nvidia Tegra 4 оказался последним. Если сравнивать между собой только процессоры Snapdragon, то Qualcomm Snapdragon 805 на 22% быстрее Qualcomm Snapdragon 801 и на 28% быстрее Snapdragon 800.
Аналогичным образом Qualcomm Snapdragon 805 обходит Qualcomm Snapdragon 801 и Snapdragon 800 в тесте Web на 3% и 23% соответственно, что довольно точно соответствует разнице по тактовой частоте. В модуле System (тестирует CPU) Qualcomm Snapdragon 805 снова набрал на 11% меньше, чем Qualcomm Snapdragon 801, и оказался всего на 6% быстрее Snapdragon 800. Любопытно, что Qualcomm Snapdragon 805 показал вполне ожидаемые результаты в ограниченном возможностями CPU тесте Web, но недобрал баллов в тесте System. На данный момент производительность Qualcomm Snapdragon 805 можно охарактеризовать как противоречивую.
Geekbench 3 Pro
Geekbench от Primate Labs является чем-то вроде отраслевого стандарта благодаря своей обширной базе данных и широкой совместимости с различными платформами (Windows/OS X/Linux/iOS/Android). Этот бенчмарк обеспечивает два набора оценок: для однопоточных и многопоточных приложений. В каждом случае он включает серию тестов, разбитых на три категории: целочисленные вычисления, вычисления с плавающей запятой и производительность памяти. Независимые результаты используются для вычисления общего балла в той или иной категории, который, в свою очередь, используется в общей оценке Geekbench.
В тесте одного ядра (Single-Core), мы видим, как Qualcomm Snapdragon 805 финиширует с результатом на 8,6% выше, чем Qualcomm Snapdragon 801, и 11% выше, чем Snapdragon 800. Результаты масштабируются не совсем в соответствии с частотой, то есть программа в ходе тестирования сталкивается с другими “узкими местами” платформы. Глядя на разницу с SoC Apple A7 9 (победившим в тесте), складывается ощущение, что Geekbench 3 Pro предпочитает более высокую пропускную способность инструкций A7 и большой кэш вместо более высокой тактовой частоты чипов Snapdragon.
Мы снова наблюдаем изменчивую производительность Qualcomm Snapdragon 805. Несмотря на вдвое меньшее число ядер, Apple A7 его обгоняет, как и два других чипа Snapdragon предыдущих поколений. Хотя Qualcomm Snapdragon 805 выигрывает в тесте памяти Multi-Core Memory (как и ожидалось), он оказывается на 9% медленнее Qualcomm Snapdragon 801 в вычислениях с плавающей запятой (Multi-Core Floating Point) и на целых 21% медленнее в целочисленных вычислениях (Multi-Core Integer).
Поскольку время тестирования Qualcomm Snapdragon 805 чипа было ограничено Qualcomm, у нас не было возможности покопаться в результатах более подробно. Тем не менее, поскольку результат Qualcomm Snapdragon 805 более чем вполовину выше, чем у Qualcomm Snapdragon 801, можно предположить, что все четыре ядра были активны во время тестов. Таким образом, напрашивается вывод, что Qualcomm Snapdragon 805 не достигает своей пиковой частоты, когда активны все четыре ядра. Это может объяснить расхождения в других тестах CPU, поскольку некоторые из них концентрируется на производительности одного ядра (как тесты на базе веб-браузеров), а некоторые нагружают несколько ядер (AnTuTu CPU и Basemark OS II System).
Тестирование в веб-приложениях
Относящие к данному разделу тесты представляют собой тяжёлые сценарии загрузки JavaScript и HTML5 из нашего набора Web Browser Grand Prix. Данные бенчмарки представляют особый интерес при тестировании мобильных платформ, где большая часть контента поступает через браузер. Они не только отражают производительность загрузки веб-страниц для каждого устройства, но, являясь традиционно сильно зависимыми от производительности CPU (что особенно относится к тестам с тяжёлым сценарием нагрузки JavaScript) бенчмарками, представляют собой отличный способ измерения производительности SoC в разных устройствах при использовании одинакового браузера и платформы.
Все тесты на загрузку веб-страниц производятся с использованием оптимального браузера для каждой платформы. Из-за особенностей платформы Safari является единственным выбором для устройств на базе iOS, точно так же, как Internet Explorer является таковым для платформы Windows RT. Хотя Chrome является очевидным решением для Android, для того, чтобы иметь возможность использовать результаты нынешних тестов в будущем, мы остановили свой выбор на Opera, также основанном на движке Chromium.
JSBench
В отличие от большинства специализированных тестов, JSBench можно рассматривать почти как реальное приложение. Данный тест включает фрагменты JavaScript, которые на самом деле собраны с нескольких наиболее посещаемых на сегодня веб-сайтов: Amazon, Google, Facebook, Twitter и Yahoo!.
Результаты этого теста выравниваются согласно особенностям и характеристикам архитектур CPU, и Krait следует за Apple A7 и двумя CPU на базе Cortex-A15. JSBench, похоже, безразличен к количеству ядер (A7 – это двухъядерный процессор, остальные – четырёхъядерные) и частоте. Полученные результаты отражают сложность конструкции современных процессоров. Иногда использование таких “простых” подходов, как внедрение дополнительных ядер или повышение тактовых частот, не даёт заметных преимуществ, если в других компонентах конструкции имеются “узкие места”.
Peacekeeper
Peacekeeper – синтетический тест производительности JavaScript от Futuremark.
И снова мы видим, как результаты расположились на основании особенностей архитектуры процессора, причём Krait оказался на последнем месте. Qualcomm Snapdragon 805 показал 8%-ное улучшение по сравнению со Qualcomm Snapdragon 801, которое, скорее всего, связано с более высокой пропускной способностью памяти.
WebXPRT 2013
WebXPRT 2013 от Principled Technologies – это тест на базе HTML5, имитирующий общие рабочие задачи, которые, как правило, решаются локально установленными приложениями, включая редактирование фотографий, просмотр графиков финансовых приложений и ведение заметок в автономном режиме.
Ещё один бенчмарк показал противоречивые результаты нового чипа Snapdragon. В тесте HTML5 Snapdragon 800 набрал на 16% больше баллов, чем Qualcomm Snapdragon 801, и на 19% больше, чем Qualcomm Snapdragon 805. Это снова говорит о том, что ядра Krait, имея более высокую частоту, не так уж и часто её используют.
Тесты ядра GPU
В тестах GPU мы смотрим только на ренденринг с выключенным экраном, чтобы исключить влияние разрешения экрана на результаты. Это позволяет нам сравнивать только производительность SoC, а не общую производительность продукта.
3DMark (Anti-Detection)
Имя Futuremark стало синонимом тестирования, и последняя версия бенчмарка 3DMark предлагает три основных теста графики: Ice Storm, Cloud Gate и Fire Strike. На текущий момент Ice Storm уровня DirectX 9 тестирует разные платформы: Windows, Windows RT, Android и iOS.
Ice Storm имитирует загрузку игр на OpenGL ES 2.0, используя шейдеры и физику встроенного движка Futuremark. Хотя тест был представлен только в мае прошлого года, с его экранным компонентом мобильные чипсеты справляются легко. Nvidia Tegra 4 и Qualcomm Snapdragon 800 без проблем проходят данный тест на разрешении Extreme (1080p). Однако Ice Storm Unlimited визуализирует сцену без участия экрана в разрешении 720p и хорошо измеряет производительность между различными GPU.
Adreno 420 в Qualcomm Snapdragon 805 демонстрирует 6%-ное преимущество перед Adreno 330 в Qualcomm Snapdragon 801 и 29%-ное – перед Adreno 330 с более низкой частотой, которым оснащается Snapdragon 800.
ПО сравнению с двухъядерным SoC A7от Apple, четырёхъядерный Krait 450 ещё больше увеличивает и так впечатляющий отрыв в многопоточном тесте Physics. Однако изолирование графической производительности в двух графических подтестах показывает гораздо меньший разрыв: всего 3% в тесте Graphics Score и 7% – в Graphics Test 2.
Basemark X 1.1
Rightware Basemark X на базе Unity 4.0 – это ещё один кросс-платформенный графический тест для Android, iOS и Windows Phone 8. Он использует современные функции движка Unity через рендерер OpenGL ES 2.0. Такие функции, как многовершинные многоугольники, шейдеры с нормальными картами, сложные алгоритмы LoD и объёмное попиксельное освещение (включая направленный и рассеянный свет), наряду с полным набором постобработки, системы частиц и физических эффектов, прекрасно демонстрируют, как должна работать и выглядеть современная игра. Современным SoC пока не удаётся добиться максимальных результатов в Basemark X.
Adreno 420 демонстрирует убедительную победу над своими предшественниками. По сравнению со Qualcomm Snapdragon 801, Qualcomm Snapdragon 805 смог улучшить результат на 31%, и на целых 64% – по сравнению со Snapdragon 800. Вот такой прирост нам нравится получать при переходе на новую архитектуру. С более качественно оптимизацией драйверов в будущем эти показатели могут вырасти.
В тесте на высоком качестве изображения (High Quality) Qualcomm Snapdragon 805 обошёл Snapdragon 800/Qualcomm Snapdragon 801 примерно на 60%. Также он на 37% обогнал A7.
GFXBench 3.0
Kishonti GFXBench 3.0 (ранее известный как GLBenchmark) является кросс-платформенным тестом GPU с поддержкой API OpenGL ES 2.0 и OpenGL ES 3.0. Он предлагает общие игровые сценарии, а также тесты, разработанные для конкретных подсистем.
Общие тесты включают и тест на обработку в OpenGL ES 3.0 (Manhattan) и тест OpenGL ES 2.0 (T-Rex), который достался нам от GFXBench v2.7.
Отдельные задачи включают следующие компоненты: Fill (заполнение), которое измеряет скорость прорисовки с помощью визуализации четырёх слоёв сжатых текстур; Alpha Blending – данный тест визуализирует слои полупрозрачных четвёрток с помощью несжатых текстур высокого разрешения; ALU для измерения производительности обработки шейдеров: Driver Overhead, измеряющий скорость работы CPU с графическим драйвером; и API, подразумевающий множество запросов на прорисовку и изменение состояния.
Подробный разбор этого бенчмарка можно найти в англоязычном обзоре “GFXBench 3.0: A Fresh Look At Mobile Benchmarking”.
Приятно видеть, как Qualcomm Snapdragon 805 легко обходит Qualcomm Snapdragon 801 и A7. Qualcomm Adreno 420 также заслуживает признания как первый мобильный GPU, способный визуализировать T-Rex при 1080p с приемлемой частотой кадров.
В более сложном тесте Manhattan на базе OpenGL ES 3.0 Qualcomm Snapdragon 805 обеспечил впечатляющее преимущество 42% перед Qualcomm Snapdragon 801 и 31% – перед A7. Такой результат может говорить о том, что современные игры на Adreno 420 должны получить внушительный прирост скорости.
Тест Fill полностью раскрывает влияние дополнительной пропускной способности памяти в Qualcomm Snapdragon 805. Он забирает текстуры из основной памяти и записывает завершённые пиксели обратно в видеобуфер. Qualcomm Snapdragon 805 обеспечил вдвое больше производительности по сравнению со Qualcomm Snapdragon 801! Есть предположение, что компания внедрила дополнительные TMU для более эффективного использования мощного контроллера памяти и кэша текстур в GPU. Хочется верить, что наши графики подтвердят это.
Qualcomm Snapdragon 805 снова показал отличное наложение текстур, обеспечив почти 40% прироста в сравнении со Qualcomm Snapdragon 801.
В тесте производительности обработки шейдеров преимущество Qualcomm Snapdragon 805 перед Qualcomm Snapdragon 801 не превысило 10%.
В тесте Driver Overhead Qualcomm Snapdragon 805 оказался не хуже других чипов Snapdragon, однако решения от Qualcomm по-прежнему остаются самым медленным семейством SoC в этом тесте.
Тесты GPGPU
CompuBenchRS
Тесты CompuBenchRS проверяют вычислительную производительность многоядерных систем с поддержкой RenderScript API (компонент операционной системы Android), аналогами которой являются CUDA или OpenCL. Данный API позволяет распределять параллельные задачи на все вычислительные ядра. В Android 4.2 RenderScript исполняется также на GPU, в дополнение к CPU на поддерживаемых системах.
При наличии совместимых с вычислениями GPU тест выполняется на графическом ядре. В противном случае тест загружает ядра CPU. Подтест CompuBenchRS включает следующие компоненты: Computer Vision (Face Detection), 3D Graphics (Provence – трассировка луча), Image Processing (Gaussian Blur, Histogram), Physics (Particle Simulation – 4K) и Throughput (Julia Set, Ambient Occlusion).
В тесте Face Detection чип Qualcomm Snapdragon 805 показал небольшой регресс, хотя Adreno 420, возможно, не может реализовать весь свой потенциал из-за “сырых” драйверов. Поскольку для RenderScript требуется программная поддержка для запуска на графическом процессоре, результаты бенчмарка CompuBenchRS между различными устройствами сильно варьируются, в зависимости от версии используемого драйвера.
Тест трассировки показал аналогичный результат: Qualcomm Snapdragon 805 остался позади своих предшественников. Из предыдущих тестов GPU видно, что Adreno 420 с более высокой частотой имеет большую вычислительную мощность, чем у Adreno 330, поэтому на текущий момент мы не слишком обеспокоены этими результатами. Надеемся, что ситуацию решат доработанные драйверы, когда на рынок начнут поступать первые устройства на SoC Qualcomm Snapdragon 805.
Результаты теста Gaussian Blur более оптимистичны. Здесь Qualcomm Snapdragon 805 показывает почти двукратное преимущество перед Qualcomm Snapdragon 801. Между Snapdragon 800 и Qualcomm Snapdragon 801 большая разница в производительности, которую нельзя объяснить только различиями в тактовой частоте. Вполне возможно, что Snapdragon 800 (и, возможно, Tegra 4) выполняют тест на ядрах CPU вместо GPU.
Qualcomm Snapdragon 805 и Qualcomm Snapdragon 801 поменялись местами во втором тесте обработки изображения (Image Processing). Трудно делать выводы, основываясь на таких противоречивых результатах.
Qualcomm Snapdragon 805 выиграл в двух из трёх тестов Image Processing, продемонстрировав заметный отрыв от Qualcomm Snapdragon 801 в модуле Histogram. Похоже, что устройства на базе Snapdragon 800 и Tegra 4 снова выполняли тест не на ядрах GPU. Скорее всего, это связано со старыми драйверами.
Qualcomm Snapdragon 805 финиширует впереди Qualcomm Snapdragon 801, но отстаёт от двух чипов на базе Cortex-A15. Финишный порядок выглядит более правдоподобным, если тест Physics Simulation проводится на CPU вместо GPU.
Тест Ambient Occlusion демонстрирует значительное преимущество нового Qualcomm Snapdragon 805 перед предыдущей моделью. Тем не менее, он уступил место Exynos 5 Octa. Мы не уверены, имели ли в данном случае место аппаратные или программные ограничения.
Закончить тесты GPGPU можно в позитивном ключе. Мы видим, как Qualcomm Snapdragon 805 превзошёл другие SoC, установив почти шестикратное преимущество перед Qualcomm Snapdragon 801. Мы видим достаточно скромные результаты. Но есть подозрение, что другие SoC применяют только ядра CPU и не пользуются преимуществами ускорения на GPU, как Qualcomm Snapdragon 805.
Трудно делать окончательные выводы о вычислительной производительности Qualcomm Snapdragon 805, учитывая неравномерную производственную поддержку запуска RenderScript на конкурирующих GPU. В результате проведённые тесты больше рассказывают о поддержке функции, нежели о реальном аппаратном потенциале. Надеемся, что поддержка RenderScript будет улучшаться в пределах системы Android. Наличие вычислительной API с GPU-ускорением у производителей железа не только упростит тестирование, но и приведёт к разработке большего количества приложений, использующих графические ресурсы.
Обзор Qualcomm Snapdragon 805 | Snapdragon 805 увеличивает преимущество Snapdragon
Qualcomm Snapdragon 805 оказался ещё интереснее, чем Qualcomm Snapdragon 801, который мы протестировали в соответствующем обзоре. В то время как Qualcomm Snapdragon 801 обладал лишь увеличенной по сравнению с Snapdragon 800 тактовой частотой и не представлял архитектурных изменений, Qualcomm Snapdragon 805 оснащён графическим процессором Qualcomm Adreno следующего поколения.
Adreno 420 реализует усовершенствования в рамках всей цепочки рендеринга – от улучшенного z-буфера до обновлённых разделов ROP. Qualcomm не говорит наверняка, но есть вероятность внедрения дополнительных TMU для работы с высокой пропускной способностью памяти и увеличенным кэшем L2 и кэшем для текстур. Все перечисленные усовершенствования приводят к впечатляющему приросту производительности по сравнению с Adreno 330 в Snapdragon 800/Qualcomm Snapdragon 801, продвигая Qualcomm Snapdragon 805 вперёд PowerVR G6430.
Хотя производительность Adreno 420 в бенчмарках впечатляет, достаточно ли этого для того, чтобы обогнать GPU PowerVR Series6XT? И что тоже немаловажно, сможет ли он конкурировать с Nvidia Tegra K1 на базе Kepler? Если верить первоначальным цифрам, представленным Nvidia, доминирование Adreno 420 в бенчмарках может быть весьма краткосрочным.
Чтобы увидеть значительные изменения в разделе CPU, придётся дождаться Snapdragon 810, который обещают показать в 2015 году. Но пока оптимизированная схема Krait 450 обеспечивает более высокую максимальную частоту кадров, по крайней мере, в теории. Хотя наши однопоточные тесты CPU подтверждают прирост производительности в соответствии с повышением тактовой частоты, Qualcomm Snapdragon 805 с трудом достигает пиковой частоты при работе всех четырёх ядер. Температурный троттлинг в данной ситуации винить нельзя, поскольку тестируемый образец SoC Qualcomm Snapdragon 805 был заключён в большой планшет с хорошо охлаждаемым корпусом. Кроме того, мы провели тесты на различных референсных платформах, что позволило исключить вариант перегрева. Но стоит обратить внимание, что это были планшеты для разработчиков, а не розничные модели. Таким образом, программный стек Qualcomm мог ощущать недостаток оптимизации или, возможно, компания использует старый алгоритм масштабирования частоты для сохранения температуры SoC под контролем. Эта тема заслуживает пересмотра в будущем, когда в продаже появятся розничные образцы.
С появлением CPU семейства Krait, Qualcomm нацелилась на тактовую частоту вместо ширины конвейера и сложности конструкции. Данная стратегия по-прежнему работает, но вряд ли это продлится долго. Мы уже наблюдали её провал в настольном сегменте. Помните Intel Pentium 4? Либо CPU/SoC столкнётся с ограничениями в виде температуры/потребляемой мощности, либо самое слабое звено станет “бутылочным горлышком”, сдерживающим производительность всей системы. Улучшения в IPC, когда за одинаковый промежуток времени выполняется больше, могут повлиять на энергопотребление. Тем не менее, стремление разработчиков как можно чаще вводить SoC в режим сна, а также грамотное управление питанием могут помочь снизить негативный эффект. Мы подозреваем, что новая 64-разрядная архитектура Snapdragon 810 будет больше похожа на CPU Apple Cyclone, чем на Krait.
Благодаря более мощному GPU, Qualcomm Snapdragon 805, похоже, лучше подходит для планшетов и смартфонов с экраном высокого разрешения. Кроме того, продукты более крупного форм-фактора обеспечивают больше теплового запаса для высоких частот Krait 450. Вполне вероятно, что Qualcomm Snapdragon 801 будет более популярен в смартфонах, а на Qualcomm Snapdragon 805 будет создаваться новое поколение планшетов.