|
Обзор Qualcomm Snapdragon 805 | Ещё больше скорости
Процессоры Qualcomm Snapdragon успешны по всем критериям, и, по данным агентства Strategy Analytics, на их базе работают более 1350 готовящихся к продаже и уже доступных в продаже моделей устройств. На долю Snapdragon в третьем квартале 2013 года приходилось более половины прибыли всех чипов SoC для смартфонов. Процветание Snapdragon началось в 2008 году, когда компания представила общественности Snapdragon S1 с графикой Adreno 200 (на базе технологий, приобретённых в AMD) и процессорному ядру CPU с набором команд ARMv7. Ядро Scorpion имело собственную структуру на базе эталонной архитектуры ARM Cortex-A8, было разработано по технологическому процессу 65 нм и работало на частоте 1 ГГц. Каждое последующее поколение чипов, включая Snapdragon S2, S3 и S4, заметно прибавляло в производительности.
Затем в 2013 году компания Qualcomm представила новую архитектуру CPU под названием Krait, которая работала в паре с графическим ядром Adreno серии 3xx. Эта комбинация нашла место в чипах Snapdragon 400, 600 и 800.
Топовый Snapdragon 800 использовал GPU Adreno 330 (450 МГц) и четырёхъядерный CPU Krait 400 с тактовой частотой до 2,26 ГГц. Однако в начале текущего года Qualcomm подняла частоты ещё выше в SoC
Рынок мобильных технологий отличается крайне высокой конкуренцией, и Qualcomm сохраняет на нём ведущую позицию, не переставая при этом развиваться. SoC Qualcomm Snapdragon 805 использует более быстрый CPU Krait 450, новый модем Gobi 9x35 с поддержкой стандарта LTE Advanced CAT6 300 Мбит/с и усовершенствованную ISP для улучшенной (по словам производителя) обработки изображений. Представители компании называют его первым коммерческим мобильным SoC с поддержкой формата 4K. Для её реализации в Qualcomm Snapdragon 805 установлен GPU Adreno 420 с обновлённой архитектурой, отличающейся значительным повышением пропускной способности памяти.
CPU и память
Последним дополнением к семейству Krait является CPU Krait 450 в Qualcomm Snapdragon 805, также это последний 32-битный SoC в "дорожной карте" продуктов Qualcomm. 64-разрядный CPU с поддержкой инструкций ARMv8 мы увидим в Snapdragon 810 в 2015 году. Таким образом, существенных изменений в Krait 450 нет. Он оснащён четырьмя ядрами, каждое имеет по 4 Кбайт + 4 Кбайт кэша L0 и 16 Кбайт + 16 Кбайт кэша L1, кроме того, есть и общий кэш второго уровня объёмом 2 Мбайт. CPU был разработан силами Qualcomm (которая, как и Apple, владеет лицензией на архитектуру для создания совместимых с ARM ISA продуктами) и имеет схожие с ARM Cortex-A15 черты.
Любопытно, как подход Qualcomm к построению CPU отличается от ARM и Apple (Nvidia и Samsung являются лицензиатами процессоров ARM; они пока не показали ничего уникального с точки зрения архитектуры). В Krait Qualcomm реализовала более узко ориентированную и упрощённую архитектуру, реализовав более высокую тактовую частоту. С другой стороны, хост-процессор Cyclone от Apple в SoC A7 больше похож на настольные чипы в плане широты исполнения и сложности архитектуры, но при этом он работает на гораздо более низких тактовых частотах. ARM Cortex-A15 по пропускной способности инструкций на такт и частоте находится между Krait и Cyclone.
Krait реализует свойственное суперскалярным архитектурам внеочередное спекулятивное исполнение команд (спекулятивное исполнение – это техника конвейеризации исполнительных устройств, при которой CPU использует предсказание ветвления для того, чтобы предугадать путь программы и выполнить команды прежде, чем они понадобятся) с 11 целочисленными этапами, по сравнению с 15 этапами в A15. В то время как исполнительный канал является внеочередным, первоначальные этапы выборки/кодирования - очередные, и инструкции также должны быть пересортированы в очередные. Krait 450 по-прежнему может выбирать и декодировать три инструкции за тактовый цикл, выполняя до четырёх инструкций в параллели. Для сравнения, Apple Cyclone предлагает двое больше инструкций на такт, чем Krait, отбирающий/декодирующий, исполняющий и сортирующий шесть инструкций за тактовый цикл. Cyclone также имеет более ёмкий буфер переупорядочения инструкций, содержащий 192 микрооперации против 128 у A-15 и всего 40 у Krait, что теоретически должно сократить число обрывов и обеспечить более эффективное использование канала. Даже при отсутствии изменений в архитектуре и количестве инструкций, выполняемых за такт, Krait 450 по-прежнему обеспечивает небольшой прирост скорости по сравнению с Krait 400 благодаря увеличению максимальной частоты с 2,45 до 2,65 ГГц (в публичной коммуникации Qualcomm округляет прирост частот до десятых долей ГГц).
Наверное, сейчас вы вспомнили про аналогичную ситуацию с переходом с Snapdragon 800 на
Хотя Qualcomm Snapdragon 805 не обеспечивает существенного прироста в производительности CPU, он заметно прибавил в пропускной способности памяти. SoC Qualcomm Snapdragon 805 объединяет в себе 32-битную четырёхканальную шину и память LPDDR3-800, которые генерируют пропускную способность на уровне 25,6 Гбайт/с. Это в два раза больше максимума Snapdragon 800 (12,8 Гбайт/с) и примерно на 70% больше, чем у
Обзор Qualcomm Snapdragon 805 | GPU и революция 4K
Графический процессор Adreno 420
Новый GPU теперь имеет прямой доступ к основной памяти, в то время как контроллер в Qualcomm Snapdragon 805 использует техники обеспечения качества обслуживания (QoS), чтобы каждый вычислительный ресурс (GPU, CPU, ISP) получил пропускную способность и соответствующее время задержки, требуемые для обеспечения пиковой производительности. Наряду с приростом пропускной способности памяти увеличились и кэш для текстур и кэш второго уровня. Конвейер рендеринга Adreno 420 имеет преимущество за счёт реализации раннего тестирования z-буфера для более быстрой отбраковки пикселей по глубине и улучшений в блоках ROP внутреннего конвейера.
Qualcomm не предоставляет подробную информацию касательно графической архитектуры, кроме основных усовершенствований. Тем не менее, учитывая резкое повышение пропускной способности памяти и объёма кэша для текстур, можно смело предположить, что Adreno 420 имеет больше блоков текстурирования. Qualcomm не упоминает об изменениях в конструкции или количестве шейдерных блоков или даже в частоте GPU, но, судя по нашим тестам, какой-то из этих компонентов точно претерпел значительные улучшения. По данным Qualcomm, все проведённые усовершенствования обеспечивают на 40% более высокую производительность и на 20% меньшее энергопотребление, чем у Snapdragon 800 в тесте GFXBenchmark 2.7 T-Rex в разрешении 1920x1080 точек. Скоро мы узнаем, подтвердят ли наши бенчмарки заявления Qualcomm. Чтобы протестировать влияние SoC на время работы от батареи, нам придётся дождаться появления устройств на его базе.
Adreno 420 не только повышает предел производительности, GPU также повышает качество визуализации с поддержкой OpenGL ES 3.1 и DirectX 11 уровня 11_2 (с 9_3 в Adreno 3xx). Кроме того, внедрена поддержка геометрических шейдеров и динамическая аппаратная тесселяция, которая значительно снижает требования к пропускной способности памяти и уменьшает энергопотребление, в то же время повышая детализацию изображения. Вместо хранения данных дополнительной геометрической сетки в основной памяти и её последующей подачи на GPU, аппаратная тесселяция генерирует дополнительную геометрическую детализацию программно на чипе, даже не затрагивая основную память.
На изображении ниже продемонстрировано визуальное преимущество тесселяции, и, согласно Qualcomm, в отношении "этой простой сцены с мухой аппаратная тесселяция обеспечивает экономию пропускной способности приблизительно на 360 Мбайт/с и объёма занимаемой памяти приблизительно на 20 Мбайт. Для ресурсоёмких игр экономию памяти можно считать в гигабайтах".
Ещё одним дополнением к Adreno 420, которое может разгрузить память или полосу пропускания и улучшить качество визуализации, является поддержка технологии адаптивного масштабируемого сжатия текстур (ASTC - Adaptive Scalable Texture Compression) - блочный формат сжатия текстур нового поколения, обеспечивающий сжатие с потерями качества. Он был представлен в OpenGL ES 3.0 (на данный момент поддержка включается опционально). ASTC предлагает разработчикам больше гибкости при выборе соответствующего размера и качества текстур, чем формат ETC2, используемый в процессорах Adreno предыдущего поколения.
Adreno 420 продолжает традицию Adreno по использованию технологии Qualcomm FlexRender для динамического выбора между двумя различными методами рендеринга: мгновенный или плиточный, отложенный рендеринг (Adreno использует отличную от Imagination Technologies технику). Цель FlexRender заключается в выборе наиболее эффективной методики визуализации для конкретной задачи.
Также нужно отметить функцию динамического масштабирования частоты и напряжения (DCVS - Dynamic Clock и Voltage Scaling), которая динамически изменяет частоты и напряжение для каждого вычислительного блока в SoC. Это не новая функция, однако в GPU Adreno 420 были реализованы новые уровни мощности для более точной регулировки и понижения потребления энергии.
Видео 4K
Телевидение ультравысокой чёткости (UHDTV) с разрешением 4K (3840x2160 пикселей) – это самый новый в мире потребительских технологий видеостандарт, который может заменить телевидение высокой чёткости (HDTV) с наиболее распространённым в отрасли разрешением 1920x1080 точек. Тем не менее, адаптация и внедрение стандарта происходят медленно в связи с высокой ценой телевизоров и отсутствием соответствующего контента. Но ситуация меняется в лучшую сторону. Сейчас некоторые 4K-телевизоры продаются дешевле $1000, а сервисы Netflix и YouTube уже раздают 4K-контент в потоке. Во второй половине этого года Amazon и Comcast также готовятся транслировать 4K-видео в потоке.
Qualcomm не задумывается о больших телевизорах, когда речь идёт о формате 4K. Напротив, компания нацелилась на маленькие мобильные дисплеи смартфонов и планшетов, а также 4K-камеры. Представив Qualcomm Snapdragon 805, Qualcomm надеется ещё больше продвинуть вперёд стандарт 4K. Новый Qualcomm Snapdragon 805 способен одновременно управлять дисплеем устройства с разрешением 4K (предположительно, на частоте обновления 60 Гц) и внешним монитором при разрешении 4K и частоте обновления экрана на уровне 24 Гц.
Snapdragon 800/
На представленном ниже слайде Qualcomm подчёркивает возможность 75%-ного снижения энергопотребления с помощью аппаратного декодирования.
Qualcomm Snapdragon 805 также оснащается движком Qualcomm Hollywood Quality Video (HQV). Данная технология была куплена у Integrated Device Technology в 2011 году. Движок HQV подразумевает улучшение качества изображения через понижение шумов и оптимизацию форматирования и перевода изображения из различных форматов. Также существуют алгоритмы оптимизации для улучшения качества изображения низкого разрешения.
ISP
Qualcomm Snapdragon 805 сохраняет два процессора ISP (Image Signal Processor), но повышает их производительность. Теперь они могут обрабатывать 1,2 гигапикселей в секунду и захватывать изображения до 55 мегапикселей через комбинацию четырёх камер (Snapdragon 800 поддерживает только две). Дополнительные входы ISP поддерживают стерео и камеру глубины.
Qualcomm Snapdragon 805 также поддерживает гироскопическую стабилизацию изображения, усовершенствованные алгоритмы подавление шумов и ускорение работы автофокуса.