Обзор APU AMD Carrizo | Введение
Новый мобильный APU Carrizo-L создан специально для ноутбуков, трансформеров и аналогичных устройств. В чипе используются новые энергоэффективные ядра Excavator. Также впервые на одном кристалле сочетаются APU и южный мост.
Преимущества объединения CPU, GPU, VPE и контроллера памяти на одном кристалле очевидны. С одной стороны, это сокращает время передачи между обычными чипами, с другой стороны, дает возможность гораздо более тонкой настройки режимов питания, учитывающих взаимодействие отдельных компонентов.
Снижению потребляемой мощности также способствует общий контроллер памяти, а точнее, его усовершенствованное управление питанием и новая “телеметрия”. APU AMD Carrizo оснащается современным GPU с поддержкой DX12, Mantle и, конечно же, HSA.
Обзор APU AMD Carrizo | Новая топология чипа отличается повышенной плотностью компоновки
Естественно, оптимальная реализация всех компонентов на одном чипе требует нового подхода к компоновке и новых стандартов конфигурации в целом. AMD по-прежнему использует техпроцесс 28 нм, поэтому ядра Excavator используют технологию компоновки с высокой плотностью, которая в конечном итоге сводится к гораздо более высокой плотности размещения компонентов в прежних конструктивных размерах.
Таким образом, высвобождается 23% площади кристалла. Это приводит к снижению потребления энергии и меньшим потерям из-за утечек. При этом отпадает необходимость в полной перестройке производственного процесса.
Решающим фактором является подход. Он может быть ориентированным на CPU, как в Steamroller, либо ориентированным на GPU, как в APU AMD Carrizo. Имейте в виду, что несмотря на площадь поверхности, как у Kaveri, число транзисторов возросло до 3,1 млрд, то есть на 29%!
Для AMD будущее во многом зависит от распределения операций между CPU и GPU и их параллельной обработки, где GPU является частью APU. У этих идей гораздо больший потенциал в будущем, но учитывая, что поддержка HSA уже полностью реализована, значительный рост производительности ожидается уже на текущих стадиях разработки.
Обзор APU AMD Carrizo | Соотношение тактовой частоты и энергопотребления
При сравнении двух подходов преимущества становятся очевидными, по крайней мере, в теории. По части эффективности новые ядра Excavator превосходят ядра Steamroller с потребляемой мощностью 18 – 20 Вт и предлагают более высокую тактовую частоту при равных уровнях энергопотребления и пониженный уровень потребления энергии при равной тактовой частоте.
Преимущества становятся еще более явными при сравнении ядер GCN графического процессора, которые были оптимизированы для меньшего потребления энергии при сохранении тактовой частоты.
Однако архитектура кристалла – это лишь половина. На тактовые частоты и используемое напряжение CPU и GPU влияет не только оптимизированная компоновка, но в значительной степени оптимизированная телеметрия, контролирующая отдельные компоненты.
Обзор APU AMD Carrizo | Вопрос в коммуникации и регулировании?
Как известно, взять и снизить потребляемую мощность не так просто. Нужен глубокий анализ ситуации. Несколько “дежурных” изменений и пары технических ухищрений недостаточно. Мы видим, что AMD достаточно активно работает в этом направлении, в основном из-за необходимости оставаться на плаву.
Попытки улучшить управление питанием на основе широко известного интерфейса SVI2 (Serial Voltage Identification Interface 2.0), который соединяет APU с источником питания, уже делались раньше. Этот вопрос затрагивался в статье The Math Behind GPU Power Consumption And PSUs (англ.), с той лишь разницей, что сегодня рассматривается как CPU, так и GPU.
Улучшения определенно можно достичь с помощью более стабильного и качественного источника питания, позволяющего делать более точную настройку взаимосвязи тактовой частоты и подводимого напряжения.
Обзор APU AMD Carrizo | Снижение энергопотребления за счет снижения тактовой частоты и напряжения
Технология AVFS (Adaptive Voltage and Frequency Scaling) выступает в роли арбитра, который старается добиться согласованности максимальной температуры чипа и параметров энергопотребления или пытается настроить тактовые частоты в соответствии с реальной загрузкой процессора.
Если предположить, что адаптивная (скорректированная) тактовая частота меньше, чем глобальная, текущей частотой можно управлять с помощью простого частотного делителя и одновременно выставить пониженное напряжение (Vdd). Этот делитель, по сути, является простым счетчиком глобальных тактовых циклов до запуска какого-либо события. Это изменение состояния можно использовать для соответствующего масштабирования напряжения. Однако эффективность быстро теряется в случае резкой смены нагрузки и связанной с ней большой разницы в напряжении.
Здесь в игру вступает данная технология: вместо полностью линейного регулирования, для настройки тактовой частоты и напряжения могут использоваться различные пороговые значения.
В приведенной ниже схеме тактовая частота, а также напряжение понижаются до определенного значения почти одновременно. После скачка нагрузки напряжение возвращается на свой уровень, но благодаря такому скачку создается небольшой “тепловой запас”, который можно “расходовать” при дальнейшем повышении нагрузки.
Однако такое размазывание производительности – это лишь одна часть уравнения. Для управления требуется данные, и они должны откуда-то поступать, особенно если GPU и CPU регулируются таким же образом. Помимо обычных датчиков температуры и напряжения для мониторинга отдельных секций, используются 10 модулей AVFS, имеющих в общей сложности около 500 чувствительных к частоте контуров.
Это, в свою очередь, позволяет значительно тоньше и, что более важно, локально управлять частотой и напряжением в APU. Именно за счет этого и окупается уплотнение многочисленных компонентов на одном кристалле.
Довольно интересно, как эти идеи будут реализованы в ближайших поколениях видеокарт и будут ли реализованы вообще, учитывая, что восемь ядер GCN в APU AMD Carrizo являются прототипом следующих решений.
Обзор APU AMD Carrizo | Более быстрая и точная активация различных состояний
При создании эффективной системы не следует недооценивать отдельные режимы работы и управление ими. Выборочная активация и деактивация определенных функций является важным фактором для увеличения времени работы от батареи в мобильных устройствах.
Особенно актуальным для AMD было состояние S3, или “режим ожидания”. S0i3, или режим “простоя”, позволяет APU AMD Carrizo отключать все модули, которые он посчитает невостребованными, без необходимости тратить для этого время на взаимодействие с операционной системой.
Обзор APU AMD Carrizo | Повышенная эффективность и прогнозы
При условии, что эта информация и результаты, предоставленные AMD, выдержат проверку в реальной жизни, то с точки зрения эффективности APU AMD Carrizo, по сравнению с Kaveri, представляется своего рода заметной вехой. Помимо увеличения обработки количества инструкций на такт примерно на 5%, AMD уверяет, что ядра Excavator занимают на 23% меньше площади поверхности кристалла и потребляют на 40% меньше энергии, чем ядра Steamroller.
В отличие от Kaveri, APU AMD Carrizo также будет поддерживать кодек H.265, хотя точных сведений по нему AMD еще не публиковала. В любом случае, скорость декодирования потока по сравнению с Kaveri должна увеличиться в 3,5 раза. В отношении восьми ядер GCN AMD обещает понижение энергопотребления на 20% по сравнению с предыдущими решениями.
Что же, будем с нетерпением ждать того момента, когда мы сможем собственноручно проверить все эти заявления.