Intel Skylake: процессорная архитектура революционного масштаба
Редакция THG,  24 сентября 2015


Обзор Intel Skylake | Введение

Шестое поколение многоядерных процессоров Intel Core с рабочим названием Skylake с полным на то правом можно назвать одним из наиболее масштабируемых и революционных за всю историю архитектуры Core. В этом заявлении нет ни малейшего преувеличения. Так, масштабируемость подтверждает ассортимент из почти 50 наименований Xeon, Core i3/5/7, Core M3/5/7, Pentium и Celeron с впечатляющим разбросом характеристик: от крохотных (20 х 16,5 мм) чипов в компактной корпусировке BGA1515 с TDP 4,5 Вт до мощных разблокированных десктопных LGA1151 процессоров вроде Core i7-6700K с габаритами 37,5 x 37,5 мм и TDP порядка 91 Вт. То есть, 20-кратная масштабируемость по энергопотреблению и 4-кратная по размерам чипа.

Обзор Intel Skylake

Кроме того, процессоры с архитектурой Skylake, выпускаемые с соблюдением норм 14-нм техпроцесса Intel, появятся быстро, и сразу практически для всех сегментов вычислительной техники – от мобильных устройств до серверов. Это гораздо энергичнее, нежели 22-нм чипы Haswell двухлетней давности, и гораздо масштабнее чем предыдущее поколение с рабочим названием Broadwell, когда, почти "в обход" десктопных платформ, основной упор был сделан на чипы для ноутбуков и планшетов.

Обзор Intel Skylake

Что касается тезиса о революционности, он подтверждается действительно существенным изменением схемотехники и производительности большинства ключевых элементов архитектуры, таких как DDR4/DDR3L, eDRAM, графика HD Intel Graphics 5xx, Iris/Iris Pro и многое другое, чему, соответственно, и посвящён этот материал.

Обзор Intel Skylake | Микроархитектура Skylake: общий обзор

Архитектура процессоров Skylake получила сотни структурных изменений и улучшений, позволивших повысить производительность при снижении потребления энергии.

Обзор Intel Skylake
Cтруктура 4-ядерного процессора с архитектурой Skylake

Вычислительные процессорные ядра при этом, хоть и изменились, но остались примерно сравнимыми по структурному строению с предыдущими поколениями Broadwell и Haswell. Чего нельзя сказать о структурном уровне чипа в целом, где появился ряд совершенно новых модулей и блоков. Благодаря этому новые чипы Intel Core шестого поколения окончательно превратились из классических процессоров в так называемые "системы на чипе" (SoC, System on Chip).

Обзор Intel Skylake

Стандартный набор компонентов процессора Skylake состоит из двух или четырёх вычислительных ядер (CPU), графической подсистемы, общей кольцевой коммуникационной шины, блока платформенных контроллеров PCH (Platform Controller Hub, порой до сих пор называемого "южным мостом") на многоканальной шине DMI/OPI, интегрированного "расширителя кэша" eDRAM (бывший Crystalwell, опциональный у Haswell), шины PCI Express x16, а также встроенного модуля системных блоков System Agent. В свою очередь, в состав System Agent входят как уже привычные (но значительно переработанные), так и совершенно новые блоки, включая доработанный управляющий блок PCU (Package Control Unit) с блоком контроля температуры (PECI, Platform Environment Control Interface) и напряжения (SVID, Serial Voltage Identification), контроллер памяти DDR3L/DDR4, блоки мультимедийной обработки и вывода видео, плюс совершенно новый процессор обработки изображений ISP (Image Signal Processing).

Полупроводниковая логика и программная прошивка управляющего блока PCU в архитектуре Skylake подверглась значительным доработкам для достижения более динамичных режимов с высокими уровнями производительности и агрессивными алгоритмами энергосбережения, в том числе, в плане сбора внутренней статистики, внешней и внутренней телеметрии (iMon, Psys) и более тесного взаимодействия со старшими в иерархии системами управления (OS, BIOS).

Самое заметное и, пожалуй, существенное изменение в архитектуре Skylake связано с новым интегрированным контроллером оперативной памяти: он по-прежнему 2-канальный, однако теперь поддерживает динамическую память как предыдущего стандарта DDR3L, так и нового поколения DDR4. Прежде полноценный контроллер DDR4 был на вооружении только серверных чипов Xeon и выполненных на основе их дизайна топовых геймерских LGA 2011 чипах Intel Core i7, но фактически именно начиная со Skylake память DDR4 начинает своё широкомасштабное наступление на рынок настольных и мобильных систем.

Модуль аппаратной обработки мультимедийного контента и финального рендеринга видеопотока в архитектуре Skylake также значительно доработан и улучшен. В частности, аппаратный кодек HEVC/H265 нового поколения обладает повышенной производительностью с одновременным уменьшением энергопотребления; есть отдельный аппаратный кодек AVC с очень низким энергопотреблением; обеспечивается вывод изображения на три независимых 4K-дисплея со сниженным на 40%-60% потреблением энергии даже в самом тяжёлом режиме воспроизведения 4K-видео.

В дополнение, архитектура Skylake также поддерживает инициативу Intel по отказу от проводных подключений для беспроводной передачи мультимедийного контента с помощью технологий Intel WiDi или Pro WiDi с компьютеров на телевизоры, мониторы или проекторы.

Обзор Intel Skylake | Интегрированная в ядро обработка изображений

Впервые в составе архитектуры для массовых процессоров Skylake (а не специализированных SoC) появился так называемый встроенный процессор обработки изображений – ISP (Image Signal Processing), что особенно актуально для смартфонов, планшетов и ноутбуков. В частности, ISP обладает встроенным интерфейсом CSI (Camera Sensor Interface) с поддержкой до четырех внешних цифровых камер/сенсоров с разрешением до 13 Мп, правда, с одновременным обслуживанием только двух из них. Аппаратная обвязка CSI поддерживает расширенный список технологий для полноценной обработки фото и видео, включая распознавание и запоминание лиц, групповые снимки, многопоточный захват, съёмку с расширенным динамическим диапазоном (HDR), съёмку при слабом освещении, серийную съёмку и многое другое.

Обзор Intel Skylake

Можно смело предположить, что главной причиной включения в экосистему обработки мультимедийного контента Skylake (ISP + CPU + GPU + дисплей) интегрированной поддержки цифровых камер стало соображение о прямой поддержке стремительно развивающейся технологии Intel RealSense. В любом случае, аппаратно-интегрированный на уровне чипа контроллер обработки изображений очень выгоден с точки зрения экономии энергии. По данным Intel, с помощью ISP обеспечивается практически "нулевая задержка срабатывания затвора" наряду с возможностью съёмки видео с качеством 4K при 30 кадрах в секунду (2160p30) или с качеством Full HD при 60 кадрах в секунду (1080p60).

Обзор Intel Skylake | Архитектурные особенности процессорных ядер Skylake

Основным усовершенствованием процессорных x86-ядер Skylake, позволяющим говорить о повышении качества предсказания ветвлений, загрузки исполнительного конвейера и, как следствие, более частого одновременного декодирования CISC-инструкций и исполнения до шести микроинструкций за каждый такт, стоит назвать значительно расширенные по сравнению с предыдущими поколениями внутренние буферы. На представленном ниже скриншоте из презентации Intel наглядно виден этот последовательный рост на примере трёх последних поколений архитектуры Core.

Обзор Intel Skylake

Обработка входящих команд улучшена благодаря ускоренной работе более ёмкого блока предсказания ветвлений, более глубокая буферизация внеочередного исполнения инструкций позволила говорить о более качественном распараллеливании обрабатываемого кода, уменьшении латентности и снижении энергопотребления в моменты простоя.

В целом архитектура Skylake обладает более глубокой буферизацией данных, чтения/записи, отложенной (write-back) записи, ускоренной производительностью обработки промахов страниц и кэш-памяти L2. Со времён Sandy Bridge почти в полтора раза (до 224) увеличилось окно внеочередного исполнения инструкций, улучшена работа Hyper-Threading за счёт почти удвоенного до 64 на поток окна очереди распределения и сниженного простоя конвейера за счёт оптимизированных алгоритмов улучшенного блока предсказания ветвления. Также появились новые инструкции для лучшего управления загрузкой кэш-памяти, а скорость работы протокола AES криптографического шифрования в GCM- и CBC-режимах выросла на 17% и 33%, соответственно.

Обзор Intel Skylake

В презентациях Intel также есть интересное официальное упоминание факта, что ядра Skylake впервые будут поддерживать разные модели и способы оптимизации производительности, отдельно для клиентских и серверных процессоров. Вот такая "закладка" на будущее. Архитектура будущих, ещё не анонсированных чипов Xeon, как говорил поэт, готовит нам "открытий чудных".

Обзор Intel Skylake | Intel SGX: новая технология защиты данных

В архитектуре Skylake появилась поддержка набора новых инструкций Intel Software Guard Extensions (Intel SGX) для создания вычислительных анклавов, изолированных от воздействия вредоносного ПО и разного рода атак злоумышленников. Технология Intel SGX, поддерживающая расширения Intel Memory Protection Extensions (Intel MPX), позволяет использовать так называемые "доверенные анклавы" в специальных областях памяти и ограничивает прямой доступ к физическим разделам памяти, выделенной для этих процессов.

Таким образом для программ обеспечивается дополнительный уровень защищённости, как при работе с кодом, так и при обработке данных. Кроме того, технология Intel SGX позволяет ограничить аппаратный и программный доступ к закрытым данным даже на самом доверенном уровне, вроде инструментов отладки процессора.

Обзор Intel Skylake | Внутренние коммуникации и контроллер памяти

Серьёзным изменениям в архитектуре Skylake подверглась кольцевая шина, кэш-память и структура цепей работы с памятью. Согласно данным презентации, пропускная способность кольцевой шины, обеспечивающей обмен между вычислительными ядрами, графической подсистемой, системным агентом, контроллером памяти и кэш-памятью L3 была удвоена по сравнению с поколением Haswell, при этом число используемых для этого транзисторов увеличилось лишь на 50%, а уровень энергопотребления для многих режимов остался на прежнем уровне.

Удвоенная производительность кольцевой шины позволила удвоить скорость работы кэш-памяти L3 при обработке промахов, что вместе с появлением поддержки DDR4 и особенностями работы eDRAM даёт надежду на значительный прирост производительности в некоторых приложениях. Помимо этого улучшенная работа с памятью также сказалась на обеспечении стабильной работы процессора обработки изображений (ISP) и поддержке видеовыхода на три дисплея с разрешением до 4K.

В архитектуре Skylake реализована новая, полностью когерентная структура встроенной DRAM (eDRAM), или Memory Side Cache, способная кэшировать любые данные, включая варианты "некэшируемой памяти", без необходимости очистки для поддержания когерентности, и доступной для использования устройствами ввода-вывода и формирования выходного видеосигнала. Помимо этого графическая подсистема для достижения оптимальной производительности может выбрать режим кэширования определённых данных только в eDRAM без использования кэш-памяти L3.

В отличие от предыдущей архитектуры, где примерно четверть кэш-памяти L3 использовалась для доступа к eDRAM, и при этом eDRAM не имела возможности прямого взаимодействия с остальной системой (на слайде ниже, в верхней части), в архитектуре Skylake контроллер eDRAM переместился в модуль системного агента, освободив таким образом порядка 512 Кбайт ёмкости кэша L3 и одновременно с этим облегчив доступ другим компонентам ядра к данным в eDRAM. Отныне Memory Side Cache может взаимодействовать с основной системной памятью напрямую, обеспечивая таким образом обновление экрана без необходимости вывода остальных компонентов процессора из ждущего режима.

Обзор Intel Skylake

К сожалению, как и в случае с архитектурой Haswell, в Intel так и не озвучили планов использования eDRAM в составе обычных LGA-процессоров на базе Skylake для настольных систем. Не исключено, что на этой стадии развития процессорной микроархитектуры Intel плюсы Memory Side Cache будут реализованы только в чипах для мобильных, встраиваемых и компактных систем.

Обзор Intel Skylake | Оптимизация энергопотребления: Intel Speed Shift и не только

Список режимов работы современных процессоров Intel включает так называемые "P-состояния" (P-states, от слова "performance" – "производительность), когда пары значений питающего напряжения и тактовой частоты, включая режим Turbo, определяют режим высокой производительности при обработке данных с сохранением оптимального энергопотребления. Предыдущие поколения архитектуры Intel Core делегировали процесс управления P-состояниями Windows или другим операционным системам, однако в архитектуре Skylake разработчики пошли ещё дальше и реализовали возможность изменения P-состояний непосредственно на уровне процессорной логики.

Именно так вкратце можно описать принцип работы новой технологии Intel Speed Shift Technology. Помимо 30-кратного, по словам разработчиков, увеличения скорости переключения состояний и значительного снижения латентности процесса, технология Speed Shift также может дать дополнительные преимущества. Так, например, для последовательных процессов с многократно повторяющимися, но не слишком тяжёлыми нагрузками, вроде записи видео, иногда выгоднее немного приподнять тактовую частоту на всё время процесса, нежели постоянно гонять её вверх и вниз, и технология Intel Speed Shift, реализованная в Skylake, способна справиться с этим.

В связи с тем, что новая технология требует соблюдения некоторых специфических условий для нормального взаимодействия операционной системы и процессора, в настоящее время поддержка Intel Speed Shift реализована только в Windows 10, а для работы под Windows 8, более старыми её версиями, Linux и остальными ОС потребуются дополнительные патчи для полноценной поддержки аппаратной техники переключений P-состояний в Skylake.

Работа технологии Intel Speed Step в архитектуре Skylake также затрагивает управление энергопотреблением таких модулей процессора, как системный агент, контролер памяти, eDRAM и интерфейсы ввода-вывода, обеспечивая лучшую производительность при обработке задач с небольшой загрузкой с помощью увеличения тактовых частот ядер и графической подсистемы в случаях, когда это допустимо.

Исходя из соображений экономичности, эффективности, упрощения дизайна и температурного режима кристалла, модуль преобразования и регулировки питания, расположенный внутри ядер Haswell/Broadwell, в архитектуре Skylake вновь был вынесен за пределы чипа на материнскую плату.

В целях дальнейшей оптимизации расхода энергии процессора разработчики пошли ещё дальше, и в Skylake динамическое управление энергопотреблением реализовано не только на уровне отдельных модулей – ядер, графики, eDRAM и др., но даже на уровне отдельных вычислительных блоков, например, энергоёмких исполнительных 256-битных блоков, обрабатывающих команды пакета Intel Advanced Vector Extensions 2 (Intel AVX2).

Аппаратные средства динамического управления питанием в архитектуре Skylake также предусматривают специальные улучшенные алгоритмы для режимов воспроизведения видео, работы с мультимедийным контентом, вывода видео на экраны с высоким разрешением, что расширяет возможности экономного использования батарей в мобильных устройствах и позволяет более гибко конструировать различные устройства в необычных форм-факторах, в том числе, с пассивным безвентиляторным охлаждением.

Обзор Intel Skylake | Встроенная графика архитектуры Skylake

Графическая подсистема девятого поколения, реализованная в архитектуре Skylake, изменилась настолько масштабно и радикально, что подробный рассказ о ней для понимания всех нюансов заслуживает отдельной статьи, примерно сравнимой по объёму с этой. Здесь же придётся ограничиться общими характеристиками и сведениями.

Обзор Intel Skylake

Девятое поколение интегрированной графической подсистемы – Intel Gen9 Graphics, реализованное в составе новой архитектуры, и, как и весь чип Skylake, изготавливаемое с соблюдением норм 14-нм техпроцесса, получило мощные структурные изменения наряду с повышенной энергоэффективностью. Унаследовав базовые черты от архитектуры Broadwell, новая линейка интегрированных графических ядер, охватывающая все варианты термозидайна процессоров в диапазоне от 4,5 Вт (в перспективе и менее) до 91 Вт, включает в себя огромную гамму решений, от базовой логики HD Graphics 510ULT на основе одного модуля с 12-ю исполнительными устройствами до мощнейшей графической подсистемы Iris Pro Graphics 580 (GT4e) на базе трёх модулей с 72 исполнительными устройствами, встроенным eDRAM-буфером ёмкостью 128 Мбайт, с суммарной пиковой производительностью до 1152 гигафлопс (Gen9 GT4 больше чем Gen8 GT3 примерно в полтора раза).

Обзор Intel Skylake

В аккурат к появлению Windows 10 в новой графике Intel появилась полноценная аппаратная поддержка Direct X 12 для игр, а также технологий Open CL 2.0 и Open GL 4.4 для более чёткой и качественной картинки. По данным Intel, новая графика обеспечит прирост производительности в 3D-играх до 40% по сравнению с предыдущим поколением.

Обзор Intel Skylake

Масштабируемость производительности с оптимизированным энергопотреблением позволяют говорить о появлении на базе новых процессоров Intel с графикой Gen9 новых поколений мобильных устройств с реальной работоспособностью на протяжении всего дня и ультранизким энергопотреблением в режиме воспроизведения мультимедийного контента: менее 1 Вт при проигрывании видео и порядка 1 Вт при проведении видеоконференции.

Новое девятое поколение графики Intel также поддерживает расширенный список аппаратных функций ускорения кодирования и декодирования (HEVC, AVC, SVC, VP8, MJPG), расширенные возможности обработки и преобразования "сырых" данных непосредственно с 16-битной матрицы цифровой камеры с качеством до 4K 60p, а также расширенные возможности движка Quick Sync с режимом Video Fixed-Function (FF), позволяющие декодировать H.265/HEVC без обращения к вычислительным ядрам.

Обзор Intel Skylake

Поддержка трёх дисплеев, доступная в предыдущих поколениях процессорной архитектуры, в графике Intel Gen9 улучшена более оптимальным рендерингом сжатых поверхностей, возможностью вращения экрана на 90/270 градусов, поддержкой высоких разрешений экрана (4K и более), с одновременной возможностью беспроводного вывода изображения с качеством до 4K30p.

Обзор Intel Skylake

Обзор Intel Skylake | Оверклокинг

Для многих моделей процессоров на базе Skylake, в том числе, для приличного списка мобильных чипов Intel Core M, отныне будет доступна углублённая возможность оверклокинга, в том числе, с помощью изменения базовой частоты (BCLK) отдельно от тактовой частоты шины PCIe, и расширенной настройки параметров DDR4. В частности, для памяти будет доступна регулировка частоты с шагом в 100 и 133 МГц, с порогом фактической частоты как минимум до 4133 МГц.

Обзор Intel Skylake

На уровне чипсета тактовая частота контроллера может регулироваться вплоть до 200 МГц с шагом 1 МГц, а для некоторых вариантов будет доступен разгон до 250 МГц и даже выше, с точностью изменения даже менее 1 МГц.

Множитель тактовой частоты разблокированных графических процессоров (pGfx) будет регулироваться вплоть до 60, что даст шаг прироста в 50 МГц, плюс дополнительные регулировки напряжения питания.

Обзор Intel Skylake

Обзор Intel Skylake | Итого

За рамками этой статьи остались особенности исполнения различных семейств чипсетов, версий графического ядра, а также тонкости компонентного состава и реализация технологий энергосбережения для различных серий процессоров. Всё это заслуживает отдельного детального рассмотрения, равно как и изучение практических характеристик конкретных процессорных моделей.

Подводя итог сегодняшней публикации, следует отметить, что процессорная архитектура Intel за последние несколько лет обрела невероятную, даже по нынешним удивительным временам, масштабируемость, перекрывая нужды современной электронной промышленности от сверхэкономичных ультракомпактных "систем-на-чипе" для смартфонов, планшетов, устройств для Интернета с одной стороны, до мощных серверных чипов с другой стороны. Сегодняшние процессоры Intel с архитектурой Skylake найдут применение в широком спектре форм-факторов персональных вычислительных устройств, от ультрамобильных Compute Stick, трансформеров, конвертируемых систем "2-в-1" и моноблоков с большими 4K-экранами до мобильных рабочих станций.

Обзор Intel Skylake

Новые платформы на базе процессоров Intel Core шестого поколения и процессоров Intel Xeon обладают встроенной поддержкой новых функциональных возможностей и технологий, таких как Thunderbolt 3 с интерфейсом USB Type-C, камеры Intel RealSense и т.д.

Обзор Intel Skylake | Что дальше?

Разумеется, на этом развитие процессорной архитектуры Intel не заканчивается. Согласно тем крохам информации, которая сейчас известна о будущих планах Intel по развитию процессорной микроархитектуры, следующим в 2016 году будет представлено поколение с рабочим названием Kaby Lake, выполненное по тому же 14-нм техпроцессу, но отличающееся от Skylake дополнительными изменениями в плане повышения производительности. Вслед за ним ожидается появление архитектуры с рабочим названием Cannonlake, но, поскольку в настоящее время очень трудно оценить сроки коммерциализации следующего 10-нм технологического процесса, также нет смысла гадать о сроках его появления. Если Intel удастся выдержать традиционный 2-летний интервал между освоением следующих норм техпроцесса, переход с 10-нм на 7 нм мы увидим, вероятно, примерно к 2019 году.

Ссылки по теме:

  1. Intel Core i7-6700K и i5-6600K: обзор и тест процессоров на базе архитектуры Skylake. Часть 1
  2. Intel Core i7-6700K и i5-6600K: обзор и тест процессоров на базе архитектуры Skylake. Часть 2
  3. Полный список процессоров с архитектурой Skylake и соответствующих чипсетов

КОНЕЦ СТАТЬИ


Координаты для связи с редакцией:

Общий адрес редакции: thg@thg.ru;
Размещение рекламы: Roman@thg.ru;
Другие координаты, в т.ч. адреса для отправки информации и пресс-релизов, приглашений на мероприятия и т.д. указаны на этой странице.


Все статьи: THG.ru

 

Rambler's Top100 Рейтинг@Mail.ru