|
Архитектура Broadwell | Введение
Intel скрупулёзно документирует все новшества, которые реализует в своих процессорах с каждым новым поколением – об э том хорошо известно всем, кто интересуется индустрией CPU. Эту стратегию компания называет "тик-так" ("тик" – это сокращение размеров узла с целью вместить больше транзисторов на одном кристалле, а "так" – значительное обновление архитектуры). Это цикл повторяется каждый год. "Так" – это выпуск процессора Haswell На основе техпроцесса 22 нм, а теперь перед нами "тик" – сокращение площади кристалла в процессоре Haswell до 14 нм, что фактически и есть новый Broadwell.
Если вам эта стратегия уже знакома, вы должны понимать, чего мы ждём от архитектуры Broadwell – более компактных процессоров, пониженного энергопотребления, более высокой производительность на ватт мощности, а также общую производительность, сопоставимую с решениями предыдущего поколения. Так что новый продукт в этом смысле – не достижение, а демонстрацией постоянства компании в производстве решений в разрезе нескольких поколений. Но, конечно, многих может удивить, что на каком-то этапе такой последовательности появились процессоры Haswell-Y, TDP которых достаточно низок для того, чтобы использовать его в корпусах толщиной 9 мм с пассивным охлаждением. Это совершенно новая область применения для бренда Intel Core. Но об этом позже, сначала нужно рассказать о более значительном событии – появлении процессорного узла 14 нм.
Архитектура Broadwell | Узел 14 нм: второе поколение FinFET
Может показаться логичным, что нумерация моделей процессорных узлов обозначает размер (22 нм или 14 нм). Хотя это было так в случае предыдущего поколения (размер соотносился с самым малым компонентом транзистора – обычно затвором), сейчас в номенклатуре решений Intel это не отражено.
Современные узлы получают наименования на основе соотношения физического размера узла к размеру узла предыдущего поколения. То есть, если сравнить узел 22 нм с узлом 14 нм, то станет понятно, что расстояние между плавниками транзистора уменьшилось с 60 нм до 42 нм, расстояние между границами соседних затворов – c 90 нм до 70 нм, а минимальное расстояние между слоями внутрисхемных соединений – с 80 нм до 52 нм. Ячейка памяти SRAM, занимавшая на узле 22 нм до 108 нм2, в 14-нанометровом узле занимает 59 нм2.
Размеры компонентов по сравнению с предыдущим поколением узлов имеют различные коэффициенты миниатюризации – от 0,70 (расстояние между плавниками) до 0,54 (площадь ячейки SRAM). Если взять число 22 и умножить на 0,64, получится примерно 14, так что можно сказать, что Intel применяет логичную номенклатуру для своего 14-нанометрового узла. Кстати, кристалл Broadwell-Y примерно на 63% меньше по площади, чем кристалл Haswell-Y.
22-нанометровые узлы Intel – первые продукты компании, использующие FinFET-транзисторы (также известные как Tri-Gate). 14-намнометровые узлы – это второе поколение узлов, использующее FinFET-транзисторы, характеризующиеся более высокой плотностью за счёт более близкого расположения плавников. Это, вкупе с более высокими и тонкими плавниками, повышает значение управляющего тока и оптимизирует производительность транзистора. Количество плавников в транзисторе снизилось с трёх до двух, что также способствует повышению плотности при снижении электрической ёмкости.
Конкуренты Intel в настоящий момент переходят с транзисторов MOSFET на FinFET, но Intel заявляет, что ей нет равных в масштабировании логического пространства. Основываясь на информации, полученной от TSMC и альянса IBM, и используя формулу масштабирования (расстояние между затворами, помноженное на шаг металлизации), Intel утверждает, что будущий узел 16 нм от TSMC не реализует никаких улучшений в области масштабирования логики по сравнению с 20-нанометровым узлом, что, по словам компании, отбросит конкурентов назад на пару поколений. Конечно, данная формула помогает определить только один параметр сравнения, но при этом будит в нас интерес к тому, что нового покажет 16-нанометровый узел от TSMC в следующем году. Также признаемся, что у нас есть опасения, что законы физики вмешаются в ход эволюции узлов, если литография сожмётся до размеров менее 10 нм, что, в свою очередь, поможет конкурентам догнать Intel. Но в настоящий момент законы Мура всё ещё работают.
Кратко коснёмся темы выхода пригодных кристаллов. Ни один производитель не блещет откровенностью, разговаривая на эту тему, но Intel немного приоткрыла завесу. В общем и целом, компания рассказала нам, что техпроцесс 22 нм обеспечивал самый высокий выход среди последних поколений узлов, а показатель выхода 14-нанометровых SoC Broadwell демонстрирует положительную динамику и находится в приемлемых рамках. Первые продукты на продажу уже прошли квалификацию, и их появления на рынке стоит ожидать в конце 2014 года.
То есть, все эти факторы обуславливают снижение объёма утечек, энергопотребения и стоимости в расчёте на транзистор, а общая производительность и производительность в пересчёте на ватт увеличились по сравнению с узлами предыдущего поколения. Нас это не удивило, но изменения крайне положительные, особенно если это обозначает, что такие технологии можно использовать в новых типах устройств. Это особенно актуально, если принять во внимание, в каких продуктах Intel будет использовать 14-нанометровые узлы. Один из них - Broadwell-Y, мобильный чип следующего поколения, о котором Intel рассказала достаточно подробно.
Архитектура Broadwell | Конвергированное ядро Broadwell
Intel утверждает, что показатель IPC в Broadwell будет, по крайней мере, не 5% выше, чем в Haswell. Это не такое уж значительное усовершенствование, но это нас и не удивляет, если вспомнить концепцию "тик-так" и то, к какой группе относится новая архитектура.
То есть, все основные усовершенствования достигаются за счёт увеличения возможностей имеющихся элементов процессора, а не за счёт разработки новых. Повышение плотности 14-нанометрового узла – это довольно успешный шаг, который также обеспечивает дополнительное пространство для добавления дополнительных транзисторов, что Intel и сделала: в новой архитектуре выросло число записей планировщика внеочередного исполнения команд (о том, насколько оно выросло, Intel не сказала), что обуславливает более быстрый процесс перенаправления для загрузки. Буфер ассоциативной трансляции (TLB) второго уровня вырос с 1 тыс до 1,5 тыс записей, добавился новый буфер для страниц по 1 Гбайт на 16 записей. На второй странице буфера TLB имеется обработчик страничного нарушения, так что переход со страницы на страницу может осуществляться в параллельном режиме.
Умножитель с плавающей запятой теперь функционирует намного эффективней и способен выполнять за три такта задачи, которые Haswell мог обрабатывать за пять. В Broadwell также возросла скорость векторных вычислений. Intel уверяет, что алгоритмы предсказание ветвления также улучшены.
Кроме общих параметров, в новой архитектуре уделено внимание улучшению некоторых специфических характеристик, в том числе инструкций для ускорения шифрования, как и время исполнения операций виртуализации. Конечно, основной задачей Intel является снижение энергопотребления, так что компания использовала дополнительные транзисторы только для функций, которые не предполагают значительного повышения энергопотребления. Об этом мы подробнее узнаем в следующих разделах статьи.
Архитектура Broadwell | Broadwell-Y: представляем процессор Intel Core M
Новый 14-нанометровый узел подходит для использования в различных сегментах рынка – от ЦОДов до планшетов, в зависимости от количества кристаллов Broadwell. На момент написания статьи у нас была информация только о Broadwell-Y, хотя усовершенствования архитектуры Broadwell буду отражены и в других решениях. Мы рассмотрели Broadwell-Y под именем Intel Core M.
Новый бренд Core M будет использоваться во всех новых мобильных решения, в то время как бренды Celeron и Pentium M не будут иметь отношения к с SoC Broadwell-Y. Характеристики указывают на то, что такого чипа мощностью 3 Вт или 5 Вт будет достаточно для работы в устройствах толщиной от 7 до 10 мм с пассивным охлаждением и дисплеем диагональю 10,1 дюйма. Мы даже повертели в руках прототип довольно привлекательного планшета толщиной 7 мм, но не смогли запустить какое-либо приложение или посмотреть спецификации помощью панели управления. Пришлось принять на веру заявление Intel, что Broadwell-Y "обеспечивает более чем двукратное снижение TDP, имея более высокую производительность, чем Haswell-Y".
Чип Broadwell-Y имеет площадь 82 мм2, почти на 63% меньше, чем у Haswell-Y (130 мм2). Что касается размеров платы, площадь её у Broadwell-Y на 50% меньше, а толщина – на 30% меньше, чем у Haswell-Y. Сокращение размеров было осуществимо за счёт перемещения 3DL-модулей на небольшую отдельную PCB, прикреплённую снизу платы чипа Broadwell-Y. Конечно, в этом случае в материнских платах должен быть подходящий разъём.
Так как масштабирование площади у чипа 14 нм получилось более эффективным, чем ожидалось, Intel смогла распаять на плате на 20% больше транзисторов, что обеспечивает более широкий набор функций и более высокую производительность. Например, интегрированный графический модуль на Haswell-Y имеет максимум 20 регистров AU, в том время как Broadwell-Y может использовать до 24. Это означает 20%-ый прирост вычислительных ресурсов, к тому же Intel утверждает, что также на 50% увеличилась частота устройства стробирования. Кроме этих усоврешенствований, Intel упоминает об улучшениях геометрии, толщины и показателей скорости заполнения пикселя, которыми чип обязан изменениям архитектуры, хотя подробности об этом неизвестны. Также в ходе анонса продукта было сказано о поддержке 4K-дисплеев, притом на данный момент известно о поддержке теоретически двух существующих дисплеев. Имеет ли это смысл, учитывая ограничения мобильных устройств по питанию, неясно.
Архитектура Broadwell | Intel Core M: главное – низкое энергопотребление
Intel утверждает, что оптимизации, реализованные в Broadwell-Y, снижают потребление энергии вдвое по сравнению с Haswell-Y и позволяют обойтись без активного охлаждения. Потенциаль снижения энергопотребления в масштабе SoC, по сведениям, распределился таким образом: энергопотребление на 25% ниже благодаря снижению электрической ёмкости, на 20% - благодаря более низкому напряжению в сочетании с оптимизациями чипа, до 15% - благодаря повышенной производительности транзисторов на низких напряжениях, на 10% - благодаря меньшим утечкам питания и более маленьким размерам и повышенной плотности транзистора. Конечно, Intel не раскрыла подробностей о точных TDP продуктов, к которым относится данная статистика, так что нам придётся немного подождать. Мы знаем, что чипы, о которых говорит Intel, при загрузке показывают скачок потребления от 10 Вт до 15 Вт, а затем , через несколько милисекунд, потребление энергии снижается до 3-4 Вт при стабильной работе под нагрузкой.
Broadwell-Y также использует улучшенный интегрированный регулятор напряжения (FIVR) второго поколения, который способствует ускорению перехода чипа из состояния низкой частоты в простое в состояние под нагрузкой. FIVR имеет функцию нелинейного снижения частоты и поддержку нового режима FIVR-LVR. Оказывается, FIVR не особенно эффективен при очень низких напряжениях, так что его можно отключить, если необходимо сэкономить энергопотребление.
SoC также реализует ряд оптимизаций для активного энергосбережения: оптимизации техпроцесса, которые позволили снизить минимальное рабочее напряжение и динамическую электрическую ёмкость (Cdyn), изменения в архитектуре графики DDR/IO/PLL/Graphics, оптимизации Cdyn in IA/Graphics/PH и более низкие диапазоны рабочей частоты для IA/GT и кэша. Графикой можно управлять через Duty Cycling Control (DCC), чтобы снизить энергопотребление, а также её можно просто включать и отключать, если нужно. Время задержки при отключении GPU совсем небольшое, а его частота может быть понижена до 12,5% нормальной рабочей частоты.
Частота, конечно, привязана к потребляемой энергии и тепловой мощности. Имеются три порога энергопотребления, призванные обеспечивать максимальную частоту при сохранении стабильности системы. PL3 – максимально допустимый уровень, ограниченный защитой от перегрузки батареи, который можно использовать непродолжительное время. PL2 – стандартный пиковый уровень, а PL1 предназначается для длительного применения при устойчивом уровне потребления энергии и стабильности системы. При необходимости функция троттлинга может включать и выключать блоки процессора, чтобы минимизировать потребление энергии и тепловыделение.
В Broadwell реализована система управления питанием и тепловыделением, оценивающая показатели множества компонентов, а драйвер Intel контролирует потребление энергии различными компонентами.
PCH также получил некоторые изменения, направленные на повышение эффективности. Потребление энергии в простое снижено на 25% по сравнению с продуктами 2013 года, а энергопотребление в активном состоянии теперь ниже на 20% в сравнении с PCH-LP Haswell. Средства мониторинга и отчётности по снижению энергопотребления реализованы на уровне устройства, прошивки и соответственного программном обеспечении.
Кроме это, PCH дополнен функцией Audio DSP, которая имеет больше памяти SRAM и более высокий показатель скорости обработки инструкций (MIPS). Постпроцессинг был усовершенствован, включая поддержку функции wake-on-voice. В процессоре также реализованы новые возможности управления и безопасности. Стоит отметить, что PCH использует 22-нанометровый узел, и размер остался прежним в сравнении с предыдущим поколением.
Архитектура Broadwell | Первые тесты
Мы смогли оценить возможности Core M-5Y70 (Broadwell-Y, TDP 4,5Вт) в корпусе планшета без вентилятора и сравнили его с Atom Z3740D (Bay Trail, TDP менее 4 Вт). Без лишних слов перейдём непосредственно к результатам.
3DMark показал почти трёхкратный прирост скорости у Core M-5Y70. Любопытно, что прирост коснулся не только графической производительности, но и вычислений, исполняемых на CPU.
Тесты SunSpider и Cinebench также прекрасно демонстрируют сильные стороны Core M. В данных тестах новый процессор Broadwell при пониженном энергопотреблении в два с половиной раза быстрее Bay Trail.
Сравнение Core M (Broadwell-Y) с Atom (Bay Trail) может показаться несправедливым. С точки зрения это действительно так: процессор Core M сам по себе стоит примерно $300, а за такие деньги можно купить целый планшет на базе Atom – например, Dell Venue 8 Pro. Ожидается, что стоимость планшетов или трансформеров на базе Core M будет приближаться к $1000. Кроме того, максимальный объём оперативной памяти платформы Bay Trail ограничен 2 Гбайт, протестированный же Core M оснащается 4 Гбайт ОЗУ, и вполне возможно, что данный фактор мог в значительной степени сказаться на результатах.
Однако с точки зрения функциональности сравнение этих двух процессоров имеет свою логику, ведь в планшетах x86 под Windows толщиной менее 8 мм из-за ограниченного пространства внутри корпуса Haswell-Y не может быть полноценным конкурентом. Чипы Atom на базе Bay Trail – это лучшее, что было до Core M в этом сегменте, и прирост производительности, который демонстрирует Broadwell-Y в тонких и лёгких планшетах, просто поразителен. В этом классе планшетов лидирующую позицию по производительности занимал Apple iPad, но, похоже, с появлением Core M ситуация вполне может измениться.
Говоря про iPad, хочется отметить, что прототип планшета Llama Mountain от Intel с экраном диагональю 12,5 дюйма и весом 685 г напомнил нам знаменитый планшет из Купертино, только экран у образца Intel побольше.
Intel представила три демонстрационных модели: одну в алюминиевом корпусе, одну из позолоченного алюминия и одну с медным покрытием. Эти прототипы использовались для тестирования теплового пакета Core M, и, по словам представителей компании, новые процессоры Broadwell-Y способны сохранять приемлемую температуру во всех трёх версиях корпуса. В тестах производительности разницы между ними мы не заметили.
При обсуждении вопроса тепловыделения, Intel упомянула, что OEM-производители получат возможность настраивать TDP всех процессоров Core M на трёх уровнях: 3 Вт, 4,5 Вт или 6 Вт. Таким образом, производители смогут адаптировать продукты под конкретные сценарии использования. Например, TDP топового Core M 5Y70 можно установить на значение 3 Вт, чтобы максимально увеличить время автономной работы платформы. С другой стороны, в корпусе с активным охлаждением можно установить TDP 6 Вт для повышения отзывчивости устройства (следует пояснить, что решение в режиме 6 Вт не обязательно требует наличия вентилятора, с ним сможет справиться и более толстый корпус, более эффективно рассеивающий тепло).
Хотя мы приветствуем разнообразие, должны предупредить, что теперь модельный номер процессора не гарантирует установленный уровень производительности. Core M-5Y70 в режиме TDP 3 Вт определённо будет медленнее, чем аналогичный процессор с тепловым пакетом, повышенным до 6 Вт. Кроме того, более дешёвый Core M-5Y10 с TDP 6 Вт почти наверняка обгонит топовый Core M-5Y70 в режиме 3 Вт.
Intel даёт веские основания предполагать, что OEM-производители будут применять к новым процессорам те значения TDP, которые выгодны с маркетинговой точки зрения. Возможно, это и так, но дело в том, что с появлением новых процессоров Core M конкретные модели планшетов или устройств-трансформеров могут работать быстрее или медленнее в зависимости от решения производителя, а не только характееристик выбранного им процессора. В будущем между двумя устройствами с процессорами одной модели разница в производительности и функциональность может быть очень значительна.
На изображении выше, вы можете увидеть, насколько мала в размерах платформа Llama Mountain. Даже при подключённой дочерней платой на удивление компактная комбинация двух PCB весит чуть больше 90 грамм.
Помимо показателей тестов, нам на практике
Тесты производительности в реальных приложениях соответствую показателям синтетических бенчмарков, то есть заметную разницу в производительности между Atom и Core M. В будущем мы хотим протестировать новый процессор Intel и процессоры Haswell-Y с тепловым пакетом 11,5 Вт. Любопытно, сможет ли он догнать или даже обогнать предшественника, у которого TDP два раза выше.
Также нам
Intel заявляет, что причина того, что их четырёхъядерный Atom обгоняет восьмиядерный A9 заключается в преимуществе решения Intel в плане количества инструкций, выполняемых за такт, а также в ограничениях ОС Android касательно эффективного распараллеливания задач.
Обратите внимание, что планшетом на базе Moorefield является модель Dell Venue 8 7000, которая была анонсирована на выставке IDF и оснащается двухкамерной системой Intel RealSense. Благодаря новому железу, планшет Dell получил интересные функции, например измерение размеров объектов на изображении. Все возможности Venue 8 7000 пока не известны, однако в теории двухкамерная система осуществлять трёхмерную съёмку.