РЕКЛАМА
ИНФОРМАЦИЯ
ПОЛЕЗНЫЕ ССЫЛКИ
Выбираем игровой CPU: август 2010

AMD Phenom II X6 1090T и платформа 890FX: встречаем Leo

Rambler's Top100 Рейтинг@Mail.ru

ПРОЦЕССОРЫ

AMD Bulldozer и Bobcat: архитектуры нового поколения
Краткое содержание статьи: AMD приоткрыла завесу тайны над архитектурами Bulldozer и Bobcat, выход которых планируется на 2011 год. Напомним, что перед нами самое серьёзное изменение дизайна процессоров после 2003 года. Сможет ли AMD догнать Intel или даже отобрать звание лидера рынка по производительности? В нашей статье мы поделимся доступной на сегодня информацией о грядущих архитектурах. Будущее обещает быть весьма интересным.

AMD Bulldozer и Bobcat: архитектуры нового поколения


Редакция THG,  27 августа 2010
Страница: Назад  1 2 Далее


Готовы к Bulldozer и Bobcat?

После выхода микроархитектуры AMD "Hammer" прошло уже семь лет, а три года назад архитектура получила обновление в виде K10. В момент же своего появления новые процессоры Athlon 64 на основе архитектуры K8 прославились тем, что смогли обойти процессоры Intel Pentium 4 и стали фаворитом среди энтузиастов.

Но ситуация на рынке производительности меняется довольно быстро, а Intel известна своими стремительными возвращениями, стоит компании оказаться на втором месте Микроархитектура Core изменила расстановку сил в пользу Intel в 2006 году, компания удерживала лидирующую позицию все последующие четыре года.

Конечно, AMD продаёт привлекательные процессоры. Линейка Athlon II постоянно присутствует в наших ежемесячных рекомендациях по выбору лучшего CPU для геймера за свои деньги благодаря приличной производительности и невысоким ценам. Двуядерный Phenom II X2 555 Black Edition просто непобедим по цене дешевле $100. Да и процессоры на основе дизайна AMD Thuban предлагают шесть ядер по цене ниже $200.

AMD

Bulldozer. Нажмите на картинку для увеличения.

Но если оценивать производительность в расчёте на такт, то вряд ли кто-то будет спорить, что процессоры AMD отстают от Intel. У Intel, как обычно, в преимуществах лидерство по техпроцессу, поскольку новые процессоры производятся по технологии 32 нм. Между тем AMD пришлось умещать шестиядерный процессор в 130-Вт тепловом пакете, используя 45-нм техпроцесс.

AMD надеется, что дизайну K10 не придётся сдерживать микроархитектуру Intel Westmere долгое время. В прошлом году во время Financial Analyst Days AMD впервые приоткрыла завесу тайны над "модулями", которые определяют дизайн процессоров следующего поколения. Конечно, информация была очень скудной, но представители компании дали чётко понять, что перед нами самое существенное изменение дизайна после K8.

AMD

Bobcat. Нажмите на картинку для увеличения.

Насколько мы знаем, на новой архитектуре выйдут два ядра x86, каждое из которых будет предоставлять конкурентоспособный набор функций для нескольких разных рынков. Bulldozer предназначен для использования в разных ПК, от массовых клиентских (настольные системы и ноутбуки) до серверов. Bobcat позиционируется как более гибкий дизайн, то есть на его основе будут производиться ядра с более экономичным и компактным дизайном для нетбуков и облачных клиентов.

Следует помнить, что, как и в случае других смен поколений, нам следует разобраться в нескольких внутренних названиях. AMD обсуждала чипы Bulldozer и Bobcat только на недавно прошедшей конференции Hot Chips 22 (спонсируемое IEEE мероприятие, посвящённое производительным процессорам). Впрочем, вероятно следует чуть более глубоко окунуться в тему сферы применения упомянутых дизайнов CPU, хотя бы чтобы предотвратить путаницу с кодовыми названиями. Если вы запутаетесь в номенклатуре, то на последней странице статьи приведены планы AMD на 2011 год.

Подробности о Bulldozer

На самом деле большая часть информации, которую выдала AMD на Hot Chips, уже известна, то есть нас не покидало ощущение того, что мы уже где-то видели детали об архитектурах Bulldozer и Bobcat.

Компания явно поставила наиболее сильный акцент на Bulldozer и на его подход к многопоточности. AMD провела чёткую границу между обычной параллельной многопоточностью SMT (simultaneous multi-threading, также продвигается как Intel как Hyper-Threading) и мульти-обработкой на уровне чипа (CMP), которую, например, реализует шестиядерный дизайн Thuban, когда одно ядро работает над одним потоком.

Подход CMP прямолинеен. Вы дублируете физические ядра, чтобы увеличить производительность в многопоточном программном обеспечении. Такой прямой подход даёт наилучшую производительность, но при этом становится весьма накладным для производителей CPU, когда они упираются в пределы техпроцесса, особенно если исполнительные ресурсы будут оставаться незагруженными. Именно поэтому мы часто рекомендуем быстрые четырёхъядерные процессоры по сравнению с медленными шестиядерными для игр. Если ваша нагрузка не оптимизирована должным образом для параллельного выполнения, то CMP приведёт к избыточным вычислительным ресурсам, и более высокая тактовая частота менее сложных двуядерных и четырёхъядерных дизайнов даст более высокую производительность.

Intel пытается обойти эту проблему с технологией Hyper-Threading, которая позволяет каждому физическому ядру выполнять два потока. При этом как раз предполагается избыточность вычислительных ресурсов, то есть дополнительная производительность от каждого ядра как раз достигается за счёт нагрузки потока ниже номинальной. Эту технологию реализовать относительно дёшево. Но она, в свою очередь, даёт весьма ограниченные преимущества. Некоторые нагрузки вообще не получают прироста производительности от Hyper-Threading. Другие едва достигают двузначного прироста производительности в процентах.

AMD

Нажмите на картинку для увеличения.

AMD пытается реализовать третий подход к многопоточности под названием Two Strong Threads ("два сильных потока"). Если Hyper-Threading только дублирует архитектурные состояния, то дизайн Bulldozer использует общие переднюю (fetch/запрос и decode/декодирование) и заднюю (через общий кэш L2) часть ядра, но дублирует целочисленные планировщики и исполнительные конвейеры, то есть каждый из двух потоков получит выделенные для него блоки.

Пара потоков использует общий планировщик для работы с плавающей запятой, с двумя 128-битными исполнительными блоками, поддерживающими умножение и накопление (FMAC, fused multiply-accumulate-capable). Следовательно, здесь явно прослеживается акцент AMD на целочисленную производительность, что имеет смысл с учётом инициативы Fusion компании, когда за обработку чисел с плавающей запятой будет отвечать GPU. Но следует помнить, что первые процессоры на дизайне Bulldozer будут работать самостоятельно. И, несмотря на то, что в данном случае мы получили общие исполнительные ресурсы по работе с числами с плавающей запятой, AMD остаётся уверенной в поддержании должного баланса между выделенными и общими компонентами.

Впрочем, ничего нового в этом нет. AMD говорила об этом ещё в ноябре 2009 года.

До презентации Hot Chips у нас была возможность обновить знания об архитектуре Bulldozer с Диной МакКинни (Dina McKinney), вице-президентом по инженерному проектированию AMD. По словам Дины, подход Two Strong Thread компании позволяет получить около 80% производительности от простого дублирования ядер. В то же время, использование некоторых общих ресурсов позволяет снизить энергопотребление и площадь кристалла.

Подобное совершенствование дизайна вместе с переходом на 32-нм техпроцесс SOI (кремний на диэлектрике) привели к тому, что AMD предполагает 33% увеличение количества ядер и 50% увеличение пропускной способности (что даст намного большее число исполняемых инструкций за такт, IPC) в том же тепловом пакете, что и у процессоров Opteron на дизайне Magny-Cours. Данное предположение базируется на симуляции производительности современной 12-ядерной линейки Opteron 6100 и грядущей 16-ядерной линейки Bulldozer с кодовым названием Interlagos.

AMD

Дублирование вычислительных ресурсов позволило AMD называть этот дизайн двуядерным. Нажмите на картинку для увеличения.

Теперь настало время перейти к одному опасению, которое появилось у меня по поводу систематики AMD: модуль Bulldozer кажется мне одним ядром с поддержкой SMT. Но вместо дублирования регистров для сохранения архитектурного состояния AMD даёт каждому потоку своё окно инструкций и выделенные конвейеры. В нашей беседе с Джоном Фруэх (John Fruehe) из AMD стало понятно, что компания оценивает дублирование целочисленных планировщиков и соответствующих конвейеров (несмотря на другие общие компоненты) в каждом модуле Bulldozer как двуядерный дизайн, то есть отличает его от SMT, который ассоциируется с Hyper-Threading. Это кажется мне маркетинговым ходом, но всё же следует по достоинству оценить, что данная архитектура даст намного большую производительность, чем Hyper-Threading при параллельных нагрузках.

Пока ещё неизвестно, насколько хорошо модули Bulldozer будут взаимодействовать с Windows 7. Intel и Microsoft приложили немало усилий для оптимизации под Hyper-Threading. Планировщик операционной системы понимает разницу между физическим ядром и виртуальным ядром Hyper-Threading. Если нужно распределить два потока, то Windows 7 и Server 2008 R2 используют два физических ядра. Альтернатива - распределение двух потоков на одном и том же физическом ядре с поддержкой Hyper-Threading - явно бы привела к падению производительности. Поскольку модули Bulldozer всё равно используют общие ресурсы, вполне понятно, что процессоры Zambezi с четырьмя модулями лучше всего будут работать, когда два потока будут распределяться по разным модулям. Хотя AMD пока не объяснила, каким образом будет поддерживаться взаимодействие с ОС, представители компании заверили нас, что работают с производителями ОС насчёт оптимизаций, которые будут готовы к выходу Bulldozer.

AMD

Процессор Zambezi, основанный на Bulldozer, может выглядеть так. Нажмите на картинку для увеличения.

Мы также поинтересовались у Джона насчёт возможностей передней части конвейера по работе с инструкциями в расчёте на такт, а также конфигурации общего кэша L2, но все эти детали пока закрыты. Однако с нами поделились информацией о том, что 128-битные блоки работы с плавающей запятой являются симметричными, и на любом такте любое интегрированное ядро может запустить на выполнение 256-битную инструкцию AVX (если программа скомпилирована с учётом поддержки AVX). Либо оба целочисленных ядра могут запустить на выполнение по одной 128-битной инструкции одновременно.

Кроме того, Джон прояснил, как ориентированы конвейеры каждого целочисленного блока. Если у K10 присутствовали три ALU/AGU, то теперь используется два набора по два ALU/AGU. Конфигурация кэша L1 тоже стала немного другой. Если у K10 на ядро мы получали 64 кбайт кэша L1 для инструкций и 64 кбайт L1 для данных, то у Bulldozer используется 16 кбайт кэша L1 для данных на ядро, а также 64 кбайт кэша L1 2-way для инструкций на модуль. Будет интересно посмотреть, как скажется на производительности меньший объём кэша L1.
Страница: Назад  1 2 Далее


СОДЕРЖАНИЕ

Отзывы об AMD Bulldozer и Bobcat в Клубе экспертов THG [ 248 отзывов] Отзывы об AMD Bulldozer и Bobcat в Клубе экспертов THG [ 248 отзывов]


РЕКЛАМА
РЕКОМЕНДУЕМ ПРОЧЕСТЬ!

История мейнфреймов: от Harvard Mark I до System z10 EC
Верите вы или нет, но были времена, когда компьютеры занимали целые комнаты. Сегодня вы работаете за небольшим персональным компьютером, но когда-то о таком можно было только мечтать. Предлагаем окунуться в историю и познакомиться с самыми знаковыми мейнфреймами за последние десятилетия.

Пятнадцать процессоров Intel x86, вошедших в историю
Компания Intel выпустила за годы существования немало процессоров x86, начиная с эпохи расцвета ПК, но не все из них оставили незабываемый след в истории. В нашей первой статье цикла мы рассмотрим пятнадцать наиболее любопытных и памятных процессоров Intel, от 8086 до Core 2 Duo.

ССЫЛКИ
Реклама от YouDo
YouDo: https://youdo.com/lp-remont-utyuga-Bork/: лучшие цены.
По ссылке https://youdo.com/lp-boiler25478/: рекомендуем!