GPU AMD 2016 | Введение
AMD представила архитектуру GCN в конце 2011 года, тогда Radeon HD 7970 конкурировала с Nvidia GeForce GTX 580 на архитектуре Fermi. С тех пор ее конкурент успел перейти на Kepler и Maxwell, значительно повысив показатель производительности на ватт мощности по сравнению с предыдущими моделями.
И все же AMD продолжает удерживать позиции в плане абсолютной производительности. Видеокарта Radeon R9 Fury X даже обогнала своего главного соперника в лице GeForce GTX 980 Ti в большинстве тестов при разрешении 3840×2160 пикселей. Но после выхода Radeon R9 380x в ноябре прошлого года, в котором в очередной раз использовался прошедший ребрендинг GPU, AMD уже знала, что для того чтобы выдержать конкуренцию и освежить портфолио моделей, нужно нечто большее, чем устаревшая технология по выгодной цене.
В компании возлагают надежды на микроархитектуру Polaris, что переводиться как Полярная звезда (под термином “архитектура” компания теперь подразумевает не только графический процессор, но и весь SoC с его подсистемами).
Появление новых продуктов запланировано на середину 2016 года, и вряд ли стоит ожидать прибытия Polaris раньше срока. Начало официальных продаж гарнитуры Oculus Rift ожидается в первом квартале 2016 года, и для полноценного опыта виртуальной реальности разработчик рекомендует как минимум Radeon R9 290, то есть этому уровню соответствуют всего несколько видеокарт AMD и Nvidia. Любой графический процессор, который сможет дать аналогичную или более высокую частоту кадров за меньшие деньги будет привлекать внимание. Версия Polaris для энтузиастов должна сделать и то и другое, и при этом заметно повысить производительность на ватт.
Недавно мы рассмотрели планы AMD по улучшению контроллера дисплея в Polaris, включая внедрение поддержки HDMI 2.0a и DisplayPort 1.3, наряду с фундаментальной работой над использованием технологии HDR в играх, фотографиях и воспроизведении видео. Производитель поделился стратегией компании (англ.) в области расширения доступа к инструментам с открытым исходным кодом, эффектам и библиотекам через новый портал GPUOpen, а также рассказал об активизации усилий в области HPC с помощью инициативы Boltzmann.
GPU AMD 2016 | Подробнее об архитектуре
Сегодня мы более подробно рассмотрим саму архитектуру. Самым впечатляющим, пожалуй, является то факт, что Polaris использует IP Graphics Core Next четвертого поколения, который за стенами AMD может получить название “GCN 1.3”.
Этот факт может разочаровать энтузиастов, которые надеялись увидеть совершенно новый подход к повышению эффективности, учитывая конкурентную среду. Тем не менее, инженеры предусмотрели ряд конструктивных улучшений, направленных конкретно на повышение производительности на ватт потребляемой мощности. Компания пока не выкладывала подробности, но заявила об обновленном блоке primitive discard accelerator, настроенном аппаратном планировщике, улучшенных алгоритмах предварительной выборки инструкций, повышенной эффективности шейдеров и сжатия данных – все эти области архитектуры, по данным AMD, подверглись пересмотру. По словам первого вице-президента и ведущего инженера по микроархитектуре AMD Раджи Кодури (Raja Koduri), все эти элементы в совокупности, наряду с новым скачком в производственном процессе, который мы сейчас тоже обсудим, обеспечат самый большой прирост производительности на ватт в истории компании (включая ATI).
AMD также не особо распространяется на счет блока работы с мультимедиа контентом, указанном в правой части слайда, но говорит, что Polaris будет использовать декодирование H.265 с аппаратным ускорением в разрешении до 4K с поддержкой профиля Main 10. Последнее означает, что декодер графического процессора поддерживает выборку по 8 и 10 бит – это важнейшая ступень на пути достижения цветового пространства Rec. 2020. На текущей момент нам известно, что Polaris не включает вторую или третью версию стандарта H.265, которые были утверждены в 2014 и 2015 годах соответственно. Кодирование H.265 должно выполняться в режиме 4K 60 кадров/с, хотя мы не знаем, будет ли оно выполняться шейдерами или силами логики с фиксированной функцией.
GPU AMD 2016 | FinFET: больше железа на меньшей площади
Хотя архитекторы AMD без сомнения приложили руку к повышению эффективности Polaris, можно предположить, что переход с техпроцесса TSMC 28 нм на FinFET 14 нм (GlobalFoundries)/16 нм (TSMC) даст еще большую выгоду.
Идея неплоских транзисторов читателям Tom’s Hardware не нова, мы уже знакомились с похожими трехзатворными транзисторами Intеl в 2012 году, они служили строительными блоками для 22-нанометровой архитектуры Ivy Bridge. В то время мы знали, что конкуренты еще несколько лет будут разрабатывать эквивалентные технологии, но даже в AMD не рассчитывали так долго сидеть на техпроцессе 28 нм. Но теперь компания планирует использовать преимущества технологии – более быстрые транзисторы единой структуры с пониженными токами утечки, которые, как следствие, подвержены меньшим вариациям.
Джо Макри (Joe Macri) из AMD проиллюстрировал реальные преимущества FinFET по сравнению с планарным 28 нм техпроцессом на графике выше. Нелинейная ось Y представляет ток утечки транзистора, а ось X производительность. В двух этих “облаках” показаны характеристики транзистора начиная с пониженной утечки и пониженной производительности (левый нижний угол) и заканчивая более высокой утечкой и высокой производительностью (верхний правый угол). Учитывая, что показатели FinFET находятся справа от техпроцесса 28 нм, можно сделать вывод, что при любой утечке производительность будет выше. Макри определил преимущество в скорости по сравнению с 28 нм около 20-35%.
Теперь обратите внимание, что облака не одинакового размера. Узкий овал FinFET свидетельствует о меньшей вариативности. Такое поведение связано с методом травления ребер. Вместо использования транзисторов разной ширины, что проблематично, когда под понятием “ширина” подразумевается высота ребра, они создаются одинаковыми и ложатся параллельно. В результате достигается более последовательный биннинг.
При сравнении техпроцесса 14/16 нм FinFET с планарным 28 нм техпроцессом для данного продукта мы имеем две кривые производительности к мощности. Они отражают новые возможности для AMD: более мощные настольные графические процессоры при современных стандартах потребляемой мощности, существующие уровни производительности для компактных форм-факторов, тонкие и легкие ноутбуки с дискретной графикой и так далее. Естественно Nvidia тоже имеет доступ к этому технологическому процессу, так что пока неизвестно, у кого будет преимущество через полгода.
GPU AMD 2016 | Уже работает
Хотя до ожидаемого начала поставок еще полгода, AMD решила удивить посетителей своего саммита RTG в городе Сонома в Калифорнии, продемонстрировав работу тестового образца GPU Polaris, изготовленного менее двух месяцев назад, на примере игры Star Wars Battlefront. Такой сюрприз может говорить о преимуществе компании по времени. Но это будет не настольная видеокарта. Скорее всего, AMD планирует оснащать компактные ноутбуки графическим процессором, способным обрабатывать игры в разрешении 1920×1080 на скорости 60 FPS. Ранее такой уровень производительности был не досягаем для ноутбуков данного формата.
В показанной демонстрации на средних настройках графики AMD использовала отметку в 60 FPS в качестве стандарта и сравнила энергопотребление двух платформ на базе процессора Core i7-4790K – одна с Polaris, другая с настольной видеокартой GeForce GTX Nvidia 950. Система с картой AMD в среднем потребляла 86 Вт, в то время как другой ПК приблизился к 140 Вт. Тепловой пакет GTX 950 составляет 90 Вт, и в наших тестах мы видели близкие показатели. Если вычесть 90 из 140, то получится, что энергопотребление системы составляет около 50 Вт.
Ничего не было сказано о количестве шейдерных ядер, тактовых частотах и видеопамяти, но мы узнали, что для целевого рынка этого чипа AMD по-прежнему использует память GDDR5, и что сам GPU был изготовлен по 14-нанометровому техпроцессу GlobalFoundries.
GPU AMD 2016 | Полярная звезда выглядит яркой даже издалека
Мы относимся к Polaris с осторожным оптимизмом. В том, что первые тестовые образцы ориентированы на рынок мобильных систем, есть логика, учитывая возможность вернуть утраченную долю рынка, выпустив хорошее железо раньше конкурентов. И хотя в своей демонстрации компания выбрала процессор, предназначенный для тонких и легких ноутбуков в надежде заинтересовать своих OEM- клиентов еще на этапе проектирования, представители AMD признались, что готовят “старшую” версию чипа ближе к дате премьеры первых графических процессоров, которая, предположительно, будет предназначена для энтузиастов. Кадури уклончиво отвечал на конкретные вопросы о HBM и Polaris, но подтвердил свою приверженность прогрессу технологии и обещал поделиться деталями «дорожной карты» в ближайшем будущем.
Это будет еще относительно не скоро, и нет сомнений, что Nvidia работает над собственной архитектурой на базе техпроцесса FinFET. Нам еще предстоит выяснить, сможет ли усовершенствованная версия GCN выдержать конкуренцию в плане абсолютной производительности и производительности на ватт потребляемой мощности. В любом случае, мы почти уверены, что следующее поколение GPU от AMD сможет предложить значительный шаг вперед по сравнению с существующими продуктами.