Radeon HD 7970: переход на 28-нм техпроцесс
В начале декабря мы не рассчитывали, что видеокарта нового поколения окажется у нас до наступления 2012 года. Даже в середине месяца, после того как мы получили официальное уведомление от AMD, мы планировали выпустить данный обзор в январе. Windows 8 и API DirectX 11.1, идущий в компании с новой ОС, не будут доступны в течении ближайших нескольких месяцев, а нынешние графические карты класса high-end отлично справляются с современными играми. Несмотря на то, что AMD, по слухам, ещё несколько месяцев назад прекратил выпуск флагманской модели
Однако AMD, в конце концов, назначила дату анонса на середину декабря, что нас удивило ещё более. Вот как прозвучала официальная версия AMD: "Собрав отзывы от наших партнёров и оценив нашу общую готовность… мы убеждены, что новая дата анонса позволит нам захватить сезон рождественских праздников и CES". Попытка захватить рождественский сезон, анонсировав карту за пару суток до католического Рождества - крайне оптимистичная стратегия, особенно если учесть, что первые официальные поставки начнутся после 9 января. Печальным результатом всего этого стало то, что многие сотрудничающие с AMD разработчики не успели подготовить соответствующие обновления ПО, нужные хотя бы для того, чтобы надлежащим образом протестировать HD 7970.
Встречаем Radeon HD 7970
Независимо от того, готова ли Radeon HD 7970 встретить мир и готов ли мир встретить её, она попала в лабораторию
Компания AMD использует новую архитектуру Southern Islands и обеспечила поддержку новых функций и технологий, включая совместимость с DirectX 11.1. Флагманский GPU Tahiti (Таити) состоит из 4,31 миллиардов транзисторов и, таким образом, примерно на 160% по данному параметру превосходит своего предшественника на ядре Cayman.
Одновременно компания AMD осуществила переход на техпроцесс 28 нм, что позволило втиснуть такое количество транзисторов в кремниевую пластинку площадью 365 мм² - чип Cayman занимает даже большую площадь (389 мм2).
Прежде чем углубиться в тонкости Southern Islands, давайте поближе взглянем на основные спецификации Radeon HD 7970 по сравнению с предшественниками и конкурентом.
Radeon HD 7970 | Radeon HD 6970 | Radeon HD 6990 | GeForce GTX 580 | |
Потоковых процессоров | 2048 | 1536 | 3072 | 512 |
Блоков текстур | 128 | 96 | 192 | 64 |
Блоков растеризации Color ROP | 32 | 32 | 64 | 48 |
Частота шейдерных блоков | 925 МГц | 880 МГц | 830 МГц | 772 (1544) МГц |
Скорость фильтрации текстур | 118.4 ГТекс/с | 84.5 ГТекс/с | 159.4 ГТекс/с | 49.4 ГТекс/с |
Частота памяти | 1375 МГц | 1375 МГц | 1250 МГц | 1002 МГц |
Шина памяти | 384-битная | 256-битная | 2x256-битная | 384-битная |
Пропускная способность шины памяти | 264 Гбит/с | 160 Гбит/с | 160 Гбит/с | 192.4 Гбит/с |
Графическая память | 3 Гбайт GDDR5 | 2 Гбайт GDDR5 | 2 Гбайт GDDR5 | 1.5-3 Гбайт GDDR5 |
Площадь чипа | 365 мм² | 389 мм² | 2x389 мм² | 520 мм² |
Число транзисторов (млрд) | 4.31 | 2.64 | 5.28 | 3 |
Техпроцесс | 28 нм | 40 нм | 40 нм | 40 нм |
Разъёмы питания | 1x8-pin, 1x6-pin | 1x8-pin, 1x6-pin | 2x8-pin | 1x8-pin, 1x6-pin |
Максимальная мощность (TDP) | 250 Вт | 250 Вт | 375 Вт | 244 Вт |
Цена | Рекомендованная цена $549 | Цена на сайте Newegg.com $340-$380 | $700-$750 (средняя цена на момент окончания продаж) | $500-$530 (версия 1,5 Гбайт) $590-$730 (версия 3 Гбайт) |
По сравнению с Radeon HD 6970, новинка имеет явные преимущества: на треть увеличилось количество потоковых процессоров и блоков обработки текстур, пропускная способность памяти возросла на 65% благодаря использованию 384-разрядной шины памяти. Лишь два ряда спецификаций моделей Radeon HD 7970 и HD 6970 совпадают: число блоков растеризации Color ROP и TDP 250 Вт.
Основываясь на этих спецификациях (и том факте, что новая карта будет стоить около $550), мы можем предположить, что Radeon HD 7970 превзойдёт 6970, немного опередит
Вначале расскажем о том, что нам известно о серии Radeon HD 7000. Несмотря на слухи об обратном, все 28-нм GPU в линейке Radeon 7000, ранее носившие кодовое название Southern Islands, основаны на архитектуре Graphics Core Next. Она включает серию Radeon HD 7700 (ядро Cape Verde), 7800 (Pitcairn) и 7900 (Tahiti). Кроме того, AMD может включить в новую 7000-ю линейку некоторые продукты на 40-нм чипах, используя ребрендинг старых моделей, в которых используется нынешняя архитектура VLIW4/5.
Реализованные на основе новой архитектуры модели имеют одинаковую функциональность, что является хорошей новостью. На следующем рисунке представлено положение новых карт в линейке относительно серии Radeon HD 6000.
Как вы сможете убедиться по нашим тестам, серия Radeon HD 7900 позиционируется как производительная игровая однопроцессорная карта, приближающаяся по производительности к нынешнему двухпроцессорному флагману - HD 6990. В первом квартале 2012 года должна быть представлена и замена HD 6990 - флагманская модель 7000-й серии, основанная на двух GPU Tahiti, призванная занять верхнее положение в "пищевой цепочке" Radeon.
Теперь мы знаем, какое положение в линейке займут представители серии Radeon HD 7000 в соответствии с планами маркетингового отдела компании AMD. Далее мы подробно остановимся на уникальных особенностях новой линейки, однако начнём с основного вопроса - что представляет собой архитектура Southern Islands?
Graphics Core Next и архитектура Southern Islands
Radeon HD 7970 является первым коммерческим продуктом на архитектуре Graphics Core Next, но дизайн новых GPU сам по себе не является секретом. Чтобы дать разработчикам ПО возможность лучше изучить особенности будущего железа, компания AMD раскрыла особенности архитектуры Graphics Core Next на конференции AMD Fusion’11 Developer Summit, проходившей с 13 по 16 июня в американском городе Белвью.
По словам Эрика Демерса (Eric Demers), технического директора подразделения графических продуктов AMD, ныне существующая архитектура VLIW, берущая начало с линейки Radeon 2000, всё ещё имеет потенциал для построения мощных графических карт. Но она ограничена с точки зрения функциональности. Вместо того, чтобы поддерживать жизнь старой архитектуры, AMD выбрала другой путь - вложиться в разработку полностью новой архитектуры. На первом плане для карт класса hi-end находится поддержка новейших игр и качество изображения. Чтобы соответствовать этой установке, AMD отказалась от дальнейшей работы над архитектурой VLIW (Very Long Instruction Word - "очень длинная машинная команда") в пользу новой Graphics Core Next.
Преимущество в эффективности архитектуры Graphics Core Next
Архитектура VLIW весьма эффективна при обработке графических инструкций. Её компилятор оптимизирован для разметки скалярных математических преобразований, которые лежат в основе вычислений 3D-графики. Слабость VLIW проявляется тогда, когда GPU должен составлять очередь заданий со скалярными инструкциями в приложениях общего назначения.
Иногда происходит так, что набор инструкций, называющийся пакет инструкций (wavefront - "фронт инструкций"), не может выполняться до тех пор, пока производятся вычисления над другим аналогичным набором. Это называется "зависимостями". Проблема в том, что компилятор не может изменить порядок исполнения пакета инструкций после того, как определена очередь заданий. Поэтому драгоценный потенциал ALU часто растрачивается впустую, когда инструкции ожидают своей очереди и не выполнены зависимости, которые к ним относятся.
Перед вами - теоретический пример того, как движок SIMD в архитектуре VLIW4 карты Radeon HD 6970 и его 16 банков шейдерных процессоров (каждый такой процессор имеет по четыре ALU, что даёт в сумме 64 ALU на движок SIMD) обрабатывает пакет инструкций, который включает в себя зависимости.
Пока свободными остаются три ALU, следующий пакет простаивает в очереди. Как видим, налицо неэффективное использование вычислительных ресурсов, обусловленное излишне простой логикой обработки инструкций в устаревшей архитектуре.
Как оптимизировать множество скалярных операций, которые выполняются за такт? Нужно ввести блок вычислений - Copmute Unit или CU, который заменит традиционные для AMD движки SIMD.
Каждый CU имеет по четыре блока векторных операций (Vector Units или VU), которые, в свою очередь, включают по 16 ALU, что даёт в сумме 64 ALU на один блок вычислений. Таким образом, число ALU в блоке вычислений (CU) точно такое же, как в движке SIMD. Разница в том, что в отличие от шейдерных процессоров в движке SIMD, каждый из четырёх блоков векторных операций, входящих в Copmute Unit, может иметь независимую очередь задач. CU имеет собственный планировщик очереди, что позволяет свободным VU работать с новыми пакетами инструкций, исключая "бутылочное горлышко" при обработке зависимостей. Это ключевое отличие новой архитектуры, благодаря которому каждый VU может работать с новыми пакетами инструкций, даже если присутствует очередь зависимостей.
В нашем примере одна и та же очередь инструкций может исполняться за шесть тактов на архитектуре VLIW4, но за четыре такта на Graphics Core Next. AMD предполагает, что Radeon HD 7970 может достигнуть 7,5-кратного увеличения пиковой теоретической производительности относительно Radeon HD 6970 благодаря более эффективному использованию вычислительных ресурсов.
Разница в реальных приложениях зависит от эффективности компилятора программного кода. В некоторых вычислительных задачах Radeon HD 7970 будет лучше исключительно за счёт большего числа ALU и более высоких частот ядра и памяти. В ходе тестирования новинки мы видели много вариаций, их увидите и вы. Но, основываясь на результатах синтетических бенчмарков, можно с уверенностью утверждать, что вычислительный потенциал Graphics Core Next превосходит VLIW4.