Введение
Изначально мы хотели назвать статью "ATI Radeon HD 5870: учимся на ошибках nVidia". Впрочем, это было бы несколько некорректно. Но позвольте пояснить, почему возникла такая мысль. Когда nVidia представляла видеокарты
Каким же ударом оказался
В общем, AMD, похоже, усвоила урок или два от "зелёной" компании. Поэтому AMD объявила свою флагманскую видеокарту по цене $400, а вторая по производительности модель на том же дизайне поступит в продажу за $259. Конечно, цену нельзя назвать низкой, но две видеокарты позиционируются как "убийцы" GeForce GTX 295 и GeForce GTX 285. Могут ли новинки опустить цены на самые быстрые видеокарты nVidia?
![]() |
Они начинают нас пугать
На брифинге ATI Radeon HD 5870, который проводился внутри списанного авианосца U.S.S. Hornet, смешалась как обычная, так и техническая пресса. Поэтому когда началась презентация, и компания начала рассказывать о том, что пользователь покупает видеокарту на основе своего положительного опыта, мы начали переживать, что дальше мы услышим о 3D-играх, которые на новых видеокартах, наконец, пойдут уже достаточно быстро. Однако суть оказалось в том, что обычных пользователей мало интересуют мегагерцы, блоки шейдеров или объём памяти; им нужны плавные игры, простое перекодирование и безупречное воспроизведение Blu-ray. Будем надеяться, что вы относитесь к энтузиастам, кому интересно услышать о Cypress, более двух миллиардах транзисторов и 40-нм техпроцессе. Мы надеемся, что движок внутри Radeon HD 5870 вам достаточно интересен, чтобы с ним подробно ознакомиться.
![]() |
К счастью, после первоначального доклада AMD перешла к более технической части презентации линейки GPU Evergreen: мы узнали много подробностей о дизайне чипов, начиная с Hemlock с двумя GPU, затем Juniper для массового рынка, заканчивая Redwood и Cedar начального уровня, которые должны выйти в 2010 году.
Мы также смогли получить немало информации о DirectX 11, Windows 7, Stream Computing, технологии ATI Eyefinity, энергопотреблении, воспроизведении видео и, конечно, производительности. Вам предстоит узнать немало информации, и начнём мы с GPU Cypress, которое является "сердцем" двух новых видеокарт.
Cypress в подробностях
AMD гордится тем, что попадает в "золотую середину". Сначала это случилось в прошлом году, когда AMD представила GPU, укрепившийся на производительном сегменте. Затем компания смогла сделать из него двухпроцессорное решение, отобрав корону производительности. После этого "золотая середина" позволила взять прежние принципы дизайна и представить варианты для массового рынка по цене около $100.
Принцип "золотой середины" сыграл на руку AMD, будучи опробованным вместе с выпуском RV770. Конечно, если обратиться к истории, то можно сделать картину более полной: видеокарта Radeon HD 4870 обеспечила прекрасное соотношение производительность/цена, модель Radeon HD 4870 X2 стала топовой видеокартой для рождественского/новогоднего сезона 2008 года, а линейки Radeon HD 4600 и 4500 смогли достойно конкурировать с предложениями nVidia для массового рынка, которые до этого были привлекательнее, чем старые видеокарты на основе линейки Radeon HD 3800.
Данный подход, конечно, противоречит стратегии nVidia, которая пока ещё не получила название, но мы можем обозначить её как "либо всё, либо ничего". Как известно, GT200 оказалась "монстром" с 1,4 млрд. транзисторов и площадью кристалла 576 квадратных миллиметров на 65-нм техпроцессе. nVidia так и не упомянула размеры при переходе на 55-нм техпроцесс с чипом GT200b. Впрочем, неофициально мы видели что-то около 490 квадратных миллиметров. Даже на 40-нм техпроцессе чипы следующего поколения nVidia наверняка будут крупнее, чем нынешний 55-нм флагман, то есть можно ожидать следующего "монстра".
Насколько золотая середина?
![]() |
Кстати, слайд, посвящённый подходу "золотая середина" с GPU Evergreen, очень напоминает прошлогодний.
Первый (и самый сложный) чип Evergreen с кодовым названием Cypress будет позиционироваться на сегмент $300-$400. AMD планирует представить дизайн Hemlock на паре подобных GPU ближе к концу года. И хотя мы слышали об ограничениях по энергопотреблению, которые заставят снизить частоты дизайна Hemlock, AMD утверждает, что чётко регламентирует всё, начиная от списка материалов и заканчивая BIOS видеокарты к её выходу. Juniper также появится в четвёртом квартале 2009 года для ценового сегмента $199, а Redwood и Cedar будут представлены в следующем году, они позволят привнести поддержку DirectX 11 в компьютеры пользователей по цене меньше $100.
AMD впервые протестировала новый техпроцесс TSMC в апреле с
Прошло пять месяцев, и с этими проблемами, скорее всего, уже покончено, поскольку Cypress производится по такому же 40-нм техпроцессу. Это, кстати, неплохо, так как 40-нм фотолитография крайне желательна для столь большого числа транзисторов - 2,15 млрд. Не менее впечатляет и то, что сложный дизайн Cypress упакован на кристалле площадью 334 квадратных миллиметра. Конечно, это несколько крупнее, чем 263 квадратных миллиметра у RV770, но новинка у AMD по-прежнему существенно меньше, чем кристалл GT200b на 55 нм. В этом и заключается преимущество более совершенного техпроцесса. У AMD теперь производится самый сложный GPU в мире с 2,1 млрд. транзисторов, при этом он меньше по площади своего принципиального конкурента с 1,4 млрд.
Cypress содержит больше, чем в два раза транзисторов по сравнению с предшественником - у него было 956 миллионов. Что же сделала AMD, чтобы новейшее поколение оказалось настолько более сложным?
Ставим цели
AMD утверждает, что при разработке нового дизайна было поставлено пять целей. Первая в списке - добавление поддержки DirectX 11, чтобы видеокарта сопровождала выход операционной системы Windows 7. Действительно, лучше момент подобрать было сложно, так как операционная система Microsoft следующего поколения уже находится в готовом состоянии RTM и вскоре поступит на прилавки магазинов.
Во-вторых, AMD желала улучшить производительность игр DirectX 9, 10 и 10.1. Поскольку игры под DirectX 11 ещё не выходят на рынок, компания знает, что в течении многих месяцев после анонса производительность видеокарты будут оценивать по "наследственным" старым тестам и играм.
В-третьих, компания решила серьёзно улучшить поддержку потоковых вычислений. В этой сфере доминировала архитектура nVidia CUDA сразу же после своего старта. Поскольку OpenCL 1.0 и DirectCompute теперь становятся стандартом у разработчиков в деле поддержки GPGPU, AMD представился первый шанс достойно выйти вперёд.
В-четвёртых, компания нацелилась удвоить производительность предыдущего поколения, оставшись в пределах прежнего теплового пакета. По собственным измерениям AMD, цели достичь удалось. Хотя на этот раз максимальный тепловой пакет (TDP) всё же выше, энергопотребление в режиме бездействия существенно ниже.
Наконец, разработчики AMD добавили "изюминку" в виде дополнительных конфигураций подключаемых дисплеев к Cypress и некоторых функций улучшения качества картинки.
Как удалось удвоить производительность?
Наверное, самым простым способом для удвоения вычислительной мощности GPU будет увеличение в два раза числа ресурсов, влияющих на производительность. В итоге мы получили скорость вычислений 2,7 TeraFLOPS с одинарной точностью и 544 GigaFLOPS с двойной точностью.
Radeon HD 5870 | Radeon HD 4870 | |
Площадь кристалла | 334 мм² | 263 мм² |
Число транзисторов | 2,15 млрд. | 0,956 млрд. |
Пропускная способность памяти | 153 Гбайт/с | 115 Гбайт/с |
AA Resolve | 128 | 64 |
Z/Stencil | 128 | 64 |
Текстурные блоки | 80 | 40 |
Блоки шейдеров/ потоковые ядра/ АЛУ | 1600 | 800 |
Энергопотребление платы в режиме бездействия | 27 Вт | 90 Вт |
Энергопотребление платы при активной нагрузке | 188 Вт | 160 Вт |
Если у RV770 присутствовало 10 массивов SIMD, то у Cypress их уже 20. Как и раньше, каждое ядро содержит 16 потоковых процессоров. И каждый потоковый процессор содержит пять АЛУ, которые AMD называет потоковыми ядрами. Умножьте эти числа, после чего вы получите 1600 потоковых ядер или блоков шейдеров. Тысяча шестьсот блоков шейдеров на 850 МГц как раз дают вычислительную мощность 2,7 TFLOPS в идеальных условиях.
![]() |
Как и у предыдущего поколения, текстурные блоки привязаны к массивам SIMD - по четыре на массив. Поскольку массивов насчитывается 20, мы получаем 80 текстурных блоков в сумме. Конечно же, у RV770 этих блоков присутствовало 40.
Хотя конечные части конвейеров рендеринга у Cypress выглядят очень похоже на предыдущее поколение, они были существенно улучшены. Данная часть конвейера вызывала опасения, когда AMD впервые объявила архитектуру RV770. Но память GDDR5 помогла сгладить эффекты перехода на 256-битную шину памяти. Более того, улучшения производительности сглаживания и скорости Z/stencil показали, что AMD немало исправила того, что было не очень хорошо реализовано в RV670.