Введение
18-19 июня AMD провела в испанской Малаге презентацию новых видеокарт Radeon HD 4850/4870 для журналистов. Мероприятие открыл вице-президент по продажам и маркетингу AMD в России, странах СНГ, восточной Европы и Турции Пьер Брансвик (Pierre Brunswick), который очень оптимистично смотрел в будущее графических процессоров AMD. Выступили и технические специалисты компании в области графики, специально приглашённые из США. Порадовало и разнообразие партнёров: сразу видно, что AMD относится к ним лучше, чем nVidia, которая в последнее время продаёт сторонним компаниям готовые OEM-дизайны, а производителям ничего не остаётся, как наклеивать собственные стикеры, теряя при этом и прибыль. Ничего не скажешь, поддержка со стороны партнёров – очень сильная сторона AMD.
Симпатичная презентация с “фроглинами” – поиск пути одновременно выполняет несколько тысяч объектов.
Давно AMD и nVidia не представляли архитектур, столь близких друг к другу. Последний раз это случалось в 2004 году, с выходом R420 и NV40, причём обе архитектуры были очень похожи (шесть блоков вершинных шейдеров, 16 пиксельных конвейеров, 16 текстурных блоков и т.д.). С той поры пути двух компаний разделились, однако если технические решения принимались разные, то обе компании оставались привержены монолитному кристаллу GPU – с каждым новым поколением число транзисторов худо-бедно удваивалось, а затем, взяв за основу чипы гигантского размера, производилась полная линейка видеокарт, у которых менялось количество вычислительных блоков.
Space Siege: следующая экшин-RPG от Криса Тейлора. Нажмите на картинку для увеличения.
Вне сомнения вдохновлённая успехом своего графического процессора G80, nVidia решила продолжать подобный подход, о чём мы уже говорили в статье о GT200. ATI, с другой стороны, после покупки AMD испытывала ряд трудностей, в частности связанных с архитектурой R600, которая не работала так, как ожидалось, и создала немало технических проблем для инженеров. А учитывая проблемы на финансовом фронте, AMD было очень трудно конкурировать с nVidia, чьё финансовое положение только укрепилось и позволило продолжать разработку подобных чипов. Поэтому вместо концентрации на чистой производительности, AMD решила уделить внимание двум факторам: производительности на ватт и производительности на квадратный миллиметр кристалла. Насколько успешно?
Линейка Radeon HD 4000
Нельзя сказать, что подобный шаг AMD был ошибочным. Как знают наши читатели, основная доля продаж отнюдь не приходится на видеокарты дороже $500. Напротив, лучше всего продаются карты по цене $300 и ниже. Но шаг всё равно был рискованным. Если производители видеокарт действительно получают максимум прибыли на картах начального и среднего уровней, то карты уровня high-end служат технологическими маяками, флагманами рынка. Намного легче продавать GeForce 8600, когда 8800 является лидером во всех тестах, чем Radeon HD 2600, когда у HD 2900 создалась досадная репутация. Пусть даже качества карт среднего уровня вполне привлекательные. Но перед тем, как мы выскажем опасения насчёт перспектив нового поколения видеокарт AMD, давайте внимательнее рассмотрим архитектуру.
Теоретические спецификации | ||
Видеокарта | HD 4850 | HD 4870 |
Частота GPU | 625 МГц | 750 МГц |
Частота памяти | 993 МГц | 900 МГц |
Число потоковых процессоров (АЛУ) | 800 | 800 |
Число текстурных блоков | 40 | 40 |
Число блоков растровых операций (ROP) | 16 | 16 |
Контроллер памяти | 256 битов (8 каналов по 32 бита) | 256 битов (8 каналов по 32 бита) |
Тип памяти | GDDR3 | GDDR5 |
Новый рекорд! Благодаря 160 5-канальным потоковым процессорам VLIW (800 АЛУ в сумме), RV770 обходит GT200, с её теоретической производительностью 993 Mflops, становясь первым GPU, преодолевшим психологический барьер в 1 Tflop (1 Tflop у HD 4850 и 1,2 Tflops у 4870). Но что больше всего впечатляет, подобные значения были достигнуты на GPU с площадью кристалла всего 260 мм².
Приятные сюрпризы на этом не заканчиваются. AMD смогла выиграть от новой архитектуры, увеличив число текстурных блоков (наконец!). Теперь мы получили 40 текстурных блоков против всего 16 у R420. Пусть даже это далеко до 80 текстурных блоков у nVidia, прирост не может не радовать. Но по существу AMD осталась верна своим принципам: число текстурных блоков увеличилось пропорционально количеству АЛУ. По сравнению с 64 вычислительными блоками у RV670, RV770 имеет 160 – мы получили увеличение вычислительной мощности в 2,5 раза, а 16 текстурных блоков RV670 прекратились в 40 у RV770, во столько же раз. По всей видимости, AMD считает, что соотношение между арифметическими и текстурными инструкциями 4:1, введённое в предыдущей архитектуре, является хорошим балансом. То же самое отношение используется и в новых GPU.
Если вы сравните конкурирующую архитектуру nVidia, то увидите, что, несмотря на перебалансировку новой GT200, RV770 намного легче справляется с большим числом арифметических инструкций. Соотношение вычислительной мощности к числу фильтруемых текселей последнего GPU от AMD составляет 40:1 по сравнению с примерно 20:1 у конкурента. Посмотрим, какова будет разница в наших теоретических тестах. (Примечание: видеокарта Radeon HD 4870 показала бы себя в синтетических тестах, которые мы используем для анализа архитектуры, намного лучше, однако она была недоступна на момент анонса. У нас не было другого выбора, кроме как использовать HD 4850, поэтому и результаты производительности у AMD не такие хорошие, как могли бы быть с HD4870).
Как и в случае с GT200, мы начнём с версии RightMark 3D, использующую только Pixel Shader 2.0. HD4850 обходит GTX 280 по тестам PS2.a и 2.0a, но уже не так легко справляется в тестах PS2.0. В, принципе, легко понять, что RV770 лучше подходит для сложных моделей освещения, однако мы ожидали более высокой производительности и в процедурных шейдерах, где видеокарта могла бы проявить всю свою немалую вычислительную мощность.
Архитектура AMD выигрывает: 800 вычислительных блоков явно себя показывают с лучшей стороны, и несмотря на высокую тактовую частоту, 240 АЛУ у GT200 не могут угнаться. Теперь давайте посмотрим на результаты более новой версии, которая использует более современные шейдеры.
И результаты вновь далеки: 800 АЛУ RV770 оставляют GeForce далеко позади. С другой стороны, когда тест начинает акцентировать больше внимания на текстурных инструкциях…
…RV770 и его 40 текстурных блоков не могут конкурировать с 64 блоками G92 и 80 блоками у GT200. По скорости заполнения сюрпризов тоже не произошло – число ROP не изменилось, оно по-прежнему ограничено 16.
Полученные результаты для всех GPU очень близки к теоретическим значениям (10 800 мегапикселей/с для 9800 GTX, 19 264 для 280 GTX и 24 800 для 3870 X2). Однако GPU 4850 показал любопытные результаты, превзойдя (пусть даже ненамного) теоретическое значение 10 000 мегапикселей/с. Вероятно, это результат небольшого разгона модели Asus, которую мы тестировали (мы ещё к этому вернёмся).
Архитектура в деталях
Подобно nVidia, AMD решила построить графические процессоры на предыдущей архитектуре, а не изобретать новую “с нуля”. Она очень близка к R600, которая уже прошла вторую итерацию в виде RV670.
Ядра SIMD
Архитектура, изначально представленная с Xenos, тем же самым GPU, что используется в Xbox 360, построена на группе SIMD-массивов. У Xenos используется три SIMD-массива, а у R600 и RV670 их четыре. RV770 идёт ещё дальше с десятью массивами.
Как вы наверняка догадались, каждый массив SIMD состоит из 80 АЛУ (потоковых процессоров), поскольку GPU обладает 800 АЛУ. Действительно так, но на самом деле всё несколько сложнее: 80 АЛУ нельзя назвать независимыми друг от друга. Они сгруппированы вместе в пятиканальные блоки VLIW – 16 блоков на SIMD-массив. Подобная организация накладывает некоторые ограничения на выполняемые инструкции; каждая из пяти инструкций блока VLIW должна быть независима от остальных. Поэтому компилятору нужно находить достаточное число независимых инструкций, чтобы нагружать АЛУ – в отличие от G80, где решение более “аппаратное”.
Проиллюстрируем примером.
- I1 FADD R1, R1, 3.14
- I2 FMUL R2, R1, 1.41
- I3 FMAD R3, R0, 0.5, 0.5
В данном случае инструкции 1 и 3 могут обрабатываться в одном блоке VLIW, но не инструкция 2, которая зависит от результатов инструкции 1. Если компилятор не найдёт достаточного числа операций в окне инструкций, ему придётся заполнять свободные места инструкциями NOP, которые ничего не делают, только снижают производительность GPU. Это сводится к тому, что в реальности АЛУ nVidia работают на пиковой производительности чаще, поскольку они меньше зависят от кода. С другой стороны, АЛУ nVidia обходятся существенно “дороже” по числу транзисторов. Производительность блоков VLIW у AMD очень сильно зависит от производительности компилятора (компилятор находится на уровень “глубже” драйвера, который реорганизует инструкции ассемблера, генерируемые HLSL), но AMD может включить на кристалл намного большее число АЛУ, сохранив существенно меньшую площадь.
Блоки VLIW сами по себе не были существенно пересмотрены; внутри их четыре АЛУ могут выполнять инструкции FMAD или целочисленного сложения, а специальное АЛУ может выполнять FMAD или целочисленное умножение, либо трансцендентную функцию (синус, косинус, логарифм, экспонента и т.д.). Единственное реальное улучшение заключается в операциях битового сдвига в целых числах, которые теперь могут выполняться всеми из пяти АЛУ, хотя у 2900/3800 для этой цели требовалось работа специального АЛУ. Вместо того, чтобы сделать АЛУ более мощными, AMD сконцентрировалась на их оптимизации, чтобы снизить их размер на кристалле и упаковать на GPU как можно больше.
Локальные и глобальные данные
Нажмите на картинку для увеличения.
С выходом RV770 инженеры не только оптимизировали архитектуру, ненамного увеличив “бюджет” транзисторов, но и взяли часть идей у конкурента. В G80 появилась небольшая 16-кбайт область памяти на каждый мультипроцессор, которая была отдана полностью под управление программисту, в отличие от кэша. Эта область памяти, доступная приложениям CUDA, позволяет обмениваться данными между потоками. AMD тоже объявила о своей версии памяти у процессора RV770. Она называется Local Data Share и имеет точно такой же размер, как и Shared Memory у конкурента. И роль у неё такая же: обмен данными в приложениях GPGPU между потоками. Однако RV770 идёт немного дальше, предоставляя ещё одну область памяти (тоже 16 кбайт) под название Global Data Share, которая позволяет обмениваться данными уже между SIMD-массивами.
Текстурные блоки
Хотя АЛУ не претерпели существенных модификаций, текстурные блоки были полностью переработаны. Цель очевидна: как и на остальной части GPU, нужно было существенно поднять производительность, сохранив минимально возможную площадь кристалла. Инженеры поставили перед собой решение весьма амбициозных задач, а именно повысить производительность на 70% при той же площади кристалла. Чтобы это сделать, они сфокусировали внимание на текстурном кэше. Пропускная способность текстурного кэша L1 была увеличена до 480 Гбайт/с.
Но это ещё не всё: кэш L1, который является общим для всех массивов SIMD, был разбит на 10 областей, по одной на каждый SIMD-массив, причём каждая область содержит данные эксклюзивно только для соответствующего SIMD-массива. Общие данные теперь хранятся в кэше L2, который был тоже полностью переработан, он получил пропускную способность до кэша L1 384 Гбайт/с. Чтобы снизить задержки, кэш L2 был расположен рядом с контролерами памяти. Давайте посмотрим, к чему привели эти улучшения на практике.
По сравнению с прямым конкурентом 9800 GTX, видеокарта Radeon HD 4850 показала превосходную производительность с одной и двумя текстурами – что можно было ожидать, учитывая 40 текстурных блоков для 16 ROP (проще говоря, “2,5 текстурных блока на пиксель”). С другой стороны, на трёх и четырёх текстурах RV700, вполне логично, не может конкурировать с 64 текстурными блоками G92 (эквивалент “4 текстурных блока на пиксель”), но во всех случаях RV770 оказывается ближе к теоретической производительности, чем конкурент.
ROP
Блоки растровых операций (ROP) были ещё одним слабым местом процессоров AMD предыдущего поколения, учитывая низкую производительность после включения сглаживания. Как и в случае текстурных блоков, инженеры начали “с нуля”, чтобы максимизировать эффективность блоков на площадь кристалла.
Первое улучшение касается Z-рендеринга. AMD добавила возможность удвоить скорость заполнения на проходах глубины в предыдущей архитектуре, однако всё равно уступала nVidia, которая в данной ситуации давала скорость заполнения в восемь раз большую. С выпуском RV770 AMD всё ещё находится позади, увеличив скорость заполнения только в четыре раза – 64 пикселей на такт. Давайте посмотрим результат на проверенном тесте скорости заполнения.
Опять же, результаты чистой пропускной способности не вызывают удивления. С другой стороны, Z-рендеринг несколько разочаровывает. Есть некоторые улучшения, но если RV670 подходит к теоретическому уровню (x1,89 вместо x2), то RV770 весьма от него далёк (x2,41 вместо x4). Впрочем, этого достаточно, чтобы конкурировать с G92, которая тоже далека до теоретического значения (x5,2 вместо x8), но G92 всё же более производительна.
Но это не основное улучшение ROP. Инженеры AMD сфокусировались на улучшении производительности сглаживания, которая было просто катастрофической по сравнению с конкурентами. И если RV670 смогла записывать только 8 пикселей на такт в MSAA 2X или 4X, со скоростью заполнения, разделённой на два, RV770 не получает падение производительности и может по-прежнему записывать 16 пикселей на так в этих ситуациях. Точно так же и рендеринг в кадровом буфере FP16 был оптимизирован, теперь он производится на полной скорости, хотя у RV670 скорость заполнения тоже делилась на два.
Контроллер памяти
После объявления кольцевой шины с R520, AMD продолжала дорабатывать контроллер памяти. Последняя особенность заключается в разделении клиентов, которые требуют большой пропускной способности (таких как текстурный кэш L2 или ROP) от клиентов, которые могут довольствоваться меньшей пропускной способностью (контроллер PCI Express, контроллер дисплея и т.д.). Менее “жадные” клиенты совместно используют один и тот же концентратор, а контроллеры памяти распределены по чипу рядом с потребителями, требующими большую пропускную способность.
Геометрическая производительность, PowerPlay
AMD не только усилила “слабые места” архитектуры; инженеры улучшили и существующие сильные стороны. Так, улучшилась производительность геометрических шейдеров. Это неудивительно. Подобный тип шейдеров появился недавно, и предыдущая архитектура была первой версией, где их реализовали и AMD, и nVidia. Теперь настало время улучшить первые версии. Подобно nVidia, AMD увеличила размер выходного буфера геометрических шейдеров, чтобы хранить больше данных на GPU. Число потоков геометрических шейдеров, обрабатываемых в один момент времени, увеличилось в четыре раза. Давайте взглянем на результат этих улучшений.
Хотя RV770 оказался не таким впечатляющим в тесте Galaxy (который, если вы заметили, даёт мизерный прирост GT200 по сравнению с G92, и на его вряд ли влияет размер буфера), но GPU продемонстрировал свою мощь в тесте Hyperlight, заняв второе место после GTX 280.
Давайте продолжим наши тесты геометрии, на этот раз с акцентом на вершинные шейдеры.
И вновь неудивительно, что архитектура AMD себя хорошо показывает. С другой стороны, мы несколько разочаровались, поскольку ожидали от 800 АЛУ намного больших результатов. Впрочем, все современные GPU упираются в мощность движка настройки, который выдаёт по одному треугольнику за такт в лучшем случае. А тест Vertex Shader 3.0 на RV770 работать просто отказался.
Давайте вновь оценим производительность блоков вершинных шейдеров, на этот раз акцентировав внимание на выборе текстур, поскольку эта технология весьма полезна, особенно для карт смещения (displacement mapping). nVidia смогла немного выйти вперёд в тесте Earth, но в тесте Waves AMD находится далеко впереди, оставляя в пыли даже новую линейку nVidia.
PowerPlay
AMD смогла улучшить управление энергопотреблением GPU, в частности, введя стробирование тактовых частот (clock gating), которое отключает некоторые части чипа, когда они не активны. AMD исправила ошибку в системе управления энергопотреблением, выявленную на RV670 при работе с CPU нижнего или среднего уровней. С такими центральными процессорами RV670 часто недостаточно хорошо нагружается и переходит в режим с низким энергопотреблением, а когда CPU заканчивает обработку данных и отсылает их на видеокарту, GPU вновь переходит в производительный режим, что занимает несколько тактов и может привести к “микро-рывкам”.
В помощью GPU был добавлен микроконтроллер, который считывает:
- температуру на разных датчиках, разбросанных по GPU;
- активность разных областей GPU. Микроконтроллер управляет стробированием тактовых частот и частотой GPU как функциями данных значений, снижая энергопотребление на уровне драйвера.
Спецификации
Поскольку в нашу лабораторию попала только видеокарта Radeon HD 4850, позвольте сравнить её спецификации с конкурентами, включая GeForce 9800 GTX+, которую nVidia в последний момент достала из рукава (хотя эта видеокарта не будет доступна раньше 17 июля).
Спецификации видеокарт | |||||
Характеристика | HD 3870 X2 | HD 4850 | 9800 GTX | 9800 GTX+ | 280 GTX |
Частота GPU | 825 МГц | 625 МГц | 675 МГц | 738 МГц | 602 МГц |
Частота АЛУ (потоковых процессоров) | 825 МГц | 625 МГц | 1 688 МГц | 1 836 МГц | 1 296 МГц |
Частота памяти | 900 МГц | 1 000 МГц | 1 100 МГц | 1 100 МГц | 1 107 МГц |
Ширина шины памяти | 2×256 битов | 256 битов | 256 битов | 256 битов | 512 битов |
Тип памяти | GDDR3 | GDDR3 | GDDR3 | GDDR3 | GDDR3 |
Объём памяти | 2 x 512 Мбайт | 512 Мбайт | 512 Мбайт | 512 Мбайт | 1 024 Мбайт |
Число АЛУ (потоковых процессоров) | 640 | 800 | 128 | 128 | 240 |
Число текстурных блоков | 32 | 40 | 64 | 64 | 80 |
Число ROP | 32 | 16 | 16 | 16 | 32 |
Вычислительная мощность шейдеров | 1,06 TFlops | 1 TFlops | (648) GFlops | (705) GFlops | 933 GFlops |
Пропускная способность памяти | 115,2 Гбайт/с | 64 Гбайт/с | 70,4 Гбайт/с | 70,4 Гбайт/с | 141,7 Гбайт/с |
Число транзисторов | 1 334 млн. | 956 млн. | 754 млн. | 754 млн. | 1 400 млн. |
Техпроцесс | 55 нм | 55 нм | 65 нм | 55 нм | 65 нм |
Площадь кристалла | 2 x 196 мм² | 260 мм² | 324 мм² | 248 мм² | 576 мм² |
Поколение | 2008 | 2008 | 2008 | 2008 | 2008 |
Поддержка модели шейдеров | 4.1 | 4.1 | 4.0 | 4.0 | 4.0 |
Если посмотреть на общие характеристики, то на первый взгляд 4850 не оставляет 9800 GTX (или даже версии “+”) и шанса – на 27% больше транзисторов, 800 АЛУ, а также теоретическая вычислительная мощность 1 TFlops, на 42% больше, не говоря уже о поддержке Direct3D 10.1 и некотором превосходстве, которое довольно сильно заметно в синтетических тестах. Жаловаться не на что. Впрочем, из-за 256-битной шины памяти её пропускная способность несколько уступает. Кроме того, у AMD по-прежнему есть очевидное отставание по числу текстурных блоков и ROP, так что ошибки прошлого, похоже, эта компания не усвоила.
Нажмите на картинку для увеличения.
Изготовленный по 55-нм техпроцессу, чип RV770 можно назвать относительно маленьким – площадь кристалла составляет всего 260 мм², что меньше, чем половина от GT 200. В принципе, 55-нм техпроцесс уже не является преимуществом AMD, поскольку nVidia догнала со своей 9800 GTX+, которая будет использовать GPU G92b, вариант G92 на 55-нм техпроцессе. G92b будет, если судить по нашим прикидкам, на 5% меньше RV700 благодаря сниженному числу транзисторов. Собственно, это и есть основная инновация этой карты, которая позволила увеличить частоту GPU на 9% (и частоту АЛУ/потоковых процессоров). И… на этом всё! Все остальные характеристики (за возможным исключением температуры и энергопотребления, но это мы проверим позже) остались идентичными. Честно говоря, мы не знаем, почему nVidia решила отказаться от названия “GeForce 9800 Ultra”, поскольку оно было бы логичнее. Но нам ещё предстоит увидеть, имеет ли новая версия право на существование, хотя она позволила потребителю различать два варианта GPU (в чём потребителю как раз было отказано после выхода GPU 9800 GTX).
Нажмите на картинку для увеличения.
Наконец, следует заметить, что 4850 обеспечивает такую же теоретическую производительность, что и 3870 X2, однако архитектура 4850 была несколько улучшена, как мы уже видели, да и другие характеристики несколько отличаются (в частности, число текстурных блоков). Поэтому будет весьма интересно сравнить две этих карты в тестах.
Radeon HD 4850 (Давид) против 9800 GTX+ (Голиаф)
Сложно не заметить очевидные физические различия между двумя картами, которые позиционируются на текущие игровые ПК среднего и верхнего уровней. И это в сфере, где обычно без увеличительного стекла не обойтись.
Asus Radeon HD 4850. Нажмите на картинку для увеличения.
Radeon HD 4850 кажется очень скромным, карта похожа на HD 3850: однослотовый дизайн, один шестиконтактный разъём дополнительного питания PCI Express, компактные габариты (дина 23,3 см – 9,2″), а также 6-см радиальный вентилятор. И хотя радиатор закрывает большую часть платы, карта не окружена массивным кожухом, который не позволяет различать модели между собой.
Нажмите на картинку для увеличения.
Карту GeForce 9800 GTX+, с другой стороны, физически нельзя отличить от 9800 GTX, если только вы не снимите кожух и радиатор, чтобы посмотреть на установленный GPU. Карта использует двухслотовую систему охлаждения, два шестиконтактных разъёма дополнительного питания и толстый 7-см вентилятор; длина при этом составляет 26,7 см (10,5″). Но, по крайней мере, тепло, создаваемое картой, выбрасывается за пределы корпуса, что про HD 4850 не скажешь.
Нажмите на картинку для увеличения.
Что касается выходов, обе карты оснащены двумя двухканальными выходами DVI, а также ТВ-выходом. Asus Radeon HD 4850 поставляется с активным переходником DVI-HDMI, переходником DVI-VGA, гибким мостиком Crossfire, переходником с вилок Molex на шестиконтактную вилку питания, а также поддерживает HDTV благодаря встроенному звуковому контроллеру. Выходы GeForce 9800 GTX тоже могут передавать звук, но без интегрированного звукового контроллера звук приходится передавать внутри корпуса через кабель S/PDIF, который ограничен сигналом стерео (без сжатия).
Модель Asus, протестированная нами, оказалась разогнанной: частота GPU составила 680 МГц (на 8,8% больше штатной), а памяти – 1 050 МГц (на 5% больше). Но поскольку разгон скромный, а карта не продаётся дороже других моделей, мы решили использовать её в тестах.
Тестовая конфигурация
Для данного теста мы использовали те же самые настройки, что и для теста GeForce GTX 260 и 280, но с учётом уровня производительности тестируемых карт мы добавили разрешение 1 680 x 1 050 к предыдущим 1 920 x 1 200 и 2 560 x 1 600. Вполне естественно, что для новых GPU потребовались и обновлённые драйверы.
Тестовая конфигурация | |
Материнская плата | Asus P5E3 Deluxe (Intel X38) |
Процессор | Intel Core 2 Quad QX6850 (3 ГГц) |
Память | Crucial 2 x 1 Гбайт DDR3 1333 МГц 7-7-7-20 |
Жёсткий диск | Western Digital WD5000AAKS |
Оптический привод | Asus 12x DVD |
Блок питания | Cooler Master RealPower Pro 850W |
Программное обеспечение | |
ОС | Windows XP, Vista, Vista SP1 |
Драйверы nVidia | ForceWare 177.39 beta (9800 GTX+) ForceWare 177.34 beta (GTX 260 и GTX 280 под Vista) ForceWare 177.26 beta (GTX 280 под XP) ForceWare 175.16 WHQL (9800 GTX, 9800 GX2, 8800 Ultra) |
Драйверы AMD | Catalyst 8.22 beta (HD 4850) Catalyst 8.6 WHQL (HD 3870) Catalyst 8.5 WHQL (HD 3870 X2) |
Flight Simulator X
Нажмите на картинку для увеличения.
Как это обычно бывает, игра Flight Simulator немного рассказала об актуальной или средней производительности видеокарт, но результаты стоит проанализировать. Как видим, 9800 GTX+ так и не смогла добраться по производительности до 9800 GTX, хотя две карты показывают близкие результаты, а 9800 GTX+, по идее, должна быть чуть быстрее. Причина кроется в драйверах. GTX+ требует 177.39 beta, которая свежее, чем версия 175.16 WHQL, которую мы использовали для 9800 GTX – изменение дало негативный эффект. Что же касается 4850, видеокарта смогла обойти 3870 (и, в частности, 3870 X2), хотя обогнать 9800 GTX не удалось.
Call of Duty 4
Нажмите на картинку для увеличения.
Видеокарта 9800 GTX+ как-то очень с трудом демонстрировала преимущество 9% прироста по частоте GPU в Call of Duty 4. Только когда мы увеличили разрешение до 2 560 x 1 600, она смогла обойти 9800 GTX (и то ненамного)! В случае 4850 всё просто замечательно, видеокарта постоянно шла впереди 8800 Ultra (и 9800 GTX+), всего на 6% уступая GTX 260!
Test Drive Unlimited
Нажмите на картинку для увеличения.
В игре Test Drive Unlimited видеокарта 4850 показала смешанную производительность, но всё же похуже, чем в Call of Duty 4. Она находится на одном уровне с 9800 GTX+ или даже обходит её после включения сглаживания, но без FSAA, наоборот, уступает. Обратите внимание, что плохой результат в 2 560 x1 600 связан не с недостатком памяти, а с нестабильностью драйвера (он зависал на несколько секунд, потом запускалась процедура восстановления) после загрузки игры. И эта проблема, увы, встречается не только здесь.
Crysis
Нажмите на картинку для увеличения.
Известная игра Crysis в разрешении 1 680 x 1 050 демонстрирует близость разных видеокарт по производительности, если исключить результаты GeForce GTX 200, 9800 GX2 и Radeon HD 3870. В данной ситуации GTX+ получила добавку производительности (9%), которая позволила ей обойти 4850. С другой стороны, включение сглаживания вновь привело к выходу Radeon вперёд, производительность 4850 оказалась на 39% лучше 9800 GTX+. Что касается других разрешений, то играть можно только на 1 920 x 1 200, если многого от игры не требовать, да и “тяжёлых” сцен избегать. В данном разрешении обе видеокарты дали схожую производительность – на 16% меньше GTX 260.
World in Conflict
Нажмите на картинку для увеличения.
World in Conflict явно тяготеет в пользу видеокарты Radeon HD 4850, которая обходит 9800 GTX+ во всех ситуациях, вновь демонстрируя своё превосходство после включения сглаживания. Без сглаживания средний отрыв составляет 10%, в то время как со сглаживанием он увеличивается до 27%, а в разрешении 2 560 x 1 600 разница просто рекордная! Хотя объём памяти одинаковый, видеокарта 4850 вновь демонстрирует более эффективную работу с памятью, вплоть до уровня GTX 260!
Supreme Commander
Нажмите на картинку для увеличения.
Результаты вновь оказались очень близки в Supreme Commander. Radeon HD 4850 лишь немного опережает конкурента, всего на 3%, зато постоянно. Обратите внимание, что 4850 здесь уступает 3870 X2, в отличие от предыдущих игр.
Unreal Tournament III
Нажмите на картинку для увеличения.
Unreal Tournament III дала 9800 GTX+ первую очевидную победу (14% в среднем) над Radeon HD 4850. Что необычно, отрыв только увеличился после включения сглаживания. И хотя Radeon HD 3870 X2 оставалась впереди 4850 без фильтрации, иерархия поменялась после активации функций улучшения картинки.
Mass Effect
Нажмите на картинку для увеличения.
Без сглаживания мы упираемся в ограничение 60 кадров в секунду (несмотря на отключение вертикальной синхронизации и плавную частоту кадров в движке Unreal Engine 3; но ограничение может быть связано и с процессором). Интересно отметить, что в тестах с активным сглаживанием все карты выстроились по ступенькам в разрешении 1 680 x 1 050, сохранив ту же самую иерархию и в 1 920 x 1 200. Только карты линейки GT200 смогли достичь 60 fps, а 4850 не смогла дойти до уровня Radeon HD 3870, но, по крайней мере, на 4850 можно было играть со сглаживанием, в отличие от модели с двумя GPU. Впрочем, 4850 всё равно не дотянула до результатов 9800 GTX+, уступая вплоть до 26% (на 1 920 x 1 200 + фильтры) и до 35% Radeon HD 3870 X2 в разрешении 2 560 x 1 600.
Race Driver: GRID
Нажмите на картинку для увеличения.
К сожалению, видеокарта Radeon HD 4850 вновь отказалась отображать какую-либо графику дольше двух секунд в игре Race Driver: GRID. Драйвер дисплея вновь “повис” после старта. Мы не определили точной причины подобного странного поведения, но, похоже, оно связано с нашим образцом видеокарты Asus, которая имеет заводской разгон. Обратите внимание, что 9800 GTX+ показала 6% преимущество в производительности над 9800 GTX, что позволило этой видеокарте обойти 8800 Ultra на разрешении 1 920 x 1 200 с опциями улучшения качества картинки.
Энергопотребление
Интересно посмотреть, как 956 миллионов транзисторов сравнятся с 666 миллионами у RV670 (Radeon HD 3850/70), учитывая, что оба GPU изготавливаются по 55-нм техпроцессу. Помните, что на графике приведено полное энергопотребление системы, учитывая потерю энергии на блоке питания (эффективность 20%).
Энергопотребление в режиме бездействия существенно возросло, что не очень приятно: рост составил 22 Вт (примерно 18 Вт для видеокарты, если вычесть потери на блоке питания) для такого же уровня загрузки (стремящегося к нулю). Результат разочаровывает, особенно с учётом того, что 4850 потребляет в режиме бездействия энергии даже больше, чем GeForce GTX 200, хотя когда то в этой сфере преуспевала AMD. В режиме бездействия штатные частоты 4850 снижаются с 625 МГц (GPU) и 1 000 МГц (память) до 500 МГц и 750 МГц, соответственно, то есть не так агрессивно, как у GT200.
С другой стороны, после нагрузки с помощью Test Drive Unlimited рост энергопотребления по сравнению с 3870 составил не больше 12 Вт, хотя производительность увеличилась в данном случае на 26%, что неплохо (и это несмотря на небольшой разгон видеокарты Asus). Обратиет внимание, что пиковое энергопотребление системы (после запуска Fillrate Tester) оказалось всего 270 Вт.
Но, опять же, 9800 GTX+ весьма неплохо показала себя, сведя преимущество AMD на нет. Обратите внимание, что перевод G92 на 55-нм техпроцесс позволил немного снизить энергопотребление как в режиме бездействия, так и под нагрузкой (до 8 Вт), что вполне предсказуемо, учитывая очень небольшой прирост частоты. Следует отметить, что в данном случае (Test Drive Unlimited на 2 560 x 1 600), соотношение производительности на ватт 9800 GTX+ оказалось на 11% лучше, чем у HD 4850.
Уровень шума
Видеокарта 4850 не потребляет больше энергии, чем 9800 GTX+. Как насчёт уровня шума?
Замечательные новости: в режиме бездействия видеокарта Radeon HD 4850 оказалась самой тихой среди протестированных моделей – её было попросту неслышно, несмотря на скорость вращения вентилятора 1 490 об/мин, чему мы обязаны размеру вентилятора (скорость вращения составляет всего 27% от максимальной).
К сожалению, то же самое нельзя сказать про работу под нагрузкой, где уровень шума HD 3870 остался в истории. Вентилятор вращается на скорости до 3 400 об/мин, и хотя терпеть его можно, шум явно слышен, причём субъективно даже громче, чем у 9800 GTX +. Конечно, однослотовый дизайн, со всеми его недостатками (меньшая площадь рассеяния тепла, более тонкий вентилятор и выброс горячего воздуха обратно в корпус) является явным недостатком 4850.
Температура
Неудивительно, что видеокарта Radeon HD 4850 сильно нагревается – достаточно её затронуть (мы смогли выдержать лишь несколько секунд). Впрочем, температура не превосходит ту, что мы зафиксировали у Radeon HD 3870. Бесшумная работа в режиме бездействия тоже имеет свои последствия, поскольку видеокарта оказалась на 20°C горячее, чем большинство моделей. Здесь проявляется ещё один недостаток недостаточного рассеяния тепла. Температура никогда не превышает предельного уровня, но всё же следует держать чувствительные к температуре компоненты подальше от подобной видеокарты. А в условиях ПК для домашнего кинотеатра (HTPC) с температурой будет справиться ещё сложнее.
Кстати, видеокарта GeForce 9800 GTX+ показала выигрыш от более тонкого техпроцесса GPU, поскольку с аналогичной системой охлаждения мы получили значения на 3-4°C меньше 9800 GTX.
Заключение
Подведём итог. В целом видеокарта Radeon HD 4850 оказалась приятным сюрпризом. После разочаровывающего старта Radeon HD 2900, который имел интересную архитектуру, но сниженную производительность, AMD представила линейку HD 3800, которая пусть и не дала лидерство в гонке производительности с nVidia, но обеспечила хорошее соотношение цена/производительность. Но с выходом RV770 AMD вновь вернулась в строй. Скорректировав слабые места (такие как текстурные блоки и производительность сглаживания), а также улучшив сильные стороны (арифметические вычисления и геометрические шейдеры), AMD представила весьма любопытную альтернативу новому “монстру” nVidia. Подход AMD, которая избегает битвы в самом верхнем сегменте рынка, пусть даже причины на то весьма объективные, принёс свои плоды. Перед нами существенный шаг вперёд со времён R600, чьи преимущества были, по большей части, маркетинговыми. На этот раз стратегия AMD была тщательно спланирована, вплоть до всех технологических улучшений.
А теперь чуть подробнее. Несмотря на смазанный выход, когда видеокарты Radeon HD 4850 появились ещё до того, как пресса получила информацию о них, а 4870 до сих пор недоступны, вряд ли стоит отрицать, что 4850 – карта очень хорошая. Её производительность всего на 19% уступает GeForce 260 GTX и находится на уровне GeForce 9800 GTX+, вместе с тем обгоняя 3870 X2! Обратите внимание, что на результаты видеокарты 4850 повлиял небольшой заводской разгон протестированный модели Asus, но, с другой стороны, на результаты повлияли и нулевые fps в Race Driver: GRID из-за проблем с нашим тестовым образцом.
Что интересно, видеокарты 4850 уже продаются на мировом рынке по цене ниже ожидаемой: $200! nVidia, похоже, первой была удивлена столь сильному ценовому прессингу, поскольку выслала в нашу лабораторию GeForce 9800 GTX+ за месяц до её доступности (что, кстати, привело к падению GeForce 9800 GTX на мировом рынке до $199). Но этого явно мало. Нельзя сказать, что новые видеокарты GeForce 9800 GTX+ неинтересны (всё же они используют первый 55-нм GPU nVidia с частотой на 9% выше и некоторым падением энергопотребления и температуры), но они дают лишь небольшой прирост производительности по сравнению с 9800 GTX, а стоят больше (предположительно, розничная цена 9800 GTX+ на мировом рынке составит $230, а цены на 9800 GTX, вместе с тем, продолжат падать), да и сегодня эта видеокарта недоступна. В любом случае, вряд ли имеет смысл дожидаться выхода этой видеокарты, тем более, что скоро появятся результаты Radeon HD 4870.
AMD Radeon HD 4850
Перед нами замечательная видеокарта по соотношению цена/производительность, с переработанной и оптимизированной архитектурой. Она очень и очень хорошо оправдает себя за такую цену. Несмотря на все преимущества и быстрый выпуск GeForce 9800 GTX+, AMD всё же удалось обойти nVidia по лучшему соотношению цена/производительность в данном ценовом сегменте.
Преимущества.
- Оптимизированная и доработанная архитектура RV670;
- производительность находится на уровне или чуть превосходит GeForce 9800 GTX+;
- режимы со сглаживанием часто работают быстрее, чем у GeForce.
Недостатки.
- Высокое энергопотребление и температура в режиме бездействия.
Мы выдаём AMD Radeon HD 4850 “Рекомендовано к покупке”, поскольку она обеспечивает великолепное соотношение цена/производительность.
Сводные графики производительности
На графиках представлены средние значения для каждой видеокарты и для каждой игры. Карты, которые не смогли “потянуть” игру на данном разрешении, получили за неё ноль, что существенно урезает результаты видеокарт с 512 Мбайт памяти на разрешении 2 560 x 1 600 со сглаживанием, как и Radeon HD 3870 X2, которая не смогла поддержать сглаживание в Mass Effect. Обратите внимание, что 4850 тоже получила падение производительности, поскольку наш образец от Asus не смог правильно вывести игру Race Driver: GRID, что подняло средние результаты других видеокарт!