Введение
Изначально мы хотели назвать статью “ATI Radeon HD 5870: учимся на ошибках nVidia”. Впрочем, это было бы несколько некорректно. Но позвольте пояснить, почему возникла такая мысль. Когда nVidia представляла видеокарты GeForce GTX 260 и GTX 280 больше года назад, компания знала, что она обладала самыми быстрыми моделями на рынке, поэтому не побоялась выставить цену $650.
Каким же ударом оказался выход Radeon HD 4870 через несколько недель позже, причём новая видеокарта обошла GeForce GTX 260 за $400 при цене всего $300. Конечно, AMD не отобрала “корону производительности” – у nVidia оставалась самая быстрая видеокарта. Но энтузиасты (особенно те, кто сразу же купил одну из видеокарт линейки GeForce GTX 200) почувствовали себя не очень комфортно, когда видеокарты nVidia сразу же опустились до более конкурентоспособных цен. Конечно, всегда приятно больше заработать на мощном GPU. Но это не всегда хорошо сказывается на лояльности потребителей к компании.
В общем, AMD, похоже, усвоила урок или два от “зелёной” компании. Поэтому AMD объявила свою флагманскую видеокарту по цене $400, а вторая по производительности модель на том же дизайне поступит в продажу за $259. Конечно, цену нельзя назвать низкой, но две видеокарты позиционируются как “убийцы” GeForce GTX 295 и GeForce GTX 285. Могут ли новинки опустить цены на самые быстрые видеокарты nVidia?
Одна видеокарта, три монитора, действительно удобно. Нажмите на картинку для увеличения.
Они начинают нас пугать
На брифинге ATI Radeon HD 5870, который проводился внутри списанного авианосца U.S.S. Hornet, смешалась как обычная, так и техническая пресса. Поэтому когда началась презентация, и компания начала рассказывать о том, что пользователь покупает видеокарту на основе своего положительного опыта, мы начали переживать, что дальше мы услышим о 3D-играх, которые на новых видеокартах, наконец, пойдут уже достаточно быстро. Однако суть оказалось в том, что обычных пользователей мало интересуют мегагерцы, блоки шейдеров или объём памяти; им нужны плавные игры, простое перекодирование и безупречное воспроизведение Blu-ray. Будем надеяться, что вы относитесь к энтузиастам, кому интересно услышать о Cypress, более двух миллиардах транзисторов и 40-нм техпроцессе. Мы надеемся, что движок внутри Radeon HD 5870 вам достаточно интересен, чтобы с ним подробно ознакомиться.
Нажмите на картинку для увеличения.
К счастью, после первоначального доклада AMD перешла к более технической части презентации линейки GPU Evergreen: мы узнали много подробностей о дизайне чипов, начиная с Hemlock с двумя GPU, затем Juniper для массового рынка, заканчивая Redwood и Cedar начального уровня, которые должны выйти в 2010 году.
Мы также смогли получить немало информации о DirectX 11, Windows 7, Stream Computing, технологии ATI Eyefinity, энергопотреблении, воспроизведении видео и, конечно, производительности. Вам предстоит узнать немало информации, и начнём мы с GPU Cypress, которое является “сердцем” двух новых видеокарт.
Cypress в подробностях
AMD гордится тем, что попадает в “золотую середину”. Сначала это случилось в прошлом году, когда AMD представила GPU, укрепившийся на производительном сегменте. Затем компания смогла сделать из него двухпроцессорное решение, отобрав корону производительности. После этого “золотая середина” позволила взять прежние принципы дизайна и представить варианты для массового рынка по цене около $100.
Принцип “золотой середины” сыграл на руку AMD, будучи опробованным вместе с выпуском RV770. Конечно, если обратиться к истории, то можно сделать картину более полной: видеокарта Radeon HD 4870 обеспечила прекрасное соотношение производительность/цена, модель Radeon HD 4870 X2 стала топовой видеокартой для рождественского/новогоднего сезона 2008 года, а линейки Radeon HD 4600 и 4500 смогли достойно конкурировать с предложениями nVidia для массового рынка, которые до этого были привлекательнее, чем старые видеокарты на основе линейки Radeon HD 3800.
Данный подход, конечно, противоречит стратегии nVidia, которая пока ещё не получила название, но мы можем обозначить её как “либо всё, либо ничего”. Как известно, GT200 оказалась “монстром” с 1,4 млрд. транзисторов и площадью кристалла 576 квадратных миллиметров на 65-нм техпроцессе. nVidia так и не упомянула размеры при переходе на 55-нм техпроцесс с чипом GT200b. Впрочем, неофициально мы видели что-то около 490 квадратных миллиметров. Даже на 40-нм техпроцессе чипы следующего поколения nVidia наверняка будут крупнее, чем нынешний 55-нм флагман, то есть можно ожидать следующего “монстра”.
Насколько золотая середина?
Ну не прекрасно ли? Нажмите на картинку для увеличения.
Кстати, слайд, посвящённый подходу “золотая середина” с GPU Evergreen, очень напоминает прошлогодний.
Первый (и самый сложный) чип Evergreen с кодовым названием Cypress будет позиционироваться на сегмент $300-$400. AMD планирует представить дизайн Hemlock на паре подобных GPU ближе к концу года. И хотя мы слышали об ограничениях по энергопотреблению, которые заставят снизить частоты дизайна Hemlock, AMD утверждает, что чётко регламентирует всё, начиная от списка материалов и заканчивая BIOS видеокарты к её выходу. Juniper также появится в четвёртом квартале 2009 года для ценового сегмента $199, а Redwood и Cedar будут представлены в следующем году, они позволят привнести поддержку DirectX 11 в компьютеры пользователей по цене меньше $100.
AMD впервые протестировала новый техпроцесс TSMC в апреле с производством Radeon HD 4770. В то время мы даже собрали конфигурацию CrossFire с двумя видеокартами, после чего признали её просто непобедимой за $220. К сожалению, компания огорчила своих потенциальных покупателей, поскольку в канале ощущался дефицит Radeon HD 4770, да и цены были намного выше рекомендуемых. В чём проблема? По слухам, виновником оказался слишком большой ток утечки у кристаллов TSMC, что привело к низкой доле выхода годных чипов. AMD вряд ли могла много сделать в этой ситуации, но мы сомневаемся, что потребители и продавцы остались довольны.
Прошло пять месяцев, и с этими проблемами, скорее всего, уже покончено, поскольку Cypress производится по такому же 40-нм техпроцессу. Это, кстати, неплохо, так как 40-нм фотолитография крайне желательна для столь большого числа транзисторов – 2,15 млрд. Не менее впечатляет и то, что сложный дизайн Cypress упакован на кристалле площадью 334 квадратных миллиметра. Конечно, это несколько крупнее, чем 263 квадратных миллиметра у RV770, но новинка у AMD по-прежнему существенно меньше, чем кристалл GT200b на 55 нм. В этом и заключается преимущество более совершенного техпроцесса. У AMD теперь производится самый сложный GPU в мире с 2,1 млрд. транзисторов, при этом он меньше по площади своего принципиального конкурента с 1,4 млрд.
Cypress содержит больше, чем в два раза транзисторов по сравнению с предшественником – у него было 956 миллионов. Что же сделала AMD, чтобы новейшее поколение оказалось настолько более сложным?
Ставим цели
AMD утверждает, что при разработке нового дизайна было поставлено пять целей. Первая в списке – добавление поддержки DirectX 11, чтобы видеокарта сопровождала выход операционной системы Windows 7. Действительно, лучше момент подобрать было сложно, так как операционная система Microsoft следующего поколения уже находится в готовом состоянии RTM и вскоре поступит на прилавки магазинов.
Во-вторых, AMD желала улучшить производительность игр DirectX 9, 10 и 10.1. Поскольку игры под DirectX 11 ещё не выходят на рынок, компания знает, что в течении многих месяцев после анонса производительность видеокарты будут оценивать по “наследственным” старым тестам и играм.
В-третьих, компания решила серьёзно улучшить поддержку потоковых вычислений. В этой сфере доминировала архитектура nVidia CUDA сразу же после своего старта. Поскольку OpenCL 1.0 и DirectCompute теперь становятся стандартом у разработчиков в деле поддержки GPGPU, AMD представился первый шанс достойно выйти вперёд.
В-четвёртых, компания нацелилась удвоить производительность предыдущего поколения, оставшись в пределах прежнего теплового пакета. По собственным измерениям AMD, цели достичь удалось. Хотя на этот раз максимальный тепловой пакет (TDP) всё же выше, энергопотребление в режиме бездействия существенно ниже.
Наконец, разработчики AMD добавили “изюминку” в виде дополнительных конфигураций подключаемых дисплеев к Cypress и некоторых функций улучшения качества картинки.
Как удалось удвоить производительность?
Наверное, самым простым способом для удвоения вычислительной мощности GPU будет увеличение в два раза числа ресурсов, влияющих на производительность. В итоге мы получили скорость вычислений 2,7 TeraFLOPS с одинарной точностью и 544 GigaFLOPS с двойной точностью.
Radeon HD 5870 | Radeon HD 4870 | |
Площадь кристалла | 334 мм² | 263 мм² |
Число транзисторов | 2,15 млрд. | 0,956 млрд. |
Пропускная способность памяти | 153 Гбайт/с | 115 Гбайт/с |
AA Resolve | 128 | 64 |
Z/Stencil | 128 | 64 |
Текстурные блоки | 80 | 40 |
Блоки шейдеров/ потоковые ядра/ АЛУ | 1600 | 800 |
Энергопотребление платы в режиме бездействия | 27 Вт | 90 Вт |
Энергопотребление платы при активной нагрузке | 188 Вт | 160 Вт |
Если у RV770 присутствовало 10 массивов SIMD, то у Cypress их уже 20. Как и раньше, каждое ядро содержит 16 потоковых процессоров. И каждый потоковый процессор содержит пять АЛУ, которые AMD называет потоковыми ядрами. Умножьте эти числа, после чего вы получите 1600 потоковых ядер или блоков шейдеров. Тысяча шестьсот блоков шейдеров на 850 МГц как раз дают вычислительную мощность 2,7 TFLOPS в идеальных условиях.
Диаграмма Cypress. Нажмите на картинку для увеличения.
Как и у предыдущего поколения, текстурные блоки привязаны к массивам SIMD – по четыре на массив. Поскольку массивов насчитывается 20, мы получаем 80 текстурных блоков в сумме. Конечно же, у RV770 этих блоков присутствовало 40.
Хотя конечные части конвейеров рендеринга у Cypress выглядят очень похоже на предыдущее поколение, они были существенно улучшены. Данная часть конвейера вызывала опасения, когда AMD впервые объявила архитектуру RV770. Но память GDDR5 помогла сгладить эффекты перехода на 256-битную шину памяти. Более того, улучшения производительности сглаживания и скорости Z/stencil показали, что AMD немало исправила того, что было не очень хорошо реализовано в RV670.
Рассматриваем архитектуру
Достижение упомянутых пяти целей потребовало от AMD серьёзной доработки архитектуры, хотя многие улучшения явно были взяты из линейки Radeon HD 4800 (и серии 3800 до неё).
Диаграмма Cypress. Нажмите на картинку для увеличения.
Перед тем, как мы перейдём к деталям вычислительных мощностей шейдеров GPU, давайте рассмотрим графический движок, который содержит движок тесселяции ATI шестого поколения. Раньше мы видели, как компания буквально воспевала тесселяцию. Но, как и многие технологии, которые поддерживаются только одним производителем, тесселяция в играх поддерживалась весьма ограниченно. Теперь тесселяция стала частью конвейера DirectX 11, расположившись между оболочечными/hull и доменными/domain шейдерами. Тесселятор – это компонент с фиксированной функциональностью, который можно использовать или нет, в зависимости от применяемой техники тесселяции.
В своём описании архитектуры AMD не очень понятно упомянула о сдвоенных растеризаторах. Как вы, вероятно, знаете, современные GPU способны выполнять растеризацию одного треугольника на такт, и подобный последовательный подход стал основной причиной ограничения производительности, что наблюдается в синтетических тестах геометрии в архитектурах с унифицированными шейдерами.
Поначалу мы полагали, что AMD нашла способ сделать настройку треугольников параллельной, что прекрасно бы подошло для GPU, подчёркивающего важность тесселяции. Есть, конечно, ряд опций для растеризации нескольких треугольников параллельно, но они очень сложные. Поэтому нам было интересно, как AMD сможет решить эту задачу. К сожалению, решение нас разочаровало. На практике у нас имеется по-прежнему одиночный растеризатор, обрабатывающий за такт один треугольник. Но теперь присутствует в два раза больше блоков SCU (scan conversion units), генерирующих 32 пикселя на такт, чтобы соответствовать увеличению числа блоков растеризации (ROP). Поэтому вместо двух растеризаторов лучше называть такую конфигурацию более мощным растеризатором.
И пока мы обсуждаем блоки настройки и растеризации треугольников, нам следует упомянуть ещё одно изменение. Блоки с фиксированной функциональностью, которые отвечали за вычисления интерполяции, исчезли, теперь за эту работу отвечают блоки обработки шейдеров. AMD заявляет, что влияние на производительность это оказало мизерное, но такой шаг вполне соответствует текущей тенденции избавления от максимально возможного числа блоков с фиксированными функциями, полностью полагаясь на огромную вычислительную мощность современных GPU.
Как мы уже упоминали раньше, организация потоковых ядер AMD не изменилась. Впрочем, теперь они работают более эффективно. В нашем первом обзоре Radeon HD 4850 мы обнаружили, что архитектура AMD VLIW зависит от эффективности компилятора для максимального увеличения производительности – иначе эти АЛУ будут бездействовать. В случае RV770 каждая из пяти инструкций в порции VLIW должна быть независима от остальных. Теперь Cypress может выполнять умножение и добавление, зависимое от результата другой операции за тот же самый такт. Возьмём следующий пример.
a=b*c;
d=a+x;
В случае RV770 эти инструкции нельзя было бы отправить в одной порции. Но теперь такая возможность появилась, поскольку две данных операции могут быть объединены в одну операцию MAD, где будет просчитываться промежуточный результат. Точно так же RV770 мог работать только с инструкциями DP4 (скалярные с четырьмя компонентами), а инструкции DP2 и DP3 реализовывались через DP4. В результате подобный дизайн приводил к тому, что некоторые слоты в порции терялись из-за избыточных операций. AMD утверждает, что работа со скалярными компонентами теперь стала более гибкой, хотя дальше она не была проработана. Как мы предполагаем, инженеры реализовали поддержку инструкций DP2 и DP3 в “родном” режиме, чтобы параллельно могли выполняться и другие вычисления.
Диаграмма Cypress. Нажмите на картинку для увеличения.
Поддержка целочисленных операций тоже была изменена. Раньше каждое из четырёх потоковых ядер могло выполнять одну операцию добавления или битового сдвига на 32-битных целых числах за такт, а ядро с увеличенным функционалом могло выполнять умножение или битовый сдвиг (тоже на 32-битных целых числах). Теперь четыре ядра способны выполнять умножение или добавление за такт, но только с 24-битными целыми числами. Данный выбор стал результатом компромисса между увеличением общей производительности и не слишком серьёзной траты на эту задачу дополнительных ресурсов, которые потребовались бы для выполнения полного 32-битного умножения в каждом потоковом ядре. Ограничив себя 24-битными операциями, инженеры смогли повторно использовать ресурсы, которые предназначались для обработки чисел с плавающей запятой одинарной точности, вместе с тем максимизировав использование блоков шейдеров.
Помимо указанных оптимизаций, команда разработчиков AMD представила две новых инструкции: слияния множественных сложений (fused multiply-add, FMAD), которая сохраняет точность вычислений в процессе и выполняет одно финальное округление, в отличие тот стандартного множественного сложения (MAD), где выполняется два округления. Вторая инструкция является суммой абсолютных разностей (sum of absolute differences, SAD) – эта операция часто используется в видео (в частности, для сравнения блоков пикселей). Мы проверили данные улучшения, используя разные шейдеры.
Хотя мы смогли сохранить прирост 2,26x между Radeon HD 4870 и HD 5870 на большинстве простых шейдеров DirectX 9, которые мы запустили, отрыв снизился до 1,68x при добавлении попиксельного освещения.
Теперь давайте перейдём к более сложным шейдерам DirectX 10.
С процедурными текстурами теоретический прирост в чистой производительности практически подтвердился, поскольку Radeon HD 5870 оказался в 2,24x раза быстрее 4870. Нет никаких сомнений, в том, что в процессоре присутствуют 1600 потоковых ядер.
Если потоковые вычислительные ядра изменились незначительно, то текстурные блоки вообще едва подверглись изменению по сравнению с RV770. На практике, за исключением поддержки текстур 16Kx16K и двух новых форматов сжатия текстур (оба из которых были необходимы для совместимости с DirectX 11), ничего нового не произошло. Тест Steep Parallax Mapping это явно демонстрирует.
В драйверах, по всей видимости, добавилась небольшая оптимизация, поскольку прирост в данном случае (а также и в других шейдерах, таких как Fur) составил 2,35x между двумя Radeon.
Производительность геометрических шейдеров (геометрическая производительность), с другой стороны, улучшилась всего на 42%.
Последний тест демонстрирует производительность запроса текстур (она важна для карт смещения, например). Здесь мы наблюдаем скромный прирост 34%.
Вам следует помнить, что хотя общая пропускная способность кэша L1 и увеличилась, прирост оказался всего в два раза, что соответствует увеличению числа текстурных блоков. То же самое можно сказать и про объём кэша L2, который удвоился. Но, опять же, это связано с тем, что число блоков тоже удвоилось. Что хуже, пропускная способность L1/L2 увеличилась только пропорционально частоте GPU, хотя теперь нужно обрабатывать в два раза большее число блоков. Собственно, это как раз одна из причин, почему архитектура Cypress не смогла дать в два раза большую производительность относительно предшественника в приведённых текстурных тестах.
В отношении блоков растровых операций (ROP) нет ничего особого нового. AMD просто оптимизировала связь между блоками ROP и текстурными блоками, позволяя текстурным блокам считывать сжатый формат, используемый при прямой реализации сглаживания. Данная функция, которая уже есть в GPU nVidia, должна дать более высокую производительность в операциях пост-обработки в кадровом буфере.
Помимо этого характеристики остались точно такими же, что и в случае RV770; максимальный выход в сглаживании 2x и 4x (32 пикселей/такт), но сниженный в два раза выход (16 пикселей/такт) при использовании сглаживания 8x. У проходов рендеринга только-Z не произошло каких-либо оптимизаций, они выполняются по-прежнему только в четыре раза быстрее (128 пикселей/такт).
Cypress превращается в линейку Radeon HD 5800
ATI объявила две видеокарты: Radeon HD 5870 и Radeon HD 5850.
Видеокарта Radeon HD 5870, доступная для тестов, но пока не очень хорошо представлена в продаже. Нажмите на картинку для увеличения.
Некоторое время модель 5870 будет оставаться флагманом AMD. Она оснащена графическим процессором Cypress с полным набором 1600 потоковых ядер, который работает на 850 МГц. Видеокарта способна обеспечить вычислительную производительность на уровне до 2,72 TFLOPS. Отметим наличие 80 текстурных блоков, 32 блоков растровых операций (ROP) и 1 Гбайт памяти GDDR5 на частоте 1200 МГц. Эффективная частота составляет 4800 МГц, что обеспечивает пропускную способность 153,6 Гбайт/с. Конечно, прирост пропускной способности памяти по сравнению с Radeon HD 4890 не так и велик. Впрочем, AMD указывает, что если 4890 во что и упиралась, то только в вычислительную производительность, а не в пропускную способность памяти. В итоге 5870 должна стать более сбалансированной видеокартой.
AMD указывает для Radeon HD 5870 27 Вт в режиме бездействия и 188 Вт под нагрузкой. Сравните это с видеокартой Radeon HD 4890, которая потребляла (по данным AMD) 90 Вт в режиме бездействия и до 160 Вт под нагрузкой. Чуть ниже мы как раз и рассмотрим то, как компании удалось настолько существенно снизить энергопотребление.
Radeon HD 5870 – крупная карта, ещё более длинная, чем ATI 4870 X2 – длина составляет 11 дюймов (27,9 см) против 10,5 дюймов (26,7 см), а ширина такая же, то есть карта занимает два слота расширения. Видеокарта полностью закрыта пластиковым кожухом. Красные вставки и отверстия полностью косметические, поскольку забор воздуха осуществляется только через вентилятор на лицевой стороне видеокарты. В итоге могут возникнуть некоторые проблемы при охлаждении видеокарт в конфигурации CrossFire, если расстояние между ними составляет меньше трёх слотов – и действительно видеокарты нагрелись выше 100 градусов Цельсия под нагрузкой, включив троттлинг.
Два вентиляционных отверстия сзади служат больше для украшения. Нажмите на картинку для увеличения.
Выброс воздуха выполняется тоже не так легко из-за перегруженной панели ввода/вывода 5870. Как вы наверняка уже знаете, большинство двухслотовых видеокарт размещают выходы на дисплеи на одном слоте, а второй слот занимают отверстия для выброса горячего воздуха наружу. В данном случае у нас один порт DisplayPort, один HDMI и один двухканальный выход DVI на протяжении одного слота, а второй двухканальный выход DVI занимает половину второго слота. В итоге для выброса горячего воздуха осталось чуть меньше четырёх сантиметров. Это явно недостаточно, поэтому AMD добавила отверстия на торце видеокарты для выброса горячего воздуха внутрь корпуса. Рядом с этими отверстиями располагается пара интерфейсов CrossFire, позволяющая связать вместе четыре видеокарты.
Radeon HD 5850 пока ещё не появилась на прилавках магазинов. Нажмите на картинку для увеличения.
Вторая видеокарта Radeon HD 5850 оснащена 750-МГц процессором Cypress с двумя отключёнными массивами SIMD, что даёт 1440 потоковых ядер (18 массивов на 16 потоковых процессоров с 5 потоковыми ядрами каждый). Поскольку текстурные блоки привязаны к массивам SIMD, 5850 теряет восемь текстурных блоков, сокращая их количество до 72. Впрочем, вся задняя часть конвейера остаётся прежней, поэтому на пиксельную пропускную способность и скорость обработки Z/stencil влияет только меньшая тактовая частота. Видеокарта оснащена 1 Гбайт памяти GDDR5, причём видеопамять Radeon HD 5850 работает на частоте 1 ГГц, что даёт эффективную частоту 4 ГГц и пропускную способность 128 Гбайт/с.
Те же самые оптимизации энергопотребления позволили снизить его до 27 Вт в режиме бездействия, а в режиме 3D меньшие частоты позволили видеокарте опуститься до 170 Вт.
Если верить фотографиям продуктов, то 5850 будет более короткой видеокартой, хотя и всё равно она будет занимать два слота. К сожалению, 5850 пока ещё не поступила в нашу лабораторию, но мы опубликуем обзор сразу же после этого события. За этой видеокартой тоже следует внимательно следить – заявлена розничная цена $259, а производительность, как указывает AMD, должна быть выше GeForce GTX 285, так что nVidia придётся довольно серьёзно догонять.
DirectX 11: более значимый, чем DirectX 10?
Я помню, когда ATI представила первые видеокарты из серии Radeon в 2000 году. Брайан Хентшель (Brian Hentschel) поинтересовался моим мнением насчёт названия чипа, и я помню, что мне название Radeon показалось просто ужасным. Архитектура была нацелена на игровую производительность, она содержала два пиксельных конвейера и три текстурных блока на конвейер. Хотя у Radeon была довольно высокая тексельная скорость заполнения, именно пиксельная скорость заполнения тогда стала решающим фактором в войне с nVidia – ставка была сделана на красоту сцен.
С представлением R300 в 2002 году ATI пошла другим путём, реализовав восемь пиксельных конвейеров, каждый из которых был оснащён одним текстурным блоком – на этот раз в фокусе оказалась производительность, и такое решение было вполне оправданным. ATI легко победила GeForce4 Ti 4600 и неплохо показала себя по сравнению с очень громкой GeForce FX 5800 Ultra.
Производительность или визуальное качество – что лучше? С выпуском Radeon HD 5870 AMD нацелилась и на то, и на другое. Мы уже рассмотрели архитектуру, при этом ключевым фактором для AMD стала производительность Cypress. Теперь давайте оценим визуальное качество. AMD опирается на три компонента, реализуемые аппаратно: технология Eyefinity, Stream и DirectX 11.
Я хотел бы сразу же отметить, что вся шумиха, поднятая AMD вокруг поддержки DirectX 10.1, так и не привела к существенному преимуществу в играх для геймеров. Я играл в S.T.A.L.K.E.R.; я играл в H.A.W.X. И разницу в качестве между видеокартами DirectX 10 и DirectX 10.1 вряд ли стоит вообще упоминать. Кстати, раз уж пошёл такой разговор, я считают, что DirectX 10 так и не оказал решающего влияния на качество картинки по сравнению с предыдущими версиями API. Почему мы должны ожидать, что DirectX 11 станет более существенным шагом вперёд, чем предшественник?
Конечно, в реальности DirectX 11 вряд ли окажет такое сильное влияние, как DirectX 8 или 9, где появилась поддержка шейдеров. Но его можно назвать следующим логическим шагом для разработчиков, которые всё ещё используют DirectX 9, поскольку DX11 является надмножеством для DirectX 10/10.1, то есть DX11 поддерживает существующее “железо” плюс видеокарты DX11. Microsoft убеждала нас, что под DX11 легче писать код, поэтому мы должны получить более быстрое продвижение нового API, чем DirectX 10.
Новые функции
Самые значимые изменения в DX11 приведены в следующей таблице.
Функция | DirectX 10 | DirectX 10.1 | DirectX 11 |
Тесселяция | – | – | x |
Новая модель шейдеров | – | – | x |
DirectCompute 11 | – | – | x |
DirectCompute 10.1 | – | x | x |
DirectCompute 10 | x | x | x |
Многопоточность | x | x | x |
Сжатие текстур BC6/BC7 | – | – | x |
ATI добавила тесселяцию текстур в свои GPU ещё в 2001 году. И хотя мы не уверены, насколько сильно подобные ранние аппаратные реализации были поддержаны сообществом игровых разработчиков, они помогли проложить путь тесселяции в том виде, в котором она существует сегодня, в разных реализациях (Catmull-Clark subdivision surface modeling, Bezier patch meshes, n-patches, displacement mapping, adaptive/continuous tessellation). Конечно, преимущества тесселяции вполне очевидны – больше полигонов означают больше детализации и больше реализма. А поскольку тесселяция сегодня стандартизирована как компонент DirectX 11, разработчики наверняка будут её использовать без опасений поддержать “железо” только одного производителя. Команда разработчиков Rebellion продемонстрировала тесселяцию в грядущей игре Aliens Vs. Predator, которая выйдет в первом квартале следующего года.
Возможно, одна из первых игр с поддержкой тесселяции DirectX 11, Aliens vs. Predator, выйдет в первом квартале 2010 года. Нажмите на картинку для увеличения.
В DirectX 11 также появляется новая модель шейдеров Shader Model 5.0, которая даёт разработчикам боле объектно-ориентированный подход в кодировании HLSL. В идеальном случае она позволит разработчикам быстрее переходить на новые API, поскольку программирование становится более ясным и эффективным (если вам нужны конкретные примеры, мы рекомендуем ознакомиться со статьёй “OpenGL 3 против DirectX 11: война закончена“).
Геймеры с многоядерными процессорами должны получить прирост производительности от игр DirectX 11 по причине многопоточных оптимизаций в новом ATI. AMD и nVidia предлагают драйверы с поддержкой многопоточности уже три года, и теперь они смогут выдавать команды на GPU параллельно. По информации nVidia, это могло бы принести в 2006 году от 10 до 40 процентов производительности. Но DirectX 11 идёт ещё дальше, позволяя приложению, runtime-обработчику DirectX и драйверу работать в разных потоках. AMD показала пример загрузки текстур или компиляции шейдеров параллельно с основным потоком рендеринга. Кроме того, многопоточность становится более раздробленной, что, весьма забавно, даст больше преимущества AMD и Intel, чем ATI и nVidia. Впрочем, подождите. Для AMD это будет явной победой, не так ли?
Скриншот из презентации Аллисона Клейна (Allison Klein) на Gamefest 2008. Нажмите на картинку для увеличения.
Улучшенное сжатие текстур – ещё одно добавление, ориентированное на разработчиков, от которого должно выиграть качество игр без особого ущерба пропускной способности памяти. В DirectX 11 появилось два новых формата сжатия текстур: BC6 и BC7. BC6 обеспечивает сжатие с уровнем до 6:1 для 16-битных текстур с высоким динамическим диапазонам с аппаратной поддержкой распаковки. BC7 даёт степень сжатие до 3:1 для восьмибитных текстур и карт нормалей.
DirectCompute
Конечно, серьёзной новой функцией в DirectX 11 можно назвать DirectCompute, API, который поддерживает больше вычислений общего характера на GPU на новейших видеокартах DX11 в дополнение к моделям DX10 и DX10.1. Если подниматься по иерархии DirectX, то вы получите больше и больше функций, реализуемых через DirectCompute. Среди применений DirectCompute можно отметить постобработку изображений, физику, трассировку лучей, искусственный интеллект, независимую от порядка прозрачность (order-independent transparency) и рендеринг теней – в дополнение к перекодированию видео, которое мы уже встречали у Stream и CUDA.
Конвейер DirectX 11, из презентации Аллисона Клейна (Allison Klein) на Gamefest 2008. Нажмите на картинку для увеличения.
Это довольно любопытно, поскольку до сих пор большая часть примеров вычислений GPGPU касалась перекодирования видео и пост-обработки картинки в программах, подобных CyberLink MediaShow Espresso и ArcSoft SimHD. Сейчас же эта технология начинает нацеливаться на игры. Действительно, в результате игровые разработчики смогут получить доступ к технологии ATI Stream через стандартизированный интерфейс, который является просто необходимым для широкого распространения.
Возьмите, например, независимую от порядка прозрачность (order-independent transparency). В прошлом рендеринг множества перекрывающих друг друга объектов с альфа-смешением требовал серьёзных операций сортировки, с заднего плана сцены на передний для каждого объекта. До DX11 этот подход подразумевал большое количество вычислений на host-процессоре, и даже тогда вы не всегда получали визуально точный результат. В DirectX 11 прозрачные пиксели сортируются через атомарные операции, они добавляются к буферу всего за один проход. Посмотрите сами на следующие скриншоты.
Простое альфа-смешение. Нажмите на картинку для увеличения.
Независимая от порядка прозрачность (Order-Independent Transparency) в DX11. Нажмите на картинку для увеличения.
Конечно, с помощью DirectCompute можно выполнять намного больше: от ambient occlusion в высоком разрешении до специальных теней и пост-обработки с глубиной резкости. AMD даже показала демо перекодирования видео под Windows 7. Но когда мы попросили AMD провести тесты, которые использовали бы DirectCompute, то нам сообщили об их отсутствии. Поэтому нам придётся дождаться сторонних разработчиков, которые реализуют DirectCompute, прежде чем мы более глубоко рассмотрим эту технологию. Пока что можно отметить, что игры Aliens Vs. Predator, S.T.A.L.K.E.R. Call of Pripyat и Colin McRae: Dirt 2 будут использовать функционал DirectCompute, а выйдут они в ближайшие несколько месяцев.
Eyefinity: существенное преимущество уже сегодня
Если посмотреть на список самых быстрых видеокарт, то наличие большого числа выходов на дисплей вряд ли будет казаться причиной, чтобы отдать почти $400 за high-end GPU. Если вы используете только один монитор, то всё вполне понятно. Но всё бывает не так просто. Несколько лет я использовал четыре ЖК-монитора для работы, при этом на каждом из них было открыто, как минимум, одно окно. Затем я перешёл на три ЖК-монитора, но даже во время набора текста у меня открыто 10 окон Firefox, данный документ в Word, Outlook, два письма, Excel, Adobe Acrobat и мессенджер Trillian – больше окон, чем можно уместить даже на три дисплея. Чтобы подключить такое количество дисплеев, я используют комбинацию видеокарт Radeon HD 4850 и Radeon X1650.
H.A.W.X., 5760×1200 на трёх 24-дюймовых дисплеях. Нажмите на картинку для увеличения.
Технология ATI Eyefinity призвана дать эффективное решение. Дни двух DAC и пары передатчиков TMDS, составляющих полный конвейер дисплеев, остались в прошлом. Radeon HD 5870 содержит три независимых выхода на дисплей, распределённых по двум двухканальным портам DVI, выходу HDMI и разъёму DisplayPort. В стандартном настольном окружении вы наверняка будете использовать два выхода DVI и один DisplayPort.
Нажмите на картинку для увеличения.
Причиной такого многообразия на самом деле является DisplayPort. В отличие от DVI, интерфейс DisplayPort не требует выделенного тактового генератора для каждого выхода. Поэтому все видеокарты в линейке ATI Evergreen (за исключением low-end моделей) имеют возможность работать с шестью портами DisplayPort, учитывая шесть интегрированных на кристалл контроллеров дисплея. Radeon HD 5870, в частности, использует два встроенных тактовых генератора Cypress, а также один из конвейеров DisplayPort, что даёт три независимых выхода на дисплей. На иллюстрации выше показана конфигурация выходов, которую способна поддерживать Eyefinity.
Это уже вполне хорошо, но обратите внимание на видеокарту Radeon HD 5870 Eyefinity6 Edition, которая в полной мере выигрывает от конвейеров DisplayPort в GPU. Используя шесть выходов mini-DisplayPort, эта видеокарта позволяет подключить такое же количество мониторов – причём вплоть до крупных 30″ ЖК-дисплеев. Теоретически Eyefinity поддерживает максимальное суммарное разрешение до 8192×8192. Но шесть 30″ мониторов дадут с разрешением 2560×1600 дадут всего 7680×3200. Можно ожидать, что видеокарта Eyefinity6 выйдет до конца года. К этому времени должны появиться мониторы Samsung с ультра-тонкой рамкой, которые сделают конфигурацию из нескольких дисплеев более комфортной.
Нажмите на картинку для увеличения.
Eyefinity в работе
Мы довольно подробно обсудили технологию Eyefinity, но всё же темой статьи является Radeon HD 5870 – будем надеяться, что вы уже знаете о поддержке трёх дисплеев этой видеокартой.
AMD любезно выслала в нашу лабораторию три монитора Dell U2410, и для их установки я смог найти только одно место – обеденный стол. Впрочем, это того стоило. Я уже наблюдал технологию трёх дисплеев AMD на брифинге, посвящённом выходу 5870, но личная работа за тремя 24″ мониторами оказалась совсем другим делом.
Нажмите на картинку для увеличения.
Настройка трёх дисплеев для работы в едином массиве рабочего стола под Windows 7 выполняется довольно интуитивно (всё будет также работать под Windows Vista и Linux). Мы выставили разрешение рабочего стола в 5760×1200 и настроили фон, чтобы всё выглядело знакомым. Играть на едином пространстве мониторов удобно, но работать в таком режиме – не очень. В режиме SLS у вас получается эквивалент большого рабочего стола. Максимизируйте окно Outlook, после чего оно будет растянуто по всей доступной поверхности. AMD утверждает, что можно настроить “горячую” клавишу для переключения между SLS и режимом независимых дисплеев, но мы так и не смогли её найти. Как нам кажется, AMD должна представить более интуитивный способ переключения между “рабочим” режимом трёх независимых дисплеев и игрой по единой поверхности трёх экранов.
Первое, что мы запустили после настройки трёх дисплеев – игра H.A.W.X. Этот относительно плавный аркадный авиасимулятор дал довольно низкую для него частоту кадров в 5760×1200. С высоким уровнем детализации (High) и выключенным сглаживанием мы получили 44 кадра в секунду. Если у вас частота кадров никогда раньше не снижалась до такого уровня, то это как раз такой случай. Визуальное впечатление оказалось просто потрясающим. Мы сразу решили попробовать другие игры в нашем тестовом пакете.
Игровые тесты, , одиночная Radeon HD 5870 @ 5760×1200 (без AA/AF), FPS | |
H.A.W.X. | 44 |
Far Cry 2 | 54,12 |
Left 4 Dead | 81.04 |
S.T.A.L.K.E.R.: Clear Sky | 28,8 |
World in Conflict | Crash |
Resident Evil 5 | Не совместима |
Grand Theft Auto IV | 29,61 |
Изначально мы планировали представить график с тремя колонками; когда мы увидели S.T.A.L.K.E.R. с 28 кадрами в секунду и Grand Theft Auto IV с 29 fps, то сразу же на ум пришла мысль: теперь у нас появилась причина купить пару Radeon HD 5870. Но CrossFire на трёх дисплеях пока не работает. Команда разработчиков драйверов AMD пытается решить эту проблему, но пока ещё нет никакой информации по поводу того, когда пара 5870 сможет увеличить производительность ещё сильнее. Так что второй повод для критики: отсутствие поддержки CrossFire.
По крайней мере, сегодня вполне можно играть на одной видеокарте Radeon HD 5870 в такие игры как H.A.W.X., Far Cry 2 b Left 4 Dead, что тоже впечатляет не меньше, если учесть, что последняя видеокарта с поддержкой трёх мониторов, побывавшая в нашей лаборатории – это Matrox Parhelia, графический процессор был явно недостаточен для трёх мониторов. Но вам придётся выключить такие дополнительные функции повышения визуального качества, как сглаживание, чтобы получить разумную частоту кадров от 5870.
Последнее замечание: два с лишним сантиметра рамки между каждой парой дисплеев не очень раздражают при работе на рабочем столе Windows, но уже определённо мешаются в играх. Будем ждать, когда на рынок выйдут мониторы Samsung с очень тонкими рамками. Когда такое произойдёт (будь то одиночная конфигурация, либо 3×1 или 3×2), то Eyefinity станет намного более привлекательной.
По большей части всё тоже самое, но с HD-звуком
Со всем этим удвоением ресурсов, добавлением DirectX 11 и поддержкой Eyefinity в ядре Cypress было довольно удивительно узнать, что ничего не изменилось в аппаратной части GPU, отвечающей за воспроизведение видео. Radeon HD 5870 продолжает поддерживать технологию AMD Universal Video Decoder 2.
Как вы уже наверняка знаете, она подразумевает несколько функций постобработки, такие как алгоритм расширенного временного деинтерлейсинга (temporal de-interlacing algorithm), inverse telecine (определение pulldown), масштабирование разрешения, регулировку динамической контрастности (хотя мы критиковали подобные технологии изменения картинки в прошлом) и подавление “шума”. UVD2 также содержит полную поддержку декодирования видео MPEG-2, VC-1 и H.264. Причём движок может одновременно обрабатывать два потока видео 1080p, что даёт функцию ускорения “картинка-в-картинке”, которую мы уже наблюдали в видеокартах предыдущего поколения, когда одно изображение выводится поверх другого с помощью шейдеров GPU.
Но хотя RV790 содержит 800 потоковых ядер, опасения насчёт эффективности подобного вывода приводили к отключению пользовательского интерфейса Windows Aero каждый раз, когда воспроизводился диск Blu-ray (с контентом стандартного разрешения проблем не возникало). Сегодня AMD утверждает, что Cypress поддерживает воспроизведение контента Blu-ray (вновь даже два потока) без выключения интерфейса Aero благодаря существенному увеличению вычислительной производительности блоков шейдеров. Если быть более конкретным, то в блоках шейдеров было уменьшено число проходов для наложения HD-видео.
Нажмите на картинку для увеличения.
По умолчанию эта функция отключена в PowerDVD 9 из-за соображений производительности. Однако если вы выйдете в настройки (в предварительной версии), выберите закладку “Blu-ray”, затем клавишу “Advanced” и уберёте опцию выхода из интерфейса Aero во время воспроизведения видео, то всё будет работать правильно.
Может ли видеокарта убить звуковые карты для HTPC?
Впрочем, энтузиастов домашнего кинотеатра намного больше заинтересует то, что AMD обещает в новом поколении реализовать защищённый звуковой путь. Как вы уже знаете по нашим предыдущим статьям, посвящённым сборке идеального кинотеатра под Windows 7, мы протестировали только один продукт, который способен выдавать в закодированном формате (bitstream) звук Dolby TrueHD и DTS-HD Master Audio с дисков Blu-ray на ваш домашний ресивер через HDMI: Asus Xonar HDAV 1.3. Впрочем, в нашу лабораторию уже поступила звуковая карта Auzentech X-Fi HomeTheater HD, и, по мнению многих энтузиастов, она является ещё даже лучшим решением. Но на данный момент у нас всё равно есть только пара звуковых карт с подобной возможностью.
Следующая полезная функция, которую нам приятно было бы получить: программное декодирование упомянутых двух форматов звука высокого разрешения и вывод их в виде несжатого многоканального звука LPCM. Проблема заключается в том, что нынешним программным плеерам не разрешено передавать что-то лучше CD-качества на приёмник (16 бит, до 48 кГц) из-за AACS, поэтому если вы смотрите/слушаете что-то подобное “The Police: Certifiable” (24 бит, 96 кГц), вы не получите побитовую высокую чёткость.
На данный момент проблема заключается в том, что одного заявленного защищённого пути недостаточно. Компании, подобные CyberLink, должны совместно работать с производителями “железа”, чтобы звуковой поток без потерь нельзя было перехватить при передаче по шине, к которой имеет доступ пользователь. К счастью, у AMD уже есть драйвер с подобной функцией (он пока находится в состоянии бета-версии) через подключение HDMI 1.3a.
Однако программная сторона ещё не готова. Мы получили бета-версию плеера PowerDVD 9 с последний момент, чтобы проверить работу данной функции, но сквозное прохождение закодированного потока TrueHD и DTS-HD на наш ресивер Onkyo TX-SR507 попросту не работало (хотя мы общались с коллегами, которые без проблем получили прохождение bitstream). Хорошая новость заключается в том, что данная функция находится уже не на горизонте. AMD и CyberLink на данный момент работают над её реализацией, поэтому мы предполагаем, что поддержка появится через несколько дней или недель, а не через многие месяцы. Конечно, большинство энтузиастов HTPC вряд ли захотят устанавливать крупные двухслотовые видеокарты в свои гостиные комнаты. И данная возможность ещё покажет себя, когда чуть позже в этом году и в 2010 году появятся модели на основе дизайнов Juniper, Redwood и Cedar.
Тестовая конфигурация
Мы тестировали новую видеокарту на платформе LGA 1366, оснащённой самым быстрым процессором Intel Core i7 – 975 Extreme, разогнанным до 4 ГГц. Идея заключалась в том, что мы хотели максимально устранить “узкие места” в виде CPU, хотя вы заметите, что новые видеокарты настолько быстрые, что избежать ситуаций, когда производительность упирается в CPU, мы всё равно не смогли.
Кроме того, у видеокарт GeForce GTX 285 мы выставили 100% скорость вращения вентилятора в режиме SLI, иначе мы получали крах системы.
Наконец, следует отметить, что видеокарта Radeon HD 5870 периодически демонстрировала артефакты в первом тесте 3DMark Vantage.
Тестовое аппаратное обеспечение | |
Процессор | Intel Core i7-975 Extreme (Bloomfield) 3,33 ГГц, 6,4 GT/s, кэш L3 8 Мбайт, функции энергосбережения выключены Разогнан до 4 ГГц (25 * 160 МГц) |
Материнская плата | Asus Rampage II Extreme (LGA 1366) X58/ICH10, BIOS 1504 |
Память | Corsair Dominator 6 Гбайт (3 x 2 Гбайт) DDR3-1600 8-8-8-24 @ 1600 МГц |
Жёсткий диск | Intel SSDSA2MH160G2C1 160 GB SATA 3 Gb/s |
Сеть | Realtek RTC8111C, 1 Гбит/с |
Видеокарты | ATI Radeon HD 5870 1GB ATI Radeon HD 4870 X2 2GB ATI Radeon HD 4890 1GB ATI Radeon HD 4870 1GB Nvidia GeForce GTX 295 1.8GB Nvidia GeForce GTX 285 1GB |
Блок питания | Cooler Master UCP 1100 Вт |
Кулер CPU | Thermalright Ultra 120 Extreme |
Системное ПО и драйверы | |
Операционная система | Microsoft Windows 7 x64 |
DirectX | DirectX 11 |
Драйвер платформы | Intel INF Chipset Update Utility 9.1.1.1019 |
Драйвер видеокарты | AMD Catalyst 8.66 RC6 AMD Catalyst 9.9 Nvidia GeForce 190.62 |
Тесты и настройки
World in Conflict | Very High Quality Settings, No AA / No AF, vsync off, 1680×1050/1920×1200, 2560×1600, Patch 1009, DirectX 10 Very High Quality Settings, 4x AA / 16x AF, vsync off, 1680×1050/1920×1200, 2560×1600, Patch 1009, DirectX 10 |
Far Cry 2 | Ultra High Quality Settings, No AA / No AF, vsync off, 1680×1050/1920×1200, 2560×1600, Steam Version Ultra High Quality Settings, 8x AA / No AF, vsync off, 1680×1050/1920×1200, 2560×1600, Steam Version |
Crysis | Very High Quality Settings, No AA / No AF, vsync off, 1680×1050/1900×1200, 2560×1600, Patch 1.2.1, DirectX 10, 64-bit Executable Very High Quality Settings, 8x AA / No AF, vsync off, 1680×1050/1900×1200, 2560×1600 Patch 1.2.1, DirectX 10, 64-bit Executable |
Left 4 Dead | Highest Quality Settings, No AA / No AF, vsync off, 1680×1050/1920×1200, 2560×1600, Steam Version Highest Quality Settings, 8x AA / 16x AF, vsync off, 1680×1050/1920×1200, 2560×1600, Steam Version |
Grand Theft Auto IV | Highest Quality Settings, No AA / “High” AF, vsync off, 1680×1050/1920×1200, 2560×1600, Patch #3 |
Stalker: Clear Sky | Extreme Quality Setting, No AA / No AF, vsync off, 1680×1050, 1920×1200, 2560×1600, DirectX 10 lighting Extreme Quality Setting, 4x MSAA / No AF, vsync off, 1680×1050, 1920×1200, 2560×1600, DirectX 10 lighting |
H.A.W.X. | Highest Quality Settings, No AA / No AF, vsync off, 1680×1050, 1920×1200, 2560×1600, AO enabled, DirectX 10/10.1 Highest Quality Settings, 8x AA / No AF, vsync off, 1680×1050, 1920×1200, 2560×1600, AO enabled, DirectX 10/10.1 |
Resident Evil 5 | High Quality Settings, No AA / No AF, vsync off, 1680×1050, 1920×1200, 2560×1600, DirectX 10, Fixed Benchmark High Quality Settings, 8x AA / No AF, vsync off, 1680×1050, 1920×1200, 2560×1600, DirectX 10, Fixed Benchmark |
3DMark Vantage | Performance Default, High Quality, Extreme Quality |
3DMark Vantage
Странно видеть, что две видеокарты GeForce GTX 285 обгоняют две Radeon HD 5870 в стандартном прогоне “Performance” в 3D Mark Vantage. Поскольку мы уже знаем результаты всех других тестов, то ответ будет прост: по причине того, что в других тестах GTX 285 просто не догоняет флагмана AMD в конфигурации CrossFire. Скорее всего, 3DMark даёт небольшую фору nVidia.
Точно так же видеокарта GTX 295 оказывается довольно близка по производительности. Но это обманчиво, поскольку две 5870 в наших тестах оказываются быстрее. В целом, следует относиться к результатам 3DMark с долей сомнения, поскольку, как мы увидим, в реальных играх две видеокарты Radeon HD 5870 являются самой быстрой конфигурацией, которую сегодня можно купить (не говоря уже о трёх или четырёх 5870).
S.T.A.L.K.E.R.: Clear Sky
Мы сразу же видим, что Radeon HD 5870 является быстрой видеокартой. Она вплотную подбирается к Radeon HD 4870 X2. Впрочем, с ролью “убийцы” GeForce GTX 295 она всё же не справилась – по крайней мере, в этой игре. Впрочем, помните, что перед нами один GPU, который борется с прошлым двухпроцессорным флагманом AMD, не говоря уже о видеокарте nVidia с двумя GPU.
Если перенести сравнение на видеокарту GeForce GTX 285, то AMD смогла обойти эту модель с одним GPU во всех трёх разрешениях. Впрочем, сегодня GeForce GTX 285 можно обнаружить в магазинах по цене от $340 (от 10,8 тыс. рублей), так что новинка AMD обойдётся всё же дороже за свою дополнительную производительность и функциональность.
Вполне очевидно, что S.T.A.L.K.E.R.: Clear Sky упирается в производительность большинства видеокарт с одним GPU в разрешении 2560×1600 (впрочем, две 5870 и GTX 285 дают прекрасную производительность с детализацией Extreme). В любом случае, геймеры с 24″ мониторами без проблем смогут играть в разрешении 1920×1200 со всеми опциями улучшения качества в этой требовательной игре.
Остальные видеокарты явно готовят место для новинки ATI Radeon HD 5850, которая ещё не была доступна для тестов на момент своего объявления, но должна появиться весьма быстро. Как мы ожидаем, она будет обгонять GTX 285 при невероятной цене $259 – то есть видеокарта явно способна стать “золотой серединой”.
После включения 4xAA мы видим результат усилий AMD по улучшению производительности сглаживания. Если выше видеокарта Radeon HD 5870 отставала от 4870 X2, то теперь позиции поменялись (хотя отрыв невелик).
Но если посмотреть на конфигурации с одним GPU, то ни одна из видеокарт не справилась со столь интенсивной нагрузкой. Даже Radeon HD 5870 в разрешении 1680×1050 смогла выдать всего 36 кадров в секунду.
Конечно, пара 5870 показывает своё превосходство, намного обгоняя Radeon HD 4870 X2 и GeForce GTX 295 (впрочем, и неудивительно, учитывая разницу в цене). Данное решение оказывается единственным, способным справиться с разрешениями 1920×1200 и 2560×1600. Даже две видеокарты GeForce GTX 285 в конфигурации SLI заметно отстают.
Crysis
Почтенная игра Crysis, в которую наверняка никто уже не играет, но многим интересна её производительность даже сегодня. Одиночная Radeon HD 5870 легко обходит nVidia GeForce GTX 285, то же самое касается и конфигурации CrossFire против двух GTX 285. Впрочем, SLI масштабируется лучше, чем CrossFire, и две GTX 285 почти догоняют пару Radeon HD 5870.
Возможно, наиболее интересным будет сравнение с собственным стеком продукта AMD. Radeon HD 5870 обходит Radeon HD 4870 X2 во всех трёх разрешениях. Мы предполагаем, что после включения сглаживания результаты будут ещё более интересными.
Если у вас работает самая быстрая видеокарта ATI с одиночным GPU Radeon HD 4890, то одна 5870 даст довольно серьёзный прирост производительности. Однако этой видеокарты всё же будет недостаточно, чтобы получить в настройках “Very High” идеально плавную игру даже в разрешении 1680×1050. Для этого необходимо определённо перейти в конфигурацию CrossFire.
Поскольку S.T.A.L.K.E.R. поддерживает сглаживание только до 4x, у нас появилась возможность нагрузить видеокарты сильнее. Поэтому мы решили протестировать Crysis со сглаживанием 8x MSAA.
На самом деле, мы надеялись на больший прирост от перехода с 4870 X2 на 5870. Однако новая видеокарта всё равно оказалась быстрее, что неплохо. Опять же, мы наблюдаем приятный прирост от перехода с одиночной 4890 на одиночную 5870, но для действительно плавной игры лучше взять пару 5870 в конфигурации CrossFire, где она способна выдать больше 50 кадров в секунду в среднем.
Одиночная GeForce GTX 285 уступает ATI Radeon HD 4890, поэтому неудивительно, что 5870 легко оставляет позади самую быструю видеокарту nVidia с одним GPU. Мы даже получим приличную производительность в разрешениях 1680×1050 и 1920×1200 на двух 5870 в CrossFire.
Обратили внимание на отсутствующие результаты nVidia GeForce GTX 295 в разрешении 2560×1600 со сглаживанием 8xAA? Это связано с тем, что видеокарта не имеет достаточно интегрированной памяти, чтобы работать с подобной конфигурацией (и игра даже не знает об этом). Например, в Grand Theft Auto эта проблема решается тем, что некоторые разрешения будут просто недоступны, если у видеокарты недостаточно памяти. Crysis же “вылетает”.
Far Cry 2
Мы были несколько удивлены тем, что игра Far Cry 2 отдала предпочтение Radeon HD 4870 X2 по сравнению с ATI Radeon HD 5870. nVidia GeForce GTX 295 тоже обгоняет новинку AMD с одним GPU. Но GeForce GTX 285 уже не дотягивает по производительности (впрочем, это не вызывает проблем, поскольку GTX 285 всё равно способна обеспечить более 50 кадров в секунду даже в разрешении 2560×1600).
В отличие от Crysis, где ATI не очень хорошо масштабируется при переходе от одной на две Radeon HD 5870, технология совместной работы нескольких GPU показывает себя здесь намного лучше, почти удваивая производительность. nVidia тоже даёт хорошую масштабируемость SLI при переходе от одной GeForce GTX 285 на две, но при переходе на разрешение 2560×1600 разница между конкурентами составляет уже почти 40 fps.
Как можно видеть, мы провели тесты Far Cry 2 в качестве Ultra Quality. Но даже в нём видеокарта Radeon HD 4870 1GB даёт вполне плавную производительность вплоть до разрешения 1920×1200. Включение сглаживания должно дать весьма ощутимое влияние на графическую производительность.
Действительно, включение 8xAA сглаживание на видеокартах весьма существенно повлияло на производительность. Видеокарты из линейки Radeon HD 4800 с одним GPU уже не дают достаточно плавную игру в любом разрешении, и даже 4870 X2 начинает “захлёбываться” в 2560×1600. Видеокарты nVidia показывают себя намного лучше, и GeForce GTX 285 – единственная видеокарта, которую можно назвать медленной в разрешении 2560×1600.
Здесь мы опять можем наблюдать влияния улучшений, которые реализовала AMD в области сглаживания. На предыдущей диаграмме видеокарта Radeon HD 5870 сдала свои позиции 4870 X2. Сейчас же 5870 уверенно вышла вперёд, а пара новых видеокарт дают просто превосходную производительность, позволяя комфортно играть даже в разрешении 2560×1600. Две GTX 285 не могут дотянуться до новинок AMD, но следует отметить, что вы получите вполне комфортную производительность в разрешении 2560×1600 даже на паре самых быстрых видеокарт nVidia с одним GPU. AMD неплохо поработала над производительностью своих продуктов в высоких разрешениях с повышенными опциями качества.
Left 4 Dead
Почти не имеет смысла анализировать производительность в Left 4 Dead без активного полноэкранного сглаживания. Наш 4-ГГц процессор обладает немалым потенциалом, но мы наблюдаем явный потолок: в него упираются одна и две видеокарты Radeon HD 5870, а также GeForce GTX 295 и GeForce GTX 285 в SLI.
Самая слабая по производительности видеокарта ATI Radeon HD 4870 1GB всё равно даёт больше 60 кадров в секунду в разрешении 2560×1600, поэтому давайте перейдём к изучению результатов со сглаживанием.
Здесь можно вполне комфортно играть в разрешениях 1680×1050 и 1920×1200 на всех видеокартах, так что давайте сфокусируемся на 2560×1600. Видеокарты Radeon HD 4870, 4890 и GeForce GTX 285 дают производительность в данном шутере меньше 60 fps. Одиночная Radeon HD 5870 смогла обойти Radeon HD 4870 X2, а также nVidia GeForce GTX 295, но пара GTX 285 оказывается всё же быстрее. Впрочем, не стоит унывать: пара Radeon HD 5870 обходит все видеокарты nVidia в конфигурации SLI на нашем 4-ГГц процессоре.
World In Conflict
Без активных сглаживания и анизотропной фильтрации мы вновь сталкиваемся с ситуацией, когда все восемь протестированных конфигураций дают больше 60 кадров в секунду в разрешениях 1680×1050 и 1920×1200. Да и даже красные полоски (2560×1600) говорят о том, что “медленной” Radeon HD 4870 будет достаточно для игры World in Conflict.
Следует, однако, отметить, что Radeon HD 5870 уступает в этой игре Radeon HD 4870 X2 и GeForce GTX 295. Для победы новинок AMD требуется работа пары видеокарт, но даже при этом две GeForce GTX 285 отстают не так сильно.
nVidia позволяет выставить намного больше опций сглаживания в World in Conflict, но AMD ограничивается только 4x сглаживанием, поэтому мы и выбрали такую настройку. Опять же, обе видеокарты с двумя GPU обходят Radeon HD 5870 во всех трёх разрешениях. CrossFire работает в паре с новым графическим ядром Cypress достаточно хорошо, почти удваивая производительность, позволяя новым видеокартам обойти две GeForce GTX 285.
H.A.W.X.
Эта игра стала одной из тех, с которыми AMD продвигала DirectX 10.1, поэтому мы тестировали видеокарты AMD как раз в режиме DirectX 10.1. Но одиночная Radeon HD 5870 в данной игре не демонстрирует такой же уровень превосходства, как, например, в Far Cry 2. Вместо этого одиночная видеокарта еле обгоняет nVidia GeForce GTX 285, и при этом довольно плохо показывает себя по сравнению с Radeon HD 4870 X2 и GeForce GTX 295.
SLI, конечно, значительно улучшает производительность двух GeForce GTX 285, но CrossFire усиливает две 5870 ещё больше, почти удваивая частоту кадров во всех протестированных разрешениях. В итоге одиночная Radeon HD 5870 здесь не очень впечатляет, но две видеокарты дают непревзойдённую производительность вплоть до 2560×1600.
Улучшения в области сглаживания прекрасно показывают себя после включения режима 8x, и хотя одиночная Radeon HD 5870 не впечатляет в разрешениях 1680×1050 или 1920×1200, переход на 2560×1600 приводит к потере приемлемой частоты кадров на других видеокартах, а 5870 всё равно выдаёт больше 40 кадров в секунду – весьма неплохо для подобного авиасимулятора.
Конечно, настоящая магия наблюдается при добавлении второй видеокарты 5870 – частота кадров взлетает до 75 fps.
Обратите внимание на отсутствующий результат GeForce GTX 295 в разрешении 2560×1600 – ещё одно свидетельство того, что 896 Мбайт памяти GDDR3 на каждый GPU уже недостаточно для подобного требовательного режима. Здесь нужны видеокарты с объёмом памяти, как минимум, 1 Гбайт. Они справляются с подобным высоким разрешением и уровнем сглаживания, а GeForce GTX 295 – уже нет.
Resident Evil 5
Мы провели немало времени за тестами демо-версии игры Resident Evil 5, выпущенной специально для очков nVidia GeForce 3D Vision, при этом мы привели результаты тестов в статье, посвящённой выходу Core i5/Core i7, а также опубликовали отдельный материал с результатами тестов разных видеокарт в Resident Evil 5. nVidia явно оказывает довольно большое влияние на разработку портов с приставок, и это сразу же видно. Мы полагали, что AMD требуется немного доработать драйвер, чтобы эта игра шла достаточно хорошо. На сей раз мы использовали розничную версию игры, и видеокарты AMD показали себя значительно лучше в прогоне DirectX 10.
Мы вновь видим, что Radeon HD 4870 X2 и GeForce GTX 295 обходят новичка ATI Radeon HD 5870. Однако мы всё равно получаем частоту кадров, которая позволяет вполне комфортно играть вплоть до разрешения 2560×1600 на всех видеокартах. Приятно видеть, что проблемы производительности в прогоне DirectX 10, которые мы наблюдали в демо-версии игры с видеокартами AMD, уже не проявляют себя в финальной версии Resident Evil 5 с драйвером Catalyst 9.9.
Включение 8xAA сглаживания негативно влияет на производительность, но даже Radeon HD 4870 выдаёт всегда больше 40 кадров в секунду. Radeon HD 5870 пытается догнать видеокарту 4870 X2, но два GPU всё же дают преимущество. Впрочем, новинка AMD всё равно обгоняет nVidia GeForce GTX 295 в разрешениях 1920×1200 и 2560×1600. Неудивительно, что после объединения пары видеокарт 5870 вместе они оказываются просто непревзойдённым, выдавая больше 110 кадров в секунду в разрешении 2560×1600 с 8xAA сглаживанием. Фактически, две видеокарты 5870 в режиме CrossFire достаточно хороши, чтобы упереться в 4-ГГц процессор Core i7 в разрешениях 1680×1050 и 1920×1200 – с самой высокой детализацией и сглаживанием 8xAA. Не так давно об этом мы даже и не мечтали.
Grand Theft Auto IV
Grand Theft Auto IV – одна из портированных с приставок игр, которые всегда склоняются в пользу видеокарт nVidia. Здесь мы видим, что все видеокарты дают приемлемую производительность в разрешении 1680×1050 и, по большей части, в 1920×1200. Единственная ситуация, когда мы наблюдаем серьёзную разницу, появляется при подъёме разрешения до 2560×1600.
В данном случае две Radeon HD 5870 в CrossFire будут совсем не лишними, да и две GeForce GTX 285 обеспечивают больше 60 кадров в секунду. Одиночная 5870 обгоняет GeForce GTX 285, но ненамного.
Что же случилось с GTX 295? Это вновь один из случаев, когда 896 Мбайт памяти на GPU оказывается недостаточен. Карте не хватает памяти GDDR3 в разрешении 2560×1600 с выбранными нами настройками детализации. Урок оказывается весьма важным. То есть, хотя GTX 295 и является топовой видеокартой в линейке nVidia, это не означает, что она хорошо справляется с любой работой. Если перейти на высокие режимы детализации и настройки, то потребуется, как минимум, 1 Гбайт памяти на GPU, таким образом, даже 100 Мбайт памяти имеют значение.
Энергопотребление
Помните, что видеокарты из семейства nVidia GeForce GTX 200 оказались настолько эффективны по энергопотреблению в режиме бездействия, что компания решила полностью отказаться от технологии HybridPower всего после одного поколения её использования? Что же случилось с энергопотреблением?
Мы видели результаты под Windows Vista, где nVidia GeForce GTX 285 и GTX 260 Core 216 потребляют примерно на 20 Вт меньше, чем ATI Radeon HD 4870 1GB. Однако в тестах Windows 7 видеокарты потребляют примерно на 15 Вт больше, чем старые модели AMD.
На данный момент у нас нет результатов энергопотребления, которые сравнивали бы видеокарты GeForce в Windows Vista с Windows 7 (это тема отдельного будущего обзора), но по результатам тестов новых процессоров Intel Core i5 и Core i7 для LGA 1156 мы знаем, что под Windows 7 энергопотребление существенно отличается от Vista, и вполне можно допустить, что более сложная настольная схема Windows 7 нагружает видеокарты nVidia сильнее, чем под Vista, а у видеокарт AMD подобный рост энергопотребления не наблюдается. Незадолго перед выходом новых видеокарт AMD nVidia выслала нам бета-версию последних драйверов, где должны быть исправлены потенциальные проблемы с энергопотреблением в режиме бездействия. Мы попробовали эти драйверы и получили прежние результаты, поэтому проблема явно не в драйверах.
В любом случае, есть более важные новости: энергопотребление Radeon HD 5870 в режиме бездействия упало на впечатляющие 42 Вт меньше по сравнению с Radeon HD 4870 в прошлом году. Более того, добавление второй видеокарты Radeon HD 5870 привело к росту энергопотребления в режиме бездействия всего на 24 Вт (причём две видеокарты в режиме бездействия потребляют меньше энергии, чем одна Radeon HD 4870).
Запуск теста FurMark для нагрузки показал нам, что даже на технологии 40 нм для питания 2,15 млрд. транзисторов требуется немало энергии. Одиночная Radeon HD 5870 потребляет примерно на 25 Вт больше энергии, чем Radeon HD 4890 под нагрузкой. Добавление второй видеокарты в режим CrossFire увеличивает энергопотребление ещё на 207 Вт, что даёт в сумме 561 Вт для системы. Что интересно, это на 71 Вт больше, чем у Radeon HD 4870 X2, и на 79 Вт меньше, чем у GeForce GTX 295. Самой “прожорливой” является пара GeForce GTX 285 в SLI, энергопотребление у которой возрастает до 620 Вт.
Эффективность
Как AMD удалось снизить энергопотребление Radeon HD 5870 в режиме бездействия до 27 Вт, если Radeon HD 4870 потреблял до 90 Вт? Самое очевидное улучшение кроется в уменьшении тактовой частоты в режиме бездействия. На рабочем столе Windows 7 образец 5870 снижает частоты до 157 МГц для ядра и 300 МГц для памяти. Для сравнения Radeon HD 4870 снижал частоты всего до 500/900 МГц.
Видеокарта | Частоты в режиме бездействия (ядро/память) | Частоты в режиме 3D (ядро/память) |
ATI Radeon HD 5870 | 157/300 | 850/1200 |
ATI Radeon HD 4870 X2 | 507/500 | 750/900 |
ATI Radeon HD 4890 | 240/975 | 850/975 |
ATI Radeon HD 4870 | 520/900 | 750/975 |
Nvidia GeForce GTX 295 | 300/100 (600 МГц для шейдеров) | 576/999 (1242 МГц для шейдеров) |
Nvidia GeForce GTX 285 | 300/100 (600 МГц для шейдеров) | 648/1242 (1476 МГц для шейдеров) |
Под нагрузкой Cypress обладает большим энергопотреблением, чем предшествующая модель. Однако AMD реализовала прямую связь между стабилизатором напряжения (VRM) и GPU, чтобы последний получал информацию о текущем состоянии и если нужно включал троттлинг, пока плата не вернётся в пределы спецификаций по энергопотреблению. Мы обсудим это чуть ниже, но при работе двух плат 5870 в режиме CrossFire нам удалось включить динамическую защиту.
Говоря о CrossFire, если у вас две 5870 работают в режиме бездействия, то AMD утверждает, что вторая видеокарта переход в режим ультранизкого энергопотребления (предположительно меньше 20 Вт). Мы получили прирост энергопотребления на 25 Вт после установки второй видеокарты в режиме бездействия, что весьма неплохо, если учесть, что пара 4870 по спецификациям потребляет 180 Вт.
Температура и уровень шума
Когда мы начинаем рассматривать топовые видеокарты, то необходимо учитывать проблемы тепловыделения и шума – всё это является следствием сложных GPU, высоких тактовых частот и серьёзной нагрузки при выполнении синтетических 3D-тестов.
Нагретый воздух выбрасывается через отверстия сзади видеокарты. Нажмите на картинку для увеличения.
Мы начнём с видеокарты nVidia GeForce GTX 285. Если установить одну такую видеокарту в компьютер, то всё будет просто превосходно. Установите пару на материнскую плату на чипсете X58, например, на Asus Rampage II Extreme (когда слоты разнесены как раз настолько, чтобы можно было устанавливать двухслотовые видеокарты), и начнутся проблемы. Нам пришлось вручную выставить скорость вращения вентилятора на 100% для обеих видеокарт, чтобы они не “вылетали” в таких играх, как S.T.A.L.K.E.R., где скорости вращения вентилятора просто не хватало. На полных оборотах мы получили стабильную работу, зато уровень шума составил больше 54 дБ(А).
Нельзя сказать, что GeForce GTX 295 ведёт себя совсем уж лучше. Фактически, после нагрева до 99 градусов в тесте FurMark, мы остановили наше тестирование уровня шума, опасаясь “поджарить” видеокарту (в комнате уже начал появляться запашок). Уровень шума платы на момент её выключения составил 54,6 дБ(А).
Однако самой громкой в наших тестах оказалась пара Radeon HD 5870, она выдавала 54,7 дБ(А), что зафиксировал шумометр Extech 407768. Эти видеокарты достигли температуры 100 градусов Цельсия, после чего они включали троттлинг, температура падала до 99 градусов, а затем возрастала до 100 градусов. Впрочем, в закрытых корпусах следует быть осторожным в другом – нужно следить за подъёмом температуры воздуха внутри корпуса. У Radeon HD 5870 слотовая заглушка имеет очень небольшое отверстие для выброса воздуха, и половина нагретого воздуха поступает внутрь корпуса ПК.
Оверклокерам – особенно тем, кто купил больше одной видеокарты Radeon HD 5870 – следует быть осторожным при решении вопроса охлаждения, поскольку 5870 ведёт себя несколько иначе, чем любые другие high-end видеокарты AMD (больше напоминая GeForce GTX 295, которая также выбрасывает очень горячий воздух внутрь корпуса ПК).
В режиме бездействия одна Radeon HD 5870 лишь чуть громче своего предшественника – на уровне GeForce GTX 285 в SLI, но тише одной GeForce GTX 295. Больше всего нас впечатлила Radeon HD 4870 1GB, которая оказалась заметно менее шумной, чем любая другая видеокарта в режиме бездействия, пусть даже от GTX 285 отрыв составляет 0,6 дБ(А).
Заключение
Как правило, при выпуске продуктов такой величины появляются совершенно противоположные мнения – одни от компании, которая производит данные видеокарты, а другие – от конкурента. AMD считает, что DirectX 11, потоковые вычисления и Eyefinity являются замечательной комбинацией “убойных” функций видеокарты следующего поколения. Конечно, мнение nVidia сегодня совершенно противоположное (по крайней мере, пока не появятся видеокарты с поддержкой DirectX 11 от nVidia), на первом месте она ставит CUDA и поддержку собственного стандарта PhysX.
Впрочем, в чём обе компании соглашаются, так это в том, что первые обзоры, подобные нашему, показывают то, как Radeon HD 5870 работает в нынешних приложениях, а не то, на что способна видеокарта, судя по своим спецификациям, нацеленным на будущее. К сожалению, большую часть потенциала Cypress нам ещё предстоит раскрыть. Мы по-прежнему желаем узнать, окажет или нет DirectX 11 более существенное влияние, чем мы наблюдали во время появления DirectX 10 или 10.1. Нам предстоит дождаться, пока сторонние разработчики выпустят продукты с поддержкой DirectCompute и OpenCL – пока не существует тестов, способных оценить, насколько хорошо Cypress поддерживает DirectCompute, если верить AMD. И нам ещё предстоит дождаться продуктов независимых разработчиков, которые смогут реализовать поддержку защищённого звукового пути для передачи закодированного потока (bitstream) Dolby TrueHD и DTS-HD Master Audio на совместимые ресиверы.
К счастью для AMD, даже если мы будем использовать нынешние игры для оценки Radeon HD 5870, видеокарта всё равно доминирует над своими конкурентами. Плата постоянно обгоняет nVidia GeForce GTX 285, состязается с Radeon HD 4870 X2 с попеременным успехом, а иногда выходит вперёд даже GeForce GTX 295.
Если посмотреть на цену $379, то Radeon HD 5870 находится между GeForce GTX 295 и Radeon HD 4870 X2 (при уровне $500 у nVidia нет другого выхода, как снижать цены на GTX 295). Если судить просто по производительности, то видеокарта очень конкурентоспособна. Впрочем, у AMD есть ряд функций, которыми можно насладиться уже сегодня. Добавьте Eyefinity, поддержку CrossFire, энергопотребление в режиме бездействия на уровне одной трети от предшественника, и новый флагман AMD уже одерживает вполне внушительную победу, даже если не учитывать функции и преимущества, которые проявят себя в будущем. Никогда не задумывались, зачем нужна столь высокая вычислительная мощность (и у вас нет 30″ дисплея)? Тогда просто поиграйте на трёх 20″ или 24″ дисплеях. Это как раз прекрасно нагрузит новые GPU и даст вам ощущение от игры, которое вы никогда не испытывали.
Без сомнения AMD вновь удалось получить “корону производительности” одиночного GPU, поскольку Radeon HD 5870 даёт прекрасную производительность в современных играх, а также обеспечивает и дополнительные функции, которые разработчики наверняка будут использовать в будущих играх. Но не пропустите мимо видеокарту Radeon HD 5850. Она позволит насладиться новой архитектурой Cypress даже геймерам со скромным бюджетом. Затем появятся видеокарты 5870 X2 и довольно инновационная модель Eyefinity6 Edition.