Введение
Линейка видеокарт AMD ATI Radeon HD 5000 появилась как снег на голову, причём сразу же заняла весьма приличные позиции в тестах. Если вам интересны результаты тестов и полное техническое описание, то рекомендуем ознакомиться с обзором Radeon HD 5870. Конечно, приятно видеть, что компания вернулась в лидеры рынка, но факт остаётся в том, что многие геймеры не могут позволить себе выложить больше $350 за карту своей мечты, а тем более за две в конфигурации CrossFire.
На самом деле есть две категории энтузиастов: те, которые покупают самые новейшие и производительные продукты, неважно по какой цене, а также те, кто ждёт, когда технологии, которые ещё вчера были самыми передовыми, будут продаваться по значительно сниженным ценам. Мы не хотели обойти вниманием вторую группу, поэтому решили вернуться к бывшим моделям AMD для массового рынка 4670 и 4650. Почему? Всё дело в том, что видеокарты на основе HD 5870 сегодня продаются от $379 (от 19 тыс. рублей в России), а модели 4670 и 4650 можно найти за $55 (от 2100 руб.) и $67 (от 1400 руб.), соответственно.
Если вы хотите получить 80% технологий ATI за сравнительно мизерную цену, то эта статья для вас. Как мы думаем, всё же есть хорошие причины покупать немного устаревшие видеокарты.
Разница поколений
Если вы планируете покупку видеокарты, то наверняка не начинаете “с нуля”. Возможно, вы планируете улучшить компьютер трёхлетнего возраста, которые столь распространены среди обычных пользователей. Что ж, три года назад компания ATI (пока ещё независимая от AMD) только выпустила модели Radeon X1950, причём вариант XTX стоил около $450. В то время всем ещё нужна была максимальная скорость, пропускная способность, игровые функции. Журналисты подчёркивали тот факт, что видеокарты XTX перешли на память GDDR4, хотя старые модели X1950 использовали 256-битную шину с памятью GDDR3. Чипы изготавливались по 90-нм техпроцессу, в качестве интерфейса видеокарт использовался, как правило, слот PCI Express x16, а с программной стороны поддерживались библиотеки DirectX 9.0c и OpenGL 2.0. Игры использовали традиционные архитектуры видеокарт и просто должны были работать как можно быстрее.
Но всё заметно изменилось за несколько лет. Как мы уже видели в случае CPU, графические процессоры сделали несколько архитектурных прорывов. И новой целью далеко не всегда была борьба за очень высокие тактовые частоты. Если сделать ядра более эффективными, когда они смогут лучше реализовывать параллельные вычисления, то и общая производительность увеличится. Например, в 2007 году, с появлением линейки HD 2000, ATI сделала шаг в сторону унифицированных шейдеров на настольных GPU. Шейдер – это маленькая программа, которая запускается, как правило, для выполнения задачи рендеринга графики. Например, вершинные шейдеры могли менять форму объекта, а пиксельные шейдеры могли накладывать текстуры на отдельные пиксели. Внутри GPU разработчики выделяли специальные блоки для выполнения подобных шейдеров. В X1950 были интегрированы блоки для выполнения восьми вершинных шейдеров и 48 пиксельных шейдеров. Недостатком подобной архитектуры было то, что, например, если приложение требовало выполнения значительного количества вершинных операций, но не очень большого числа пиксельных операций, то все восемь блоков вершинных шейдеров работали бы под полной загрузкой, а блоки пиксельных шейдеров по большей части бы простаивали. В линейке HD 2000 появились унифицированные программируемые шейдеры, поэтому любой блок шейдеров мог выполнять любые подходящие шейдеры: вершинные, пиксельные. Видеокарты среднего уровня в линейке HD 2000 показали выполнение задач, чувствительных к вершинным шейдерам, за меньшее время, чем X1950 XTX, несмотря на меньшие тактовые частоты и меньшую цену.
Нажмите на картинку для увеличения.
Схожие улучшения появились и в других областях GPU. Архитектура с кольцевой шиной, которая впервые была реализована с X1000, эволюционировала, расширилась и “выросла” для работы с шиной PCI Express, позволяя более эффективно обмениваться данными с системой. Шина PCI Express тоже перешла с версии 1.0 на 2.0, удвоив пропускную способность интерфейса. Поддержка графических библиотек тоже обновилась до DirectX 10.1 и OpenGL 3.0. Когда компания AMD/ATI добралась до производства чипов 4650/70 (кодовое название RV730), техпроцесс снизился до 55 нм, а число транзисторов внутри каждого процессора “взлетело” до 514 миллионов – более чем в пять раз больше, чем 80-90 миллионов в графических процессорах X1950, вышедших всего на пару лет раньше.
Что же AMD сделала со всеми этими дополнительными транзисторами? Об этом мы сейчас и поговорим.
Вместо интегрированного GPU
Второй вероятный сценарий апгрейда – если ваша система использует интегрированную графику, а не дискретную видеокарту, то есть графическое ядро встроено в чипсет на материнской плате. Обычно пользователи считают интегрированное графическое ядро “бесплатным”, поскольку оно уже входит в цену материнской платы (у некоторых ноутбуков графические ядра тоже встроены на материнскую плату, но располагаются отдельно от чипсета, но мы можем игнорировать такую конфигурацию, поскольку рассматриваем настольные ПК. Ситуация усложнится в ближайшие год-два, когда графические ядра перейдут с северного моста напрямую на кристалл CPU). Но подобная “халява” часто приводит к тому, что вы получаете именно то, за что заплатили.
Интегрированные графические ядра отстают на год или больше по сравнению со своими дискретными аналогами по технологиям или производительности. Например, когда настольный чип RV730 был представлен в сентябре 2008 года, AMD только что закончила новое графическое ядро 790GX IGP (integrated graphics processor). Если у HD 4650 использовалось 320 унифицированных графических процессоров (так тоже называют блоки шейдеров), в графическом движке HD 3300, встроенном в чипсет 790GX, их было только 40, не говоря уже о значительно уменьшенном числе транзисторов и зависимости от относительно медленной системной памяти в отличие от выделенной графической памяти.
Нажмите на картинку для увеличения.
Следует учитывать и то, что графическое ядро 790GX все ещё является одним из лидеров на рынке интегрированной графики. Лидер по объёму продаж IGP Intel тоже существенно модернизировала свои графические ядра, но даже последняя модель GMA X4500HD в северном мосту G45 поддерживает только 10 блоков унифицированных шейдеров. В общем, здесь всё просто: интегрированные графические ядра нацелены на системы, где вы будете запускать обычные приложения, выполнять какие-то задачи в Интернете, возможно, иногда вам захочется поиграть в какую-нибудь “лёгкую” игру. Только относительно недавно интегрированные графические ядра стали поддерживать аппаратное декодирование видео высокого разрешения, включая фильмы на Blu-ray, не превращая фильм на ПК в слайдшоу, а количество доступных ресурсов, доступных для других задач при этом, зависит от модели графического процессора.
Давайте подведём промежуточный итог. За минувшие год или два изменилось очень многое. Диски Blu-ray уже находятся на этапе проникновения на массовый рынок. Домашние кинотеатры приобретают популярность, да и доступного контента в Интернете становится всё больше. Да и по мере распространения HD-видеокамер увеличивается потребность в просмотре и перекодировании видео высокого разрешения. Иногда всё сводится к удобству и эффективности. Системы возрастом два или три года обычно могут справиться с такими задачами, но на какие компромиссы придётся пойти? Будет ли система заниматься этой задачей многие часы, не позволяя выполнять ничего другого? Придётся ли при этом смириться с мешаниной проводов и переходников? Не будет ли качество значительно хуже? Если существующая в вашей системе графика, будь то интегрированная или дискретная, устарела, то она может влиять на качество и скорость работы разных мультимедийных задач. Не настали ли время выполнить обновление?
Нажмите на картинку для увеличения.
Radeon HD 4650/4670: базовые спецификации
Мы уже обсудили некоторые спецификации RV730, но важно на минутку сделать паузу и посмотреть на ситуацию в перспективе. Рынок видеокарт движется вперёд столь быстро, что легко запутаться в числах. Например, у HD 4670 чистая производительность в GFLOPS (миллиарды операций с плавающей запятой в секунду) составляет 480, а у новых видеокарт HD 5870 она увеличилась до уровня 2720 GFLOPS. Поэтому можно предположить, что 4670 даёт всего 15-20% от производительности 5870, поэтому она и стоит на уровне 10-20% от 5870? Предположение совершенно ошибочное.
Конечно, если ваша единственная цель заключается в выполнении операций, интенсивно использующих числа с плавающей запятой, или вы хотите получить высокие числа в тестах 3DMark, то тогда, конечно, 4670 даст небольшой уровень производительности по сравнению с новыми флагманами. С другой стороны, 4670 стоит меньше 20% от цены 5870, так что даже в этих тестах вы получите то, за что заплатили. Впрочем, не забывайте, что ПК на массовом рынке не нацелены на запуск единственной программы. Мы используем их для игр, конечно, но также есть и немало других задач. И с учётом других задач мы неизбежно приходим к аналогии Ford Focus против Ferrari. Если вы ограничены в городе скоростью 40 или 60 км/ч, то какое имеет значение скоростной порог, которого автомобиль может достигать выше этого уровня? Видеокарта 4650 даст такую же производительность при работе в Интернете, офисных приложениях и проигрывании MP3, что и видеокарта 5870, несмотря на разницу в цене. То есть спецификации важны, но всегда стоит смотреть на них с перспективы использования ПК.
Но давайте добавим некоторые числа. Как уже упоминалось ранее, графический процессор RV730 производится по 55-нм техпроцессу, при этом он обладает интерфейсом PCIe 2.0, хотя существуют видеокарты с поддержкой старого интерфейса AGP 8X. Модели 4650 и 4670 оснащаются 512 Мбайт или 1 Гбайт памяти, но что более важно, так это тип памяти. Графический процессор 4650 может использовать память DDR2 или GDDR3 на частоте до 700 МГц, а 4670 – память DDR2, DDR3, GDDR3 или GDDR4 на частоте до 1100 МГц. Конечно, всё это даёт преимущество по пропускной способности памяти в случае 4670 до 57%, хотя практическая значимость будет зависеть от того, насколько ваши приложения зависят от видеопамяти.
Нажмите на картинку для увеличения.
Другие отличия между двумя чипами кроются в тактовых частотах GPU. Графический процессор HD 4650 работает на частоте 600 МГц, а 4670 – на 750 МГц. Это приводит и к разнице в тепловыделении, поскольку тепловой пакет (TDP) у 4650 составляет 48 Вт, а у 4670 он увеличен до 59 Вт. Конечно, разница в 11 Вт кажется не такой большой, но если вы модернизируете систему со слабым блоком питания, то 11 Вт как раз могут привести к потере стабильности и случайным перезапускам.
Radeon HD 4650/4670: визуальное качество
Как мы уже упоминали выше, пользователей всё чаще интересует, может или нет ПК справиться с воспроизведением данного фильма, а также какие другие операции он при этом может выполнять. Иногда достаточно просто посчитать. Например, если воспроизведение диска Blu-ray потребляет 90% доступных ресурсов CPU, то всё плохо. Системы хватит только на эту задачу, да и то при этом возможно появление рывков. С другой стороны, если воспроизведение Blu-ray отнимает всего 35% доступных ресурсов CPU, то в фоне можно выполнять какие-либо другие задачи, такие как перекодирование видео для портативного плеера или запись передачи с ТВ-тюнера. Как правило, нежелательно увеличивать нагрузку на CPU выше уровня 70-80%, поскольку всё равно будут появляться пики нагрузки, которые приведут к подтормаживанию в приложениях, плохой системной отзывчивости или, что бывает реже, даже краху системы.
Многие годы производители графических процессоров пытаются повысить значимость своих решений, перенося как можно больше нагрузки с CPU на GPU. На самом деле эта тенденция характерна даже для десяти последних лет, когда декодирование MPEG-2 было впервые перенесено на соответствующий блок в графическом процессоре. Но в последние годы мы наблюдаем, что кодеки высокого разрешения (MPEG-2, WMV9, VC-1 и H.264) получают собственную аппаратную поддержку в GPU. До недавнего времени воспроизведение видео 1080p на средних ПК было вообще невозможно, поскольку у CPU просто не хватало ресурсов для выполнения этой задачи в реальном времени.
Мы не хотим сказать, что декодирование HD-видео – единственная область, в которой может помочь GPU. Даже до появления HD-видео многие пользователи выполняли на ПК просмотр DVD и потокового видео. К сожалению, видео на ПК в первые годы нынешнего десятилетия выглядело весьма слабо. Многие технологии обработки сигнала, которые появились в бытовых DVD-плеерах, пока ещё не поддерживались в плеерах для ПК. Но со временем ATI и другие игроки рынка внедрили и доработали такие функции, как адаптивный деинтерлейсинг, повышение резкости, улучшение цветопередачи, подавление “шума” и другие улучшения пост-обработки. Кстати, ATI собирает все эти улучшения под маркетинговым названием Avivo. Ещё до появления HD-видео поддержка таких улучшений значительно повышала визуальное качество видео.
Нужна ли сегодня поддержка Avivo? Конечно. Пользователи хотят получить высокое качество воспроизведения потокового видео или дисков с фильмами, а многие старые системы возрастом три-четыре года (или даже год-два, если используется интегрированная графика) могут быть лишены поддержки технологий, подобных Avivo, которые бы вносили упомянутые улучшения. Итог таков: если вы планируете смотреть на вашем ПК фильмы, то наверняка вам больше по душе придётся контент, который будет улучшен с таким технологиями пост-обработки, как Avivo.
Не так давно ATI перешла на технологию Avivo HD, что добавило поддержку HDMI, позволив подключать компьютер напрямую к плоскопанельным телевизорам с HDMI и ресиверам (ATI первой реализовала поддержку передачи цифрового видео и аудио через один порт HDMI). Движок Unified Video Decoder (UVD) тоже присутствует вместе с Avivo HD в современных GPU AMD, причём последнее обновление UVD 2.x в линейке HD 4000 позволило движку выполнять практически всю работу по декодированию потоков H.264, AVC и VC-1. Реализация AMD также предусматривает одновременное декодирование двух потоков, так что пользователи получат поддержку функции “картинка в картинке”, а также полную поддержку BD-Live.
Нажмите на картинку для увеличения.
В общем, если вы хотите получить все последние функции по ускорению воспроизведения видео и визуальным улучшениям на вашем ПК, то видеокарты HD 4650 или 4670 позволят это сделать по вполне доступной цене. Разница в качестве по сравнению со старыми видеокартами просто поражает.
Поддержка Stream
Мы уже описали, как унифицированные шейдеры могут справляться с разными задачами, которые раньше выполнялись только на специально выделенных блоках. Данная концепция программируемости блоков шейдеров, известная под названиями HyperDrive или “general-purpose GPU computing” (GPGPU) постепенно переходит из научного мира в область потребительских компьютеров. Идея здесь примерно такая же, что и при переносе нагрузки по декодированию видео с CPU на GPU. Что может сделать GPU для CPU? И, в случае потоковых вычислений, какую работу GPU может сделать лучше?
Помните 320 потоковых процессоров в графических ядрах HD 4650 и 4670? Любое нужное число из этих процессоров можно программировать “на лету” для выполнения разных задач, которые могут быть никак не связаны с графикой или видео. После вычисления нужных данных их можно экспортировать и комбинировать с другими данными, которые были вычислены CPU. По информации AMD, программное обеспечение, которое может выиграть от потоковых вычислений на GPU, обеспечивает два ключевых преимущества: “1. Более высокую степень арифметических вычислений на один запрос к оперативной памяти. 2. Вычислительную независимость – арифметические вычисления, которые выполняются на каждом вычислительном блоке, не требуют сверки или верификации с арифметическими вычислениями, выполняющимися на любом другом вычислительном блоке”.
Ранним и довольно экстремальным примером можно считать вычислительный проект Folding@home Стэнфордского университета, в котором массивная задача молекулярного анализа разбивается на небольшие задачи, которые можно отослать на компьютеры конечных пользователей, вычислить, после чего результат будет загружен на центральные серверы для обработки. Когда в проекте участвуют многие тысячи ПК, команда Стэнфорда может обрабатывать больше данных, чем в одной серверной комнате. Из-за массивной параллельной вычислительной архитектуры графических процессоров AMD, системы с GPU, поддерживающими технологии GPGPU (ту же ATI Stream), могут выполнять задачи Folding@home в 20-40 раз быстрее по сравнению со сценариями “только CPU”.
Конечно, приложение Folding@home интересно и полезно, но оно всё же не относится к массовому рынку. Зачем нужна поддержка GPGPU обычному пользователю? Затем, что сегодня всё большее число мультимедийных приложений, включая MediaShow Espresso и PowerDirector в версиях 7 и 8 от CyberLink, могут использовать технологию ATI Stream для монтажа видео на потребительском уровне и для задач перекодирования, обеспечивая более серьёзный прирост производительности, чем при использовании только CPU. Мы рекомендуем обратиться к отдельной статье об ATI Stream, если вы хотите узнать об этой технологии подробнее.
Нажмите на картинку для увеличения.
Кроме того, AMD указывает и на то, что этой осенью усилия по поддержке GPGPU охватят и инициативу DirectCompute от Microsoft. Марка Stream наверняка останется, при этому она будет как-то привязана к DirectCompute, но на сегодня мы не знаем о публично доступных приложениях, поддерживающих DirectCompute (совместимых с линейкой ATI Radeon HD 58xx), в то время как мы знаем несколько интересных примеров приложений, поддерживающих технологию ATI Stream в графических процессорах HD 4650 и 4670. Если вы работаете с видео, то подобная поддержка GPGPU должна сэкономить многие часы рендеринга.
Примечания по производительности
Конечно, мы сказали о том, что не следует ожидать чудес от видеокарт 4650 и 4670 по сравнению с новыми моделями 58xx. Но что, если посмотреть с другой стороны? Что если у вас используется старая видеокарта или интегрированное графическое ядро – какой прирост вы получите от вложения 1,5-2 тысяч рублей? Сравнивать старые и новые решения напрямую бывает сложно, поскольку слишком много вариаций. Но какие-то общие выводы сделать можно.
Если перейти к тестам видеокарт, то HD 4670 покажет 8095 баллов в 3DMark06 v1.1.0. А бывший флагман X1950 XTX – всего 6723 балла. Но даже более свежая видеокарта среднего уровня HD 2600 XT даёт всего 4883 балла. Если же вы сэкономили деньги на раздельной видеокарте и взяли интегрированное графическое ядро, например, X1300, то получите всего 949 баллов.
Нажмите на картинку для увеличения.
Если синтетические тесты вам не по душе, и вы предпочитаете результаты в реальных играх, то как насчёт HD 4670, которая даёт 53,6 кадра в секунду в игре Far Cry 2 (Ranch Small, 1680×1050, 4AA, 8AF, Low Quality, DX9, no HDR-R), в то время как прошлогодняя HD 3450 показывает всего 7,90 fps – почти 7x разница при смене всего одного поколения. В Tom Clancy’s H.A.W.X. (Fraps/Glass Hammer: 1280×1024, 0AA, 0AF, Low Quality, DX9, no HDR-R) мы получили 215,20 fps на HD 4670 и всего 64,30 fps на HD 2400 XT. Вполне очевидно, что интегрированная графика уровня тех же лет даст намного меньший результат.
Если вы любите играть, то помните о возможности запустить две видеокарты HD 4650 или 4670 вместе благодаря технологии AMD CrossFireX, когда ускорять игру будут уже два GPU. Данный подход также работает и в случае Hybrid CrossFireX, когда можно сочетать раздельную видеокарту Radeon (включая 4650 или 4670) с совместимым IGP. Конечно, гибридная графика будет не такая быстрая, как в случае двух раздельных видеокарт, зато вы получите прекрасную возможность максимизировать возможности IGP, за которые вы уже заплатили. В зависимости от игры и конфигурации, CrossFireX может дать до 1,8X прирост производительности по сравнению с одиночным GPU.
Ещё один способ получить максимальную производительность на видеокартах – использовать небольшую утилиту AMD под названием Fusion. Fusion будет работать только на системах с процессорами AMD Phenom и видеокартами Radeon 3600 или более поздних поколений, но если вы удовлетворяете упомянутым требованиям, то данная утилита обеспечит лёгкий доступ к разгону GPU и CPU под Windows. Утилита позволяет создавать оптимизированные профили под Windows, чтобы какие-либо сбойные драйверы или другие компоненты не замедляли игру, когда вам нужна максимальная производительность. Если же вы завершите игру, то просто вернитесь к обычному профилю Windows. Обычно всегда есть возможность выжать дополнительную производительность из качественных компонентов. И с помощью утилиты Fusion AMD сделала такую возможность доступной даже новичкам.
Нажмите на картинку для увеличения.
Другие приятные возможности
Мы уже подчеркнули немало преимуществ, которые вы получите после установки “бюджетных” видеокарт HD 4650 и 4670 в области видео высокого разрешения и графики, но на этом они не заканчиваются. Например, в одной из наших офисных систем мы давно используем видеокарту NVIDIA Quadro NVS 420, изначально продававшуюся за $399, которая позволила поддержать нам четыре монитора. Однако мы перешли на новую ОС Windows 7, наши приложения и сценарии использования эволюционировали, и повседневная работа попросту стала сложнее, чем могла выдержать видеокарта NVS. Мы решили заменить NVS двумя видеокартами: Radeon HD 4550 и HD 4650.Это дало нам существенный прирост по производительности графики, и при этом мы остались с поддержкой до четырёх мониторов (благодаря двум выходам DVI на карту и драйверам ATI, поддерживающим разбиение рабочего стола по нескольким мониторам). И цена при этом осталась на уровне $100. Можно представить и несколько отличающуюся конфигурацию, когда можно было использовать материнскую плату с интегрированным графическим ядром и дискретную видеокарту 4650/4670, что дало схожий результат, хотя нам понравился прирост производительности, который обеспечила 4550 по сравнению с возможностями IGP.
Кроме того, помните, что HD 4670 – это одна из самых мощных видеокарт, не требующих подключения дополнительной вилки питания. Вся необходимая мощность обеспечивается шиной PCIe. Перейдите на линейку 4800, и вы потеряете подобную свободу. Некоторые пользователи не могут смириться с мешаниной кабелей, да и часть блоков питания не поддерживает требования/кабели питания современных видеокарт. И в данном случае модели HD 46xx “убивают двух зайцев”.
Конечно, при данном уровне цены 1,5-2 тысячи рублей мы часто говорим о том, что видеокарты должны быть “достаточно хороши”. Будем надеяться, что мы показали вам, что модели HD 4650 и 4670 идут намного дальше. За такую цену вы получите прекрасную функциональность и производительность. Неважно, какое сейчас состояние экономики, но от апгрейдов отказываться не стоит. Индустрия продолжает совершенствоваться. Во многих случаях апгрейд компьютера позволяет перейти на современный уровень, но при этом заплатите вы совершенно немного. Рассмотренные в статье видеокарты AMD могут буквально вдохнуть новую жизнь в старую систему. Или превратить старый “бюджетный” компьютер в мультимедийный центр развлечений.