Введение
Кто нынче “Король горы”?
Трудно поверить, но уже прошёл год с того времени, как nVidia выпустила
После нескольких “бумажных” выпусков люди устали от речей маркетинговых и PR-отделов компаний, доказывавших, насколько они хороши и как они сокрушат конкурентов. С появлением версий PCI Express гонка производительности вновь стала интересной. С объявлением SLI nVidia сделала то, чего все давно ждали: ощутимо ударила по конкуренту. Если “одна голова хорошо, а две – лучше”, то почему то же самое нельзя сказать про видеокарты, не так ли? После томительного летнего ожидания наступил ноябрь, обещавший яркую зиму: мы получили поддержку двух карт и возвращение
После объявления SLI nVidia продала большое количество чипсетов, особенно среди энтузиастов, которые искали что-то принципиально новое для апгрейда своих систем. Любители покопаться в своём компьютере получили возможность модернизировать материнскую плату и купить новую видеокарту, отложив покупку второй карты до следующей благоприятной финансовой ситуации. Пользователи же с большим кошельком смогли зайти в любимый компьютерный магазин и заказать самую “крутую” машину.
nVidia вышла в лидеры – по крайней мере, в сфере двух графических карт. Но сегмент одиночных графических карт оставался до сих пор не завоёванным: паритет с ATi сохранялся. Позднее ATi выпустила линейку X850, состоящую из вариантов Pro, XT и XT Platinum Edition, и лидером графической производительности среди одиночных карт оказалась X850XT PE. nVidia решила приложить максимум усилий, чтобы новое решение смогло выйти на шаг вперёд ATi в сфере одиночных карт. Кстати, что касается SLI, то новая карта и здесь оказалась достаточно мощной. Собственно, графический процессор 7800 GTX, известный ранее как G70, для этого и предназначался. Как вы увидите дальше, обе короны графической производительности (для одиночных карт и для SLI) теперь прочно сидят на голове у nVidia.
NV или не NV? G70 под вопросом
Как предполагали некоторые энтузиасты, новый чип будет называться NV47. Однако, как сообщили представители nVidia, проект NV47 был прекращён. Дело в том, что инженеры nVidia смогли создать более совершенный чип, поэтому NV47 было решено убрать вообще.
По информации Ника Стама (Nick Stam), директора по техническому маркетингу nVidia, 7800 GTX построен на “полностью ином дизайне”. Но если посмотреть на детали G70, то начинаешь сомневаться: действительно, что делать со всеми усилиями, затраченными на разработку NV47?
Диаграмма 3D-обработки внутри G70.
GeForce 7800 GTX использует 24 пиксельных конвейера и 8 вершинных блоков, работающих на частоте ядра 430 МГц. Увеличение по сравнению с 16-ю пиксельными конвейерами и 6-ю вершинными блоками GeForce 6 составило 8 и 2, соответственно. В отличие от заметного расширения функциональной части ядра, тактовая частота повысилась всего на 30 МГц по сравнению с предыдущим поколением (с 400 до 430 МГц). Однако 302 миллиона транзисторов у GeForce 7800 GTX – это больше, чем у 6800 Ultra, на 80 миллионов. nVidia представила интересный слайд, суммирующий количество транзисторов других процессоров, чтобы достичь уровня 7800.
Если просуммировать транзисторы, обеспечивающие вычислительную мощь Xbox, PS2, FX-55 и двух приставок Game Cube, вы получите G70.
Подобно NV40, данные сначала поступают на вершинные блоки. Затем обработанные данные проходят через пиксельные конвейеры. Наконец, данные поступают на конвейер растровых операций (Raster Operations, ROP) и выводятся на экран. Во время этого процесса, как вы можете заметить, пиксельные блоки затенения группируются по четыре. Напомним, что пиксельные конвейеры оснащены пиксельными блоками затенения FP32 (с 32-битной точностью вычислений с плавающей запятой). При совместной работе они обеспечивают более эффективную фильтрацию. Кроме того, при этом мы получаем возможность использовать 128-битную точность на оставшейся части графических конвейеров (32bpp, 64bpp и 128bpp в “родном” режиме). Давайте посмотрим, чем же блоки затенения GeForce 7800 GTX отличаются от 6800 Ultra.
nVidia CineFX 4.0
Если не вглядываться в детали, диаграммы G70 не слишком отличаются от NV40, за исключением дополнительных блоков затенения. Но если посмотреть повнимательнее, станет очевидно, что процессор G70 способен выполнять больше математических операций за такт.
Одной из целей 7800 GTX было поднять минимальную частоту кадров, чтобы геймер смог получить больше удовольствия от игры. Чтобы справиться с немалой вычислительной нагрузкой многих современных и будущих игр, в конвейер 3D-рендеринга были добавлены арифметико-логические устройства (АЛУ).
На этой диаграмме можно видеть, куда в конвейере пиксельного затенения были добавлены АЛУ. Каждый мини-АЛУ выполняет набор инструкций множественного сложения (MADS). Как заявляет nVidia, производительность вершинных программ на скалярных операциях возросла “до 30%”. За каждый такт может выполняться четыре MADS с плавающей запятой.
Пиксельные блоки затенения | Вершинные блоки затенения | |
АЛУ | 24 | 8 |
Архитектура | 2x Vector-4 + Scalar + Norm | Vector-4 + Scalar |
Векторы | 4 MADS / 8 flops | |
Скаляры | 2 flops | |
Инструкции/ АЛУ | 5 | 2 |
Операции/ АЛУ | 10 | 5 |
Операции с плавающей запятой/ АЛУ | 27 | 10 |
Инструкции/ такт | 120 | 16 |
Операции/ такт | 240 | 40 |
Операции с плавающей запятой/ такт | 648 | 80 |
Тактовая частота | 430 МГц | 430 МГц |
Инструкции/ секунда | 51,6 млрд. | 6,88 млрд. |
Операции/ секунда | 103,2 млрд. | 17,2 млрд. |
Операции с плавающей запятой/ секунда | 278,6 млрд. | 34,4 млрд. |
Билинейно отфильтрованных текстур за такт | 24 | |
Скорость заполнения билинейных текселей | 10,3 млрд. | |
Пропускная способность текстур (FB + PCI-E) | 44,4 Гбайт/с |
Кроме того, по словам nVidia, в конвейере на низком уровне произошло много других улучшений. Два улучшения видны в тестах и реальной производительности: снижение задержек и увеличение вычислительной мощности в расчёте на такт. Если всё будет работать с меньшей задержкой, то выиграет вся система.
Архитектура шейдеров nVidia CineFXTM 4.0
- Вершинные шейдеры
- Поддержка DirectX 9.0 Vertex Shader 3.0
- Карты смещения (Displacement mapping)
- Geometry instancing
- Вершинные программы бесконечной длины
- Поддержка DirectX 9.0 Pixel Shader 3.0
- Поддержка множественных целей рендеринга (Multiple Render Targets, MRT)
- Расширенная анизотропная фильтрация 16x (до 128 taps)
- Режимы прозрачного мультисэмплинга и прозрачного суперсэмплинга, переводящие качество сглаживания на новый уровень
- Пиксельные программы бесконечной длины
- Максимум 16 текстур за проход рендеринга
- Поддержка 16-битного и 32-битного формата с плавающей запятой
- Поддержка текстурного формата sRGB для гамма-текстур
- Сжатие текстур DirectX и S3TC
- Поддержка DirectX и OpenGL (включая 2.0)
- Ultra Shadow II (оптимизация вычисления теней)
Впервые nVidia анонсировала Ultra Shadow на карте 5900 Ultra. Дополнительную информацию можно получить
HDTV
В США телевидение высокого разрешения (HDTV) продолжает набирать популярность. Оно обладает многими преимуществами, о которых мы уже неоднократно писали в наших статьях. ATi внесла поддержку HDTV после X800, а nVidia – после 6800. 7800, конечно же, предлагает все визуальные улучшения и эффекты предыдущего поколения, включая FSAA, AF и шейдерные вычисления для всех разрешений. Но сейчас графический процессор может вычислять всё быстрее, чему помогают дополнительные 80 миллионов транзисторов.
7800 GTX использует три выделенных движка видео, позволяющих получить “качество домашнего кинотеатра”. Чип имеет поддержку High Definition H.264 со встроенным HDTV-выходом. Кроме того, 7800 поддерживает деинтерлейсинг HD (1080i) и инверсный шаг кадра 3:2 и 2:2. nVidia называет всё это PureVideo Technology, которая обеспечивает ряд функций.
- Аппаратное ускорение видео высокого разрешения MPEG-2 и WMV9.
- Пространственно-временной деинтерлейсинг (Spatial-temporal).
- Масштабирование 4-tap горизонтальное, 5-tap вертикальное.
- Коррекция температуры цвета оверлея.
- Microsoft Video Mixing Renderer (VMR) – позволяет выводить несколько окон с видео при полном качестве.
HDR
Высокий динамический диапазон (High Dynamic Range, HDR) – функция новая, и её сегодня используют лишь несколько игр. Чтобы понять её суть, следует сначала рассмотреть динамический диапазон.
Когда человеческий глаз видит ночью луну, она выглядит ярко, поскольку рядом нет ничего ярче. Если же вы будете находиться ночью на освещённой улице, то луна будет выглядеть уже не так ярко из-за света фонарей. Динамический диапазон является соотношением между самым ярким и самым тёмным участками изображения. В компьютерах значения разбросаны между нулём и единицей, в то время как в реальном мире – между нулём и бесконечным числом. К примеру, солнце имеет яркость 108 кд/м² или 100 000 000 кандел на квадратный метр.
В Far Cry хорошо заметна разница в освещённости.
HDR подразумевает применение технологий, которые позволяют компьютеру выдать больший динамический диапазон, видимый глазу. При поддержке компаний типа Industrial Light and Magic (Lucasflim Limited Company) появился стандарт HDR OpenEXR. ILM использовала его в фильмах вроде “Люди в чёрном II” и “Знаки”. Сейчас вы можете задаться вопросом, чем же HDR полезен в играх? Технология позволяет разработчикам создать освещение “настоящего мира” в сюрреалистическом окружении. Технологию используют игры вроде Splinter Cell: Chaos Theory и Far Cry (Patch 1.3).
Как вы можете видеть на иллюстрациях, источники света очень яркие. Вы даже не можете видеть листочки травы между собой и джипом. Кроме того, обратите внимание на световое гало вокруг фонаря. Наконец, обратите внимание на небо – и вы увидите подсвеченные облака, прямо как в настоящей жизни. HDR обеспечивает намного более эффективное освещение.
Longhorn
Конечно, это слово начинается с буквы “L”, а не “H”. Но что уж поделаешь.
В любом случае, с появлением Composited Desktop Engine графический процессор 7800 GTX готов к Longhorn. По информации nVidia, “кроме поддержки Microsoft DirectX 9.0 Shader Model 3.0 (Microsoft DirectX9.0c), GeForce 7800 GTX полностью поддерживает и оптимизирован под Longhorn Windows Graphics Foundation (WGF) 1.0 и Longhorn Display Driver Model (LDDM).”
Похоже, первая бета-версия новой системы выйдет в августе. Но с 7800 GTX не нужно беспокоиться о поддержке новой ОС – вы уже будете во всеоружии.
Ещё о “железе”
Характеристики GeForce 7800 GTX
- Рекомендованная цена: $599
- Тактовая частота ядра: 430 МГц
- Тактовая частота памяти: 600 МГц (эффективная 1,2 ГГц)
- 256-битный интерфейс памяти
- 256 Мбайт GDDR3
- Два 400-МГц RAMDAC
- Два DVI + HD-выход
- Макс. разрешение: 2048×1536 на 85 Гц
Кроме 24 пиксельных конвейеров, обеспечивающих тексельную скорость заполнения с билинейной фильтрацией 10,32 гигатексель/с, HDR, HDTV и множества других технологий, nVidia решила вновь использовать 256-битный интерфейс памяти GDDR3 на частоте 600 МГц (эффективная 1200 МГц). Теоретически мы получаем пропускную способность 38 Гбайт/с – на 3 Гбайт/с больше, чем у 6800 Ultra.
Scalable Link Interface – SLI
SLI на 7800 GTX включается так же, как и раньше.
Конечно, nVidia не остановилась на одной карте – 7800 GTX можно использовать в паре. Здесь говорить особо не о чем, так как особых изменений не произошло. 7800 GTX может работать как в режиме SLI, так и в режиме двух отдельных карт для поддержки нескольких мониторов.
В некоторых играх возникают проблемы рендеринга в режиме SLI. На иллюстрации показан пример Far Cry. Одна карта выводит верхнюю часть экрана, другая – нижнюю.
Обратите внимание, что для SLI вам необходимо использовать две одинаковые карты, а также включить режим SLI в драйвере.
Драйвер ForceWare 75
С каждым выпуском нового важного продукта nVidia предлагает новое обновление единого драйвера ForceWare (и Detonator). Разве сейчас ситуация должна измениться? Мы надеемся, что в драйвере появится 16xAA. Однако это произойдёт не раньше июля. Впрочем, ждать осталось недолго.
Что интересно, вы получите 16xAA сначала на двух картах, но, как мы думаем, через некоторое время эта опция появится и для одиночных карт. Кроме того, 16xAA не будет простым эволюционным процессом перехода от 4x к 16x. Мы получим что-то вроде комбинации 4x суперсэмплинга (SS) и 4x мультисэмплинга (MS).
Но что такое 4xSS плюс 4xMS? Не будет ли 4 + 4 = 8? Да, но каждая точка в суперсэмпле содержит четыре точки мультисэмплинга. То есть мы получим более высокое качество для всех отображаемых объектов. Поскольку 7800 GTX обеспечивает великолепную вычислительную мощность и поднимает порог минимальной частоты кадров, почему бы не включить всё по максимуму? Если вы тратите на видеокарту немало денег, а особенно если вы покупаете две карты, то разве нельзя требовать максимального качества картинки?
FSAA: настройки полноэкранного сглаживания работают точно так же, как у 6800. Текущие режимы: Управление приложением/Application Controlled (по умолчанию) / Off / 2x / 2x Quincunx / 4x / 8x. 8x – это то же самое, что и старый режим 8xS, то есть 4xMS+2xSS.
AF: настройки анизотропной фильтрации остались теми же, что и у 6800. Текущие режимы: Управление приложением/Application Controlled (по умолчанию) / Off / 2x / 4x / 8x / 16x.
Суперсэмплинг и мультисэмплинг
Новая девочка nVidia: Луна (Luna).
Режимы прозрачного сглаживания (суперсэмплинг и мультисэмплинг) потрясают. Картинка намного более реалистична, чем всё, виденное нами до этого. При использовании стандартных суперсэмплинга и мультисэмплинга флаги, ассоциированные с альфа-каналом текселя, позволяют использовать прозрачные пиксели при смешении. Что это означает для геймера? То, что вид через сетчатый забор уже не будет таким, как прежде.
Картинка без прозрачного суперсэмплинга.
А вот и качество. Картинка с прозрачным суперсэмплингом выглядит намного более реалистично.
Но что делать, если вы купили новую игру, которую драйверы ещё пока не поддерживают, или вы тестируете бета-версию игры. Как играть в неё? После выхода версии 71.84 в драйверах появилась опция по редактированию существующих профилей или созданию собственного для игры, которой нет в списке.
Список игр довольно длинный. Если вашей игры нет, просто нажмите “Add Profile” для создания нового профиля.
Когда вы введёте название нового профиля, следует указать исполняемый файл (.exe) приложения, для которого следует оптимизировать драйвер. Как только файл будет привязан к профилю, можно выбирать настройки для приложения.
Выберите программу, которую следует привязать к профилю. Если вы хотите запускать Half-Life 2 в одном режиме, а Unreal Tournament 2004 – в другом, то нет проблем. Просто укажите настройки в нужном профиле.
Энергопотребление: загрузка и бездействие
nVidia утверждает, что новая карта обеспечивает большую вычислительную мощность, чем любая другая карта потребительского уровня, и при этом она потребляет меньше энергии, чем предшественница 6800 Ultra. Чтобы проверить эти утверждения, мы подключили тестовую систему к простому измерителю мощности. КПД блока питания в тесте не учитывается – мы указываем общую мощность, потребляемую системой. Как мы уже подчёркивали раньше, вы будете платить за суммарную потребляемую мощность, независимо от того, теряется она из-за низкого КПД блока питания или тратится на питание компонентов. Так что для данного теста КПД не имеет значения.
Как и раньше, мы указываем энергопотребление системы в целом, а не одних только видеокарт. Кроме того, чтобы гарантировать, что активность комплектующих типа оптических накопителей и жёстких дисков не повлияет на результат, мы измеряли энергопотребление во время процесса загрузки, а также во время бездействия после завершения загрузки Windows. Счётчик отображал значения в реальном времени. Возможно, для наших следующих тестов (по всей видимости, R520), мы будем выводить на графике зависимость энергопотребления от времени.
Как можно видеть, во время загрузки и во время бездействия энергопотребление GeForce 7800 GTX оказывается меньше, чем у 6800 Ultra. Однако обе карты потребляют больше энергии, чем ATi Radeon X850XT PE.
Энергопотребление: игры
Взглянув на следующие графики, можно сделать несколько интересных заключений. nVidia действительно была права насчёт энергопотребления новой карты. И дело здесь не в том, что мы не доверяем маркетинговым и PR-отделам, мы просто всегда проверяем их заявления на практике. Приятно видеть, что nVidia говорит правду.
Второй интересный факт: nVidia 7800 GTX потребляет меньше энергии, чем ATi и 6800 Ultra. Впрочем, различие, конечно, невелико.
Третье интересное наблюдение: хотя 7800 GTX потребляет меньше энергии, чем ATi, карта может выводить игры с намного более высокой скоростью, чем X850XT PE.
Наконец, посмотрите на результаты SLI. Карта 7800 GTX не только отличается более эффективным потреблением энергии сама по себе, но она также получает преимущество над предыдущим поколением в режиме SLI. Во время демо Half-Life 2 SLI-конфигурация 7800 показала более высокую частоту кадров и, в то же время, потребляла на 46 Вт меньше. Добавьте к этому экономию во время бездействия, и можете начать считать сэкономленные за год или два деньги.
Во время пиковых вычислительных нагрузок система 7800 GTX в режиме SLI потребляла 384 Вт (3DMark2005 Canyon Flight), когда тварь делает прыжок вокруг корабля. Как вы можете видеть, мы используем простой счётчик мощности Watts Up? Pro.
Тестовая конфигурация
Тестовая система | |
Процессор | AMD FX-55 (2,6 ГГц) |
Материнская плата | Gigabyte GA-K8NXP-SLI (939 nForce4 SLI) |
Память | 1 Гбайт – 2x Corsair PC4400, 200 МГц, 512 Мбайт |
HDD | Western Digital 10 000 об/мин 74G Гбайт Raptor S-ATA (8 Мбайт) |
Блок питания | Enermax EG851AX 660 Вт |
Драйверы и конфигурация | |
Графика | ATi Catalyst v5.6 nVidia v77.62 |
Чипсет | nForce4 SLI |
ОС | Windows XP Prof. SP2 |
DirectX | DirectX 9.0c |
Видеокарты, использованные в статье | |
ATi | Radeon X850 XT PE (ATI) |
nVidia | GeForce 6800 Ultra OC (BFG Tech) GeForce 7800 GTX (nVidia) |
Тесты | |
3DMark 2003 | |
3DMark 2005 | |
Doom3 | |
Farcry – 32bit | Retail v1.3 Build-in benchmark Max details Demos: Cooler01 |
Half-Life 2 | Custom Demo: MW_Coast1 |
Halo | Build-in benchmark – Max details PS 2.0 |
Splintercell EMEA | 1_1_1 Tibilis Demo |
UT2003 Ver.2225 | Antalus Flyby Demo/Inferno Demo |
UT2004 | Custom Demo: Assult-Fallen City |
3DMark 2003
3DMark 2005
Doom3
Far Cry (32 бита)
Half-Life 2
Halo: Combat Evolved
Splinter Cell
UT 2003-Flyby
UT 2003-Inferno
UT 2004
Заключение
Результаты тестов говорят сами за себя. Любому серьёзному геймеру систему 7800 GTX SLI можно смело рекомендовать. Из разговоров с компьютерными компаниями мы узнали, что они будут запрашивать на $200 больше рекомендованной цены, так что приготовьтесь выложить $1600 за SLI.
nVidia вновь порадовала в сфере одиночных карт. 7800 GTX прекрасно показывает себя как в одиночном режиме, так и в SLI. Если у вас есть одна карта 6600 GT, и вы планируете докупить вторую, то оставьте эту идею. Лучше подкопить денег, купить одну 7800 GTX вместо SLI-конфигурации GT.
Но если вы уже приобрели 6800 Ultra, то проблема получается не простой. Для кошелька будет лучше купить ещё одну 6800 Ultra после падения цен, но не лучше ли будет забыть о SLI и просто купить новую карту? В любом случае, вы сможете удивить ваших друзей.
Если вы читаете этот обзор и смеётесь над теми, кто может позволить себе тратить деньги на дорогие видеокарты, то 7800 GTX не для вас. Самым экономным мы рекомендуем Intel IGP.
Что нас ждёт впереди?
Хотя мы не уверены, что NV47 совсем уж забыта, G70 – впечатляющий чип. Большая производительность по сравнению с конкурентами, и при этом меньшее энергопотребление – это уже само по себе немалое достижение. Мы наблюдаем тенденцию, обратную той, которая прослеживалась в мобильном сегменте с выходом GeForce6800 Ultra и Mobility X800 XT.
Однако у нас до сих остаются вопросы по поводу параллелизма в графике. AMD и Intel сегодня объединяют ядра на один кристалл, чтобы поднять производительность и снизить тепловыделение. SLI и CrossFire – тоже движение в направлении параллелизма, но по какой цене? Лучше ли будет установить две видеокарты или одну с двумя ядрами?
Если добавление большего количества блоков затенения рассматривать как движение в сторону параллелизма, то почему бы просто не создать чип с 32 пиксельными конвейерами и 16 вершинными блоками, вместо двух графических карт по 16 и 8 блоков, соответственно? Какой вариант будет дешевле? Будут ли энтузиасты, желающие получить максимальную производительность по любой цене, по-прежнему покупать сверхдорогие карты? Как нам кажется, трудно поверить, что максимального ценового барьера не существует.
Похоже, что производители GPU сегодня движутся в направлении AMD и Intel. Конечно, выполнение большего числа инструкций за такт – шаг правильный, ведь “зачем выполнять 4, если можно сделать 6 с меньшими усилиями и меньшей мощностью?” Наблюдая последние сдвиги на рынке CPU, мы полагаем, что появление графики в тандеме – это лишь вопрос времени. По сути, решения на нескольких GPU уже появились.
Опять же, история вновь повторяет себя. Если мне показать несколько графических чипов с выделенной памятью на одной плате, которые подключены к определённому интерфейсу, мне на ум сразу же придёт 3DFX. И вряд ли я ошибусь, ведь у меня до сих пор где-то валяется Voodoo2. Кстати, никто не продаёт Voodoo5 6000?