Битва поколений
Nvidia под угрозой. Следуя своему успешному пути, ATi внезапно представила технологически превосходящий чип. Причина очевидна – на прибыльном потребительском рынке ATi Radeon 9700 Pro на несколько шагов обгоняет GeForce4 Ti4600. Поверхностный переход с интерфейса AGP 4X на 8X, который nVidia объявила вскоре после выпуска “новой” NV28 ревизии чипа так и не смог ликвидировать отставание. Но относительно рабочих станций OpenGL не следует делать поспешных выводов. Здесь работают другие правила.
Для тестирование мы взяли карту PNY/ Nvidia Quadro4 980XGL, основанную на чипе NV28, и ATi FireGL X1, чья мощь обусловлена Radeon/ FireGL 9700 Pro. Перед тем, как мы перейдем к подробному рассмотрению тестируемых карт, приведем краткий обзор сегодняшних OpenGL видеокарт на рынке.
Современные видеокарты для рабочих станций
Производитель и карта | Чип (кодовое имя) | Число транз. | Розничная цена | Частота чипа | Частота памяти * | Память | Шина памяти | Интерфейс (макс.) |
3Dlabs Wildcat VP970 | VP900 | 76 млн. | $899 | нет | нет | 128 Мб DDR | 256 бит | AGP4X |
ATi FireGL 8700 | FGL8700 (R200W) | 60 млн. | $149 | 250 МГц | 270 МГц | 64 Мб DDR | 128 бит | AGP4X |
ATi FireGL 8800 | FGL8800 (R200W) | 60 млн. | $349 | 250 МГц | 290 МГц | 128 Мб DDR | 128 бит | AGP4X |
ATi FireGL X1 128 Мб | FGL9700 (R300W) | 100 млн. | $749 | 325 МГц | 310 МГц | 128 Мб DDR | 256 бит | AGP8X |
ATi FirGL X1 256 Мб | FGL9700 (R300W) | 100 млн. | $949 | 325 МГц | 310 МГц | 256 Мб DDR | 256 бит | AGP8X |
ATi FireGL Z1 | FGL9500 (R300W) | 100 млн. | $549 | 325 МГц | 310 Мгц | 128 Мб DDR | 256 бит | AGP8X |
PNY/NVIDIA Quadro4 750XGL | Quadro4 (NV25) | 63 млн. | $399 | 275 МГц | 275 Мгц | 128 Мб DDR | 128 бит | AGP4X |
PNY/NVIDIA Quadro4 900XGL | Quadro4 (NV25) | 63 млн. | $499 | 300 МГц | 325 МГц | 128 Мб DDR | 128 бит | AGP4X |
PNY/NVIDIA Quadro4 980XGL | Quadro4-AGP8X (NV28) | 63 млн. | $549 | 300 МГц | 325 МГц | 128 Мб DDR | 128 бит | AGP8X |
* Реальная частота. Примечание: эффективная тактовая частота в два раза выше (DDR). Маркетинговые отделы часто и ошибочно в качестве реальной частоты используют DDR частоту.
Окинем карты внимательным взором
ATi FireGL X1
Если судить по внешнему виду, то FireGL X1 сложно отличить от остальных карт на потребительском рынке. Ведь карта отличается лишь графическим чипом, который был слегка модифицирован с помощью микрокода. Аппаратные же функции чипа идентичны Radeon 9700 Pro. Самое существенное отличие заключается в программировании драйверов. Синхронизация с high-end приложениями на сегменте рабочих станций, поддержка и сертификация выливаются в намного более высокую стоимость, чем у эквивалентных карт на потребительском рынке, и вполне естественно, что повышенная стоимость перекладывается на плечи покупателей.
Розничная цена FireGL X1 в 128 Мб варианте составляет $749/ €799 в большинстве магазинов. 256 Мб вариант (оборудованный дополнительным гнездом для стерео очков) имеет цену в $949/ €999. Чип Radeon/ FireGL 9700 Pro работает на частоте 325 МГц. Производитель оснастил карту RAMDAC на 400 МГц. Точность на цветовой канал составляет 10 битов. Карта поддерживает AGP 8X (спецификация AGP 3.0). Самые последние чипсеты, типа Intel E7205 (Granite Bay), VIA KT400 и nVidia nForce2, уже оснащены AGP 8X.
Меньший брат FireGL X1 – FireGL Z1, основывается на чипе FGL9500. ATi также разработала FireGL E1 (чип 8800LE, 64 Мб) исключительно для OEM рынка.
ATi FireGL X1, продолжение
Карта имеет два DVI-I разъема. То есть вы можете подключить как два аналоговых дисплея, так и два ЖК монитора с цифровым входом. Также возможна и комбинация аналогового и цифрового дисплеев.
FireGL X1 с 128 Мб памяти использует дополнительное питание. Разъем для питания имеет тот же форм-фактор, что и разъем у флоппи-привода, так что вы сможете подключить стандартную вилку блока питания. 256 Мб вариант поддерживает интерфейс AGP Pro50.
Реальная частота работы памяти – 310 МГц, по причине использования DDR памяти эффективная частота составляет 620 МГц.
Драйвер ATi
Закладка Driver Information (информация о драйвере)
Скриншот был снят на платформе i850. Поэтому на закладке вы можете увидеть лишь AGP 4X. Если карту установить на E7205, KT400 или nForce2, то будет использоваться интерфейс AGP 8X.
Если сравнить закладку с Radeon 9700, то сразу же станет очевиден факт: OpenGL драйвер разрабатывала другая команда. Настройка монитора и гамма-коррекция находятся на закладке “Adjustments” (настройки).
На закладке “Configuration” (конфигурация) размещаются профили для всех важнейших OpenGL приложений.
Nvidia/ PNY Quadro4 980XGL
Вслед за объявлением немецкой Elsa банкротом, nVidia пришлось начать поиск нового маркетингового партнера для своих профессиональных OpenGL графических карт. Им стала PNY. В отличие от ATi FireGL X1, карте Quadro4 не требуется дополнительное питание в виде вилки или разъема AGP Pro50.
Quadro4 980XGL отличается от своего брата-близнеца, 900XGL, только интерфейсом. Благодаря NV28 версии графического чипа карта поддерживает AGP 8X, если он присутствует на материнской плате. Если не касаться серверных чипсетов, то новый стандарт AGP присутствует только на чипсетах E7205 (Pentium 4), KT400 и nVidia nForce2 (оба – Athlon XP). Если вы установите карту на другие чипсеты, то максимум, что вы получите – AGP 4X. Однако это не следует считать недостатком, что подтверждается последующими тестами.
Чип работает на 300 МГц как в 900XGL, так и в 980XGL. Аппаратные функции обоих чипов Quadro4, NV25 и NV28, одинаковы.
Два DVI-I разъема позволяют подключать два монитора, независимо от того, используете ли вы аналоговое или цифровое соединение. Возможна любая комбинация. Карта также оснащена разъемом для подключения 3D стерео очков.
Драйвер Nvidia
В тестировании мы использовали текущую версию драйвера 41.01. AGP 8X режим отображается только на тех платформах, которые его поддерживают. Мы тестировали карту на чипсете i850, поэтому вы видите только AGP 4X.
Мы приводим движки “разгона” только в информационных целях. В стандартных драйверах эта закладка скрыта. Как вы можете увидеть, скорость чипа выставлена в 297 МГц, хотя она должна быть 300 МГц. Это просто неаккуратность утилиты разгона (ошибочная интерпретация внутренних регистров). На более старой карте Quadro4 900XGL также отображаются 297 МГц. В отличие от ATi, скорость работы с памятью у nVidia выше – 650 МГц. Актуальная тактовая частота составляет 325 МГц. Обратите внимание, что ATi указывает актуальную тактовую частоту работы с памятью, а nVidia – удвоенную. Здесь работает чистый маркетинг. Пропускная способность DDR SDRAM по сравнению с SDRAM действительно в два раза выше, но это не означает удвоения физической тактовой частоты, поскольку она остается неизменной. Но nVidia – это не единственная компания, использующая подобную стратегию. Что поделать – покупатели желают получать только то, что они хотят: все сводится к единой единице измерения – мегагерцу. Неудивительно, что маркетинговые отделы играют с мегагерцами как пожелают. Слава Богу, наши читатели понимают больше среднего потребителя…
Подобно ATi, nVidia также предоставляет предварительные настройки для самых важных приложений. При тестировании мы выключили вертикальную синхронизацию для получения максимально возможной производительности. Следует избегать ошибочного понимания: настройки OpenGL для приложений (Custom OpenGL Application Settings) – это не то же самое, что сертификация драйверов. Сертификация – специальный процесс тестирования для данного приложения. И хотя в своих пресс-релизах и рекламе nVidia объявляет о сертификации под самыми важными приложениями, на данный момент это не относится к Quadro4 980XGL. Почему? Потому что старые драйверы поддерживают только чип NV25 (другими словами, серию Quadro4 вплоть до 900XGL), Однако 980XGL базируется на чипе NV28, поэтому для работы карты требуются драйверы поколения 4x.xx или выше. Если вы желаете покупать только сертифицированные продукты, то вы должны проверять последнюю информацию на сайте nVidia. Еще раз повторим: карте нужны драйверы 40.00 или выше, поэтому для 980XGL важна именно их сертификация.
Nvidia Driver, продолжение
Владельцам плоских мониторов с функцией поворота экрана понравится переключение между портретным и альбомным режимами.
Благодаря nView вы можете управлять двумя мониторами, если они доступны.
Тестовая конфигурация
Вся следующая информация относится только к сравнению производительности.
Платформа | |
Процессор | Intel Pentium 3.06 ГГц (HT) |
Частота FSB | 133 МГц учетверенная |
Материнская плата | Asus P4T533C |
Чипсет | Intel 850E / Tehama (двухканальный) |
Память | 1024 Мб PC1066 RDRAM 40 нс Samsung |
Жесткий диск | IBM Ultrastar 36LZX 36,7 Гбайт |
SCSI-контроллер | Adaptec SCSI карта 29160N |
Драйверы и ПО | |
3Dlabs Wildcat VP карты | v0181 |
Линейка ATI FireGL 8×00 | v3051 |
ATI FireGL X1 | v1021 |
Линейка PNY NVIDIA Quadro4 | v41.04, Maxtreme v4.00.25 (3ds max) |
Разрешение | 1280x1024x32, Vsync=выкл для всех OpenGL тестов |
ОС | Windows 2000 Professional SP3 |
Тесты | |
Viewperf | SPECopc Viewperf 7.0 |
Solidworks | SPECapc Solidworks 2001Plus benchmark |
3D Studio Max | SPECapc 3DSMAX 4.2 benchmark |
Solidedge | SPECapc Solidedge V11 benchmark |
Платформа и операционная система: предварительный анализ
Непосредственно перед тестами, посвященными сравнению производительности различных видеокарт, проанализируем выбор правильной платформы и правильных настроек.
Влияние операционной системы
Мы долго и внимательно изучали сайт www.spec.org в поисках эталонных значений результатов под Windows XP. Вместо этого мы нашли массу информации о системах на Windows 2000.
Если взять тест, основанный на реальном приложении типа 3D Studio Max, и запустить его под Windows XP, результаты вас огорчат. На той же платформе E7205 c 1024 Мб памяти и с той же картой Quadro4 980XGL под Windows 2000 тест работал быстрее.
С синтетическими тестами SPWCviewperf все обстоит немного по-другому. В результате неопытный тестер может сделать выводы о мизерных отличиях между Windows XP и Windows 2000.
i850/ RDRAM против E7205/ DDR: правильный чипсет влияет на результат
Начнем с того, что мы с нетерпением ждали получения платы на чипсете E7205/ Granite Bay, поскольку его поддержка AGP 8X делает чипсет идеальным кандидатом для использования совместно с новыми профессиональными видеокартами. И хотя старый добрый чипсет i850/ Tehama поддерживает только AGP 4X, он продолжает демонстрировать лучшие результаты в реальных приложениях типа 3D Studio Max. Обе тестовые системы оснащались 1024 Мб памяти. Все остальные компоненты типа видеокарт были одинаковыми. Мы смогли получить подобный результат и на других тестах OpenGL, базирующихся на реальных приложениях.
И вновь для получения приемлемых выводов о производительности недостаточно просто запустить синтетический Viewperf. По этому тесту можно судить о том, что E7205 с DDR266 памятью вряд ли медленнее i850 с RDRAM.
AGP8X: что изменилось по сравнению AGP4X?
Результаты говорят сами за себя: AGP 8X не дает никакого преимущества по сравнению с AGP 4X. Кстати, то же самое характерно и для других приложений.
Hyperthreading: да или нет?
Легенда: w/ = с; w/o = без; HT = hyperthreading
Hyperthreading (HT) – новый ведущий рекламный лозунг Intel для продвижения Pentium 4 начиная с 3 ГГц. За этим термином скрывается новая система работы. Один физический процессор представляется для операционной системы как два логических. Компьютер затем работает как двухпроцессорная система. В некоторых случаях HT может улучшить общую производительность. Очевидно, что HT должен работать под любой операционной системой с поддержкой нескольких процессоров. То есть Windows 98 и Windows Me можно отбрасывать сразу. Вы сможете использовать HT под Windows 2000 или Windows XP. Но здесь таится подводный камень. Intel опубликовала примеры, полученные исключительно под Windows XP. Дело в том, что при включении многопроцессорного ядра под Windows 2000 производительность процессора с HT драматически падает. С Windows XP случается обычно противоположное. Но не потеряйте основную мысль! Существующие OpenGL приложения работают под Windows 2000 существенно быстрее, чем под Windows XP. HT здесь ничего не решает.
Тесты: семь кандидатов
Наш анализ привел к следующему:
- Платформа: Intel 850/ Tehama с RDRAM лучше, чем E7205/ Granite Bay c DDR266 памятью.
- AGP8X не дает никакого практического прироста по сравнению с интерфейсом AGP4X.
- Приложения в Windows 2000 работают быстрее, чем в Windows XP.
- Hyperthreading следует включать только в Windows XP, не под Windows 2000.
Четыре приведенных выше утверждения относятся только лишь к OpenGL приложениям, и их не следует распространять на другие сферы типа офисных или игровых приложений. Причем они могут в любое время измениться, как только произойдет обновление чипсетов, версий BIOS, драйверов или пакетов обновления для операционных систем. Если это случится, то мы, безусловно, сообщим вам об этом. В то же время покупатели оборудования должны руководствоваться сегодняшними условиями, а не обещаниями сладкого будущего.
В наших тестах мы использовали синтетический тестовый пакет SPECViewperf 7.0. Он позволил дать грубую оценку производительности. Тесты приложений Solidworks 2001 Plus, Solidedge V11 и 3D Studio Max R4.2 (все изданы признанной тестовой организацией SPEC) позволили оценить производительность видеокарт в реальных условиях. Причем тесты приложений можно признать более значимыми.
Viewperf 7.0
Тестовый пакет Viewperf 7.0 базируется на шести отдельных тестах, которые можно загрузить с сайта SPEC: 3dsmax-01, light-05, drv-08, proe-01, dx-07 и ugs-01. Они измеряют следующие параметры.
- 3D примитивы, включая точки, линии, line_strip, line_loop, треугольники, triangle_strip, triangle_fan, квадраты и полигоны;
- Атрибуты на вершину, на примитив и на кадр;
- Освещение;
- Наложение текстур;
- Альфа-смешение;
- Туман;
- Сглаживание;
- Буферизация глубины.
В тестах используются так называемые viewset от различных приложений. Тем не менее, само приложение не требуется. Ниже дано описание отдельных viewset.
- 3dsmax-01: основан на 3D Studio Max 3.1, имеет три модели со средним количеством вершин 1,5 миллиона. Тестируются сцены с различными источниками света.
- dx-07: основан на IBM Data Explorer, имеет десять различных тестов.
- drv-08: основан на DesignReview от Intergraph, имеет пять различных тестов.
- light-05: основан на приложении Discreet Lightscape Radiosity, имеет четыре различные теста.
- proe-01: основан на Pro/ ENGINEER 2000i2, измеряет три модели в трех режимах – затененном, каркасном и при удалении скрытых линий (HLR).
- ugs-01: основан на Unigraphics V17, тестируется модель машины, содержащая 2,1 млн. вершин.
Результаты Viewperf 7.0
Тест Viewperf – чисто синтетический. Поэтому для нас его результаты значат меньше, чем у реальных приложений.
Quadro4 980XGL лидирует в подтестах 3dsmax-01, light-05 и proe-01. FireGL X1 от ATi два раза попадает на третье место, и один раз – на второе.
Результаты Viewperf 7.0, продолжение
Только лишь в ugs-01 FireGL X1 выходит на первое место. Во всем остальном лидирует Quadro4 980XGL.
Solidworks 2001 Plus
Все следующие тесты базируются на реальных приложениях, часто использующихся на сегменте рабочих станций. Для запуска этих тестов вам потребуется полная лицензионная версия каждой программы. Иначе вы не сможете запустить тестовую модель или скрипт.
Нажмите на картинку для увеличения.
Тест SPEC для Solidworks 2001 Plus использует сложную модель машины и автомобиля, помимо всего прочего. В случае машины максимальное число вершин составляет 2,25 млн.
Интересная картина: хотя Quadro4 980XGL и 900XGL работают на одинаковой скорости, на интерфейсе AGP4X, 900XGL оказывается быстрее, чем модель с интерфейсом AGP8X. ATi FireGL X1 занимает только третье место.
Общий результат является более весомым показателем, поскольку он показывается взаимодействие драйвера с другими компонентами ПК. Общий результат показывает общее время работы теста. И снова FireGL X1 оказался за флагманами от nVidia.
Solidedge V11
Нажмите на картинку для увеличения.
Solidedge V11 лучше масштабируется, чем Solidworks. Здесь легче определить разницу в производительности трех карт.
Карта FireGL 8800, то есть предшественница FireGL X1, показывает лучший результат. Причина может заключаться в более отлаженных драйверах. Производительность Quadro4 980XGL также необычна: карта попала на несчастное последнее место.
Важно учитывать общий результат. FireGL X1 в Solidedge попала лишь в серединку. Старый добрый друг, 3DLabs Wildcat VP970, смогла взобраться на второе место.
3D Studio Max 4.2
Нажмите на картинку для увеличения.
Тест 3D Studio Max дает сбалансированное тестирование проволочных моделей и текстурирования/затенения.
Тест приложения 3D Studio Max требует большую графическую производительность от карт. Первое место занимает nVidia.
Однако самым критичным для пользователя параметром является общее время запуска тестов. Среди других критериев на него влияет, к примеру, загрузку процессора. Благодаря хорошему программированию драйверов ATi смогла в первый раз вывести FireGL X1 на первое место – благодаря меньшей нагрузке на процессор.
Заключение: драйверы перевешивают “железо”
Тестирование явно продемонстрировало одну вещь: даже превосходящего дизайна чипа недостаточно для победы в сравнительном тестировании. Мы ожидали намного большего, учитывая чисто теоретический потенциал Radeon/ FGL 9700 и результаты карты в играх. Анализируя наш опыт, мы предполагали полную победу ATi FireGL X1 над Quadro4 980XGL. Однако разработчики драйверов в nVidia доказали обратное. Нам стало понятно, почему nVidia отнеслась к нашему тестированию с энтузиазмом, а ATi долго упорствовала, и не желала предоставлять карты. Только лишь через несколько недель после официального выпуска она выслала нам карты. nVidia же, с другой стороны, сразу же доставила нам свои.
В нашем последнем сравнении 3DLabs от Wildcat VP просто смела конкурентов. В то же время nVidia осознала тот факт, что ее драйверы не могут выжать максимум из продуктов компании. Тогда nVidia использовала несколько последующих месяцев для доработки драйверов и смогла существенно улучшить производительность. Quadro4 980XGL (NV28) тоже пожал плоды доработки, поскольку, за исключением интерфейса AGP 8X, он ничем не отличается от Quadro4 900XGL (NV25). И это еще не все – исключая несколько случаев, 900XGL и 980XGL показывают одинаковую производительность. Так что AGP8X пока что вряд ли имеет какое-либо значение, поскольку 128 Мб встроенной памяти уменьшают зависимость от интерфейса карты.
Результаты отнюдь не следует рассматривать как поражение ATi. Чип 9700 на FireGL X1 безусловно имеет огромный потенциал. Однако он сможет раскрыть его только лишь тогда, когда разработчики драйверов приложат еще большие усилия. Если вы в это верите, то X1 является хорошей инвестицией в будущее. После тестирования ATi сообщила нам, что компания выпустит полностью обновленную версию X1 драйвера на следующей неделе.
Итог по всем тестам
Если вы интересуетесь полным сравнением результатов всех тестов, то мы свели их в следующую таблицу. После ее изучения вам станет понятно, откуда получился общий результат.
SPECapc для 3ds max 4.2 | Составляющая графики | Составляющая процессора | Общий результат |
3Dlabs Wildcat VP970 | 7,56 | 9,33 | 8,14 |
ATi FireGL 8700 | 6,1 | 8,42 | 6,83 |
ATi FireGL 8800 | 7,31 | 9,45 | 8 |
ATi FireGL X1 | 8,55 | 9,11 | 8,74 |
NVIDIA Quadro4 750XGL | 9,79 | 5,87 | 8,18 |
NVIDIA Quadro4 900XGL | 10,5 | 5,76 | 8,48 |
NVIDIA Quadro4 980XGL | 10,4 | 6,03 | 8,59 |
SPECapc SolidWorks 2001Plus | Общий результат | Графика | Процессор | Ввод/вывод |
3Dlabs Wildcat VP970 | 3,78 | 4,01 | 3,62 | 3,37 |
ATi FireGL 8700 | 3,63 | 3,69 | 3,72 | 3,06 |
ATi FireGL 8800 | 3,67 | 3,75 | 3,72 | 3,11 |
ATi FireGL X1 | 3,82 | 4,04 | 3,73 | 3,23 |
NVIDIA Quadro4 750XGL | 3,64 | 3,63 | 3,76 | 3,24 |
NVIDIA Quadro4 900XGL | 4,02 | 4,38 | 3,76 | 3,38 |
NVIDIA Quadro4 980XGL | 3,99 | 4,32 | 3,78 | 3,36 |
SPECapc для Solid Edge V11 | Общий результат | Составляющая графики | Составляющая процессора | Составляющая ввода/вывода |
3Dlabs Wildcat VP970 | 3,87856296193662 | 5,42231299875179 | 2,76996215908999 | 5,02384530105132 |
ATi FireGL 8700 | 3,29035096188402 | 5,43193965289373 | 2,6494627547686 | 3,35535435034264 |
ATi FireGL 8800 | 3,34800537393022 | 6,029485317784 | 2,55790825655945 | 3,39653204552254 |
ATi FireGL X1 | 3,81205658189142 | 5,49146709073786 | 2,81223049591938 | 4,84641345503723 |
NVIDIA Quadro4 750XGL | 3,29035096188402 | 5,43193965289373 | 2,6494627547686 | 3,35535435034264 |
NVIDIA Quadro4 900XGL | 3,90544828189762 | 5,76306684704362 | 2,68468449801381 | 4,99951603744972 |
NVIDIA Quadro4 980XGL | 3,84546901283129 | 5,3043810700172 | 2,77138303282257 | 5,0116068537587 |