РЕКЛАМА
ПОИСК И ЦЕНЫ
Поиск по сайту THG.ru


Поиск по ценам в Price.ru




ИНФОРМАЦИЯ
ПОЛЕЗНЫЕ ССЫЛКИ
Futuremark Vantage: новый бесполезный тест

AMD Radeon HD 3870 и 3850: ответный удар

Rambler's Top100 Рейтинг@Mail.ru
bigmir)net TOP 100

ВИДЕОКАРТЫ

nVidia GeForce GTX 260 и 280: новое поколение видеокарт
Краткое содержание статьи: Мы так долго ждали этого события, и оно произошло: nVidia выпустила видеокарты на основе обновлённой архитектуры G8x под названием GTX 280 и GTX 260. Новинки оказались действительно весьма мощными, хотя ряд недостатков мы тоже обнаружили. Предлагаем ознакомиться с подробным обзором видеокарт и тестами.

nVidia GeForce GTX 260 и 280: новое поколение видеокарт


Редакция THG,  17 июня 2008


Введение

Прошло полтора года - столько времени GeForce 8800 GTX оставалась на позициях, которые nVidia называла high-end GPU. Конечно, через шесть месяцев после объявления и (какое совпадение!) перед выходом R600 мы получили 8800 Ultra с чуть более высокими тактовыми частотами, но никаких революционных изменений в ней не было. Затем, два с половиной месяца назад, появление 9800 GTX пробудило надежды существенного прироста производительности, но, как оказалось, карта давала весьма ограниченный прирост по сравнению со старой доброй GTX и уступала версии Ultra. nVidia пришлось очень нелегко в том, чтобы убедить владельцев новых видеокарт в существенном преимуществе дополнительных мегагерц или вообще устанавливать два GPU на одну видеокарту.

nVidia GeForce GTX 260, 280

Нажмите на картинку для увеличения.

Наконец, nVidia снизошла и услышала наши молитвы: GTX 280 первая видеокарта на действительно доработанной архитектуре G8x. Теперь мы уже знаем принцип работы компании: представить новую архитектуру на проверенном техпроцессе. Из-за очень большого числа транзисторов чип дорого обходится в производстве, карты получаются тоже очень дорогими, но захват рынка всё же происходит. Затем, в последующие годы, nVidia совершенствует свою архитектуру на всех сегментах рынка, используя более тонкий техпроцесс, но менее оптимизированный на высокие тактовые частоты. Наконец, когда новый техпроцесс будет освоен, nVidia переносит его и на high-end, который к тому времени становится более доступным. Мы видели подобный подход с G70/G71 и G80/G92, теперь история повторяется с GT200 - настоящий "монстр" с 1,4 млрд. транзисторов, изготавливающийся по 65-нм техпроцессу.

GeForce 200 GTX

GeForce 200 GTX

Новое поколение, новое название. Похоже, переход за номер "10 000" в линейке производителям не нравится. Если ATI решила эту проблему, введя римские цифры, nVidia решила полностью изменить номенклатуру карт. Теперь мы получили GeForce 200 GTX. Но возникает любопытный вопрос: что случилось с картой GeForce 100 GTX?

GTX 260 GTX 280
Частота GPU 576 МГц 602 МГц
Частота памяти 999 МГц 1 107 МГц
Частота потоковых процессоров 1 242 МГц 1 296 МГц
Число потоковых процессоров 192 240
Число текстурных блоков 64 80
Число блоков растровых операций (ROP) 28 32
Контроллер памяти 448 битов (7 каналов по 64 бита) 512 битов (8 каналов по 64 бита)
Тип памяти GDDR3 GDDR3

Как мы видим, nVidia представляет новую архитектуру, но её нельзя назвать совсем уж "с нуля". Зарождение G80 началось с "чистой страницы", но затем архитектура доказала свою высокую эффективность. Целью GT200 было исправить все "ошибки молодости" архитектуры, а также подготовить её к будущим играм. Мы получили примерно то, чем G70 стал для NV40, внеся множество мелких улучшений, а также шагнув вперёд по вычислительной мощности. Так получилось и в случае 8800 GTX с мощностью вычислений с плавающей запятой 518 GFlops, а GTX 280 уже приблизилась к терафлопу - с впечатляющей мощностью 933 GFlops. В реальности отрыв ещё больше, поскольку значение 518 GFlops у G80 рассчитано на выполнение двух операций с плавающей запятой за такт (одна MAD и одна MUL) - что, из-за ограничений G80, на практике достичь было невозможно. С выпуском GT200 nVidia гарантирует, подтверждая тестами, что проблемы решены. Чтобы почти удвоить вычислительную мощность предыдущего GPU, nVidia ощутимо подняла число мультипроцессоров - с 16 до 30.

nVidia и AMD соглашаются друг с другом в том, что будущим играм потребуется существенно более высокая вычислительная производительность по сравнению с текстурированием, поэтому вряд ли удивляет то, что число текстурных блоков увеличилось скромнее. С 64 у 9800 GTX, мы получили увеличение GTX 280 до 80 (и если сравнивать 8800 GTX и GTX 280 на этот раз, мы ушли от теоретического соотношения арифметических инструкций к числу отфильтрованных текселей 14,1:1 на 19,4:1). Что же это значит на практике?

Арифметическая производительность (тесты)

Для оценки арифметической производительности можно использовать синтетические тесты с процедурными текстурами (они требуют немало вычислений). Конечно, nVidia нравится 3DMark Vantage и его тест Perlin Noise, где мы замерили прирост производительности 129% при переходе от 9800 GTX до GTX 280. Но, учитывая важность, которую nVidia приписывает этому тесту, и лёгкость, с которой можно оптимизировать под него новые драйверы (кстати, по-разному для GTX 280 и 9800 GTX), чтобы тест делал то, что от него хочет производитель (см. нашу статью на эту тему), давайте проанализируем результаты забытой версии RightMark 3D с Pixel Shader 2.0 (Direct3D 9.0). Поскольку результаты разных тестов существенно различаются по абсолютным значениям, мы выразили результаты в процентах и взяли за основу 9800 GTX.

Арифметическая производительность (тесты)

Как видим, улучшения намного скромнее, хотя они присутствуют - меньше для процедурных шейдеров и больше для сложных эффектов освещения, где мы наблюдаем прирост до 78%. Теперь давайте перейдём к версии 2 пакета RightMark и его шейдерам 4.0 (Direct3D 10.0).

Арифметическая производительность (тесты)

Здесь прирост виден, но он ближе к повышению приведённого выше соотношения арифметических расчётов с плавающей запятой к фильтрации текселей, чем к числам, которые даёт 3DMark Vantage.

ROP

С блоками растровых операций (ROP) нас ждал приятный сюрприз - их число возросло с 24 у G80 (16 у G92) до 32. Чтобы обеспечить их загрузку, nVidia использовала 512-битную шину, которая, учитывая характеристики GPU, явно будет здесь более полезна, чем на R600.

ROP

Мы наблюдаем 78% прирост производительности GTX 280 над 9800 GTX, что близко к теоретическим значениям, поскольку увеличение ROP сопровождало падение частоты (675 МГц у 9800 GTX).

И поскольку мы начали говорить об AMD, следует отметить, что этой компании нужно как можно быстрее пересмотреть свои high-end GPU, которые ограничиваются 16 текстурными блоками и 16 ROP ещё с объявления X800 в 2004 году! Если GPU AMD остаются конкурентоспособными по вычислительной мощности, с другой точки зрения, их серьёзно обходит nVidia, которые вносит улучшения с каждым новым поколением. Будем надеяться, что новая архитектура AMD, которая будет представлена совсем скоро, закроет эту брешь.

Кстати, приведённые результаты HD 3870 X2 показывают, что пусть ATI уступает по числу блоков на чип, не забывайте, что новая стратегия производителя заключается в использовании карт на двух GPU против карт на одном GPU у nVidia! По этой причине, а также из-за чуть более высокой (825 МГц) частоты, 3870 X2 лидирует в этом тесте, синтетическом, но релевантном.

А что насчёт Direct3D 10.1?

После кампании, которую nVidia уже некоторое время проводит по поводу его бесполезности, нас вряд ли удивило отсутствие поддержки нового API Microsoft в 200 GTX. Нас это не удивило, но огорчило. По информации nVidia, поддержка API изначально планировалась, но опрошенные разработчики были уверены в том, что она "не важна". Конечно, Direct3D 10.1 не добавляет ничего революционного - как мы уже отметили в обзоре карт Radeon HD 38x0, однако корректирует недостатки, присутствующие в спецификациях Direct3D 10. Да и есть несколько новых интересных функций, которые могут стать полезными для движков рендеринга, такие как отложенное затенение (deferred shading), которое становится всё более популярным, а также алгоритмы для рендеринга прозрачных поверхностей без сортировки.

Да, это может показаться несколько избыточным в данной ситуации, когда Direct3D 10 ещё не показал своего превосходство на девятой версией, но объяснения nVidia кажутся невнятными. Мысль о бесполезности Direct3D 10.1 в данное время нельзя назвать ложной (хотя Assassin's Creed доказывает обратное), однако мы попадаем в замкнутый круг - без поддержки со стороны nVidia вполне очевидно, что разработчики не будут серьёзно относиться к ATI. Мы уже наблюдали подобную ситуацию и раньше, но она была обратной: какие разработчики использовали Shader Model 3, когда вышла NV40? Особенно на первых GeForce 6, где основные функции, подобные Vertex Texture Fetch и динамическому ветвлению в шейдерах, были слабо реализованы. Но, конечно, в то время nVidia считала себя авангардом 3D API.

Поэтому наше мнение с предыдущей статьи не изменилось. Пусть даже DirectX 10.1 нельзя использовать прямо сейчас, нам нравится, когда в новых 3D-процессорах используются последние технологии, с которыми могут знакомиться разработчики. Мы ругали ATI в то время, а теперь нашу критику получила nVidia.

Архитектура в деталях

Архитектура SIMT?

Вы наверняка знакомы с терминами SIMD (одна инструкция, много данных) и MIMD (много инструкций, много данных), но в GT200 nVidia описывает мультипроцессоры шейдеров как "блоки SIMT". Чем же они являются на самом деле? Сокращение расшифровывается как Single Instruction Multiple Threads (одна инструкция, много потоков), и основное отличие от режима SIMD заключается в том, что обрабатываемые векторы не имеют чётко заданной ширины. При достаточном числе потоков процессор работает как скалярный. Чтобы разобраться, давайте вспомним, как блоки пиксельных шейдеров работали в предыдущих архитектурах.

Растеризатор генерирует квады - квадраты пикселей 2x2, где каждый пиксель задаётся вектором с четырьмя значениями с плавающей запятой одинарной точности (R, G, B, A) или (X, Y, Z, W) - наиболее часто используемый формат в 3D-вычислениях. Квады затем поступают в потоковые процессоры (ALU), которые работают в 16-канальном режиме SIMD, то есть одинаковая инструкция применяется ко всем 16 числам с плавающей запятой. Конечно, мы несколько всё упростили, но принцип понят можно; на самом деле у GeForce 6 и 7 есть режим co-issue для выполнения двух инструкций на вектор.

После G80 данный режим работы был изменён - растеризатор по-прежнему генерировал квады, которые записывались в буфер. Когда 8 квадов (32 пикселей, "warp" по терминологии CUDA) накапливались в буфере, они могли выполниться мультипроцессором в режиме SIMD. В чём разница? В том, как теперь организуются данные: вместо работы над четырьмя векторами по четыре операции с плавающей запятой, которые могут выглядеть, например, (R, G, B, A, R, G, B, A, R, G, B, A, R, G, B, A), мультипроцессор работает над векторами с 32 числами с плавающей запятой, каждое из которых представляет одинаковый компонент из 32 потоков: например, (R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R, R), затем (G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G, G) и т.д.

В программировании SIMD первое выравнивание данных называется AoS (Array Of Structures), а второе - SoA (Structure of Arrays). Вторая организация даёт более высокую производительность. Если будет достаточно данных для заполнения вектора, процессор, с точки зрения программиста, выглядит как скалярный блок, так как SIMD-блоки всегда используются на 100% независимо от ширины обрабатываемых данных. Следовательно, AoS достигает пиковой производительности, только в том случае, когда одинаковая инструкция накладывается на все четыре компонента каждого вектора.

Массив масштабируемых процессоров

nVidia GeForce GTX 260, 280

Нажмите на картинку для увеличения.

В архитектуре не произошло серьёзных изменений, она по-прежнему построена на так называемом nVidia массиве масштабируемых процессоров Scalable Processor Array (или Streaming Processor Array - "массив потоковых процессоров", в зависимости от того, кого вы будете спрашивать). G80 SPA организован следующим образом.

nVidia GeForce GTX 260, 280

Нажмите на картинку для увеличения.

Каждый из восьми TPC (Texture Processor Clusters, кластеры текстурных процессоров) оснащён текстурным блоком и двумя потоковыми мультипроцессорами Streaming Multiprocessors (SM). У GT200 nVidia увеличила число блоков TPC до 10, каждый по-прежнему оснащён текстурным блоком, но уже тремя мультипроцессорами.

nVidia GeForce GTX 260, 280

Нажмите на картинку для увеличения.

Это изменение свидетельствует об изменении ориентации современных шейдеров, акцент которых ставится на арифметические инструкции. Текстурные блоки каждого кластера TPC используют такую же модель, как у G84 и G92 - адресная мощность такая же, как и мощность фильтрации, в отличие от G80, где мощность фильтрации в два раза превышала адресную. Так, в простом режиме фильтрации текстур RGBA8, текстурные блоки G84/G92/GT200 в два раза производительнее G80. С более продвинутыми режимами фильтрации или текстурами RGBA16, изменение не влияет на результат.

Есть и другое улучшение, которое относится к GT200: nVidia утверждает, что теперь используется более эффективная система диспетчеризации для текстурных операций, что должно приблизить результат к пиковой производительности по сравнению с G92. Давайте посмотрим на результаты Fillrate Tester.

Массив масштабируемых процессоров

Переход с 64 на 80 текстурных блоков, с учётом разницы в частоте GPU, должен дать GTX 280 преимущество всего 11% над 9800 GTX. Но мы замерили 43% при использовании четырёх текстур и 118% при использовании двух! Улучшение в системе диспетчеризации вряд ли сможет объяснить разницу. Однако увеличение числа ROP (удвоение) тоже сыграло свою роль. В любом случае, вполне очевидно, что GTX 280 намного ближе к значениям теоретической скорости заполнения с одной или двумя текстурами (97%), чем 9800 GTX (между 80 и 91%), означая, что улучшения nVidia оправдали себя на практике. Как мы уже объясняли выше, плата AMD с двумя GPU, которая ещё и работает на более высоких тактовых частотах по сравнению с nVidia, всего на 32% уступает GTX 280 с четырьмя текстурами.

Теперь давайте посмотрим на результаты теста текстурирования RightMark3D 2.0 PS 4.0.

Массив масштабируемых процессоров

Результат первого теста шейдеров (Fur, мех) удивляет: 14% прирост, что немного, учитывая оптимизацию смешения, геометрических шейдеров и скорости заполнения, хотя всё зависит от реализации шейдеров. С другой стороны, 59% прирост в тесте Steep Parallax Mapping более впечатляет, на уровне с нашими ожиданиями.

Переработанные потоковые мультипроцессоры

Кроме увеличения числа, каждый мультипроцессор прошёл через несколько оптимизаций. Первая заключается в увеличении числа активных потоков на мультипроцессор - с 768 до 1 024 (с 24 32-поточных "варпов" до 32). Большее число потоков особенно полезно для компенсации задержек текстурных операций. В масштабах GPU мы получаем увеличение числа активных потоков с 12 288 до 30 720.

Число регистров на мультипроцессор удвоилось - с 8 192 до 16 384. С сопутствующим повышением числа потоков, число регистров, которые одновременно может использовать поток, увеличилось с 10 до 16. На G8x/G9x наш тестовый алгоритм использовал 67% вычислительных блоков; на GT200 это число должно быть 100%. Учитывая два текстурных блока, производительность должна быть существенно выше, чем у G80, которую мы тоже взяли для теста. К сожалению, CUDA 2.0 требует драйвер, который всё ещё находится в состоянии бета-версии, он не распознаёт GeForce 200 GTX. Когда в основной ветке драйверов появится поддержка, мы повторим тест.

nVidia GeForce GTX 260, 280

Нажмите на картинку для увеличения.

Это не единственное улучшение, которое nVidia сделала со своими мультипроцессорами: компания заявила об оптимизации режима dual-issue. Как вы помните со времён G80, мультипроцессоры предположительно позволяют выполнять две инструкции за такт: одну MAD и одну MUL с плавающей запятой. Мы упомянули "предположительно", поскольку в то время мы не смогли проверить это поведение в наших синтетических тестах - мы не знаем, с чем было связано это ограничение, с аппаратной поддержкой или с драйверами. Несколько месяцев спустя, после нескольких версий драйверов, мы знаем, что MUL не всегда легко отделить на G80, так что проблема, скорее всего, аппаратная.

Но как работает режим dual-issue? Во времена G80 nVidia не дала детали, но затем, изучая патент, мы узнали чуть больше о способе выполнения инструкций на мультипроцессорах. Начнём с того, что патент чётко выделяет, что мультипроцессоры могут запускать выполнение только одной инструкции на каждый такт GPU. Так где же знаменитый режим dual-issue? Фактически, он сводится к специализации "железа": одна инструкция использует два такта GPU (четыре такта потокового процессора/ALU), её можно применить к "варпу" (выполнение 32 потоков на 8-канальных блоках SIMD), но начало конвейера мультипроцессора может запускать выполнение только одной инструкции каждый такт, если они относятся к разным типам: MAD в одном случае, SFU в другом.

Кроме трансцендентных операций и интерполяции значений каждой вершины, SFU способны выполнять умножение с плавающей запятой. Чередуя выполнение инструкции MAD и MUL, можно получить "перехлёст" времени выполнения инструкций. Таким образом, каждый такт GPU даёт результат MAD или MUL в "варпе" - то есть 32 скалярных значения. По описанию nVidia можно ожидать, что вы получите MAD и MUL каждые два такта GPU. На самом деле, результат такой же, но с аппаратной точки зрения начало конвейера существенно упрощается, он поддерживает подачу инструкций на выполнение по одной каждый такт.

nVidia GeForce GTX 260, 280

Нажмите на картинку для увеличения.

То, что ограничивало подобную функцию на G8x/G9x, было исправлено на GT200? nVidia, к сожалению, не уточняет. Представители компании просто говорят о том, что они доработали такие блоки, как выделение регистров, планирование и запуск инструкций на выполнение. Но мы сделали предположение, близкое к реальности. Теперь давайте посмотрим, насколько изменения nVidia повлияли на практику - на синтетический тест GPUBench.

Переработанные потоковые мультипроцессоры

В целях сравнения мы добавили результаты 9800 GTX. На этот раз всё понятно: вы можете видеть более высокую скорость выполнения инструкций MUL по сравнению с инструкциями MAD. Но мы по-прежнему далеки от удвоения значений, примерно 32% по сравнению с MAD. Но и то хорошо. Следует отметить, что результаты для инструкций DP3 или DP4 не следует принимать во внимание, поскольку числа не были постоянными. То же самое касается инструкций POW, что, вероятно, связано с проблемой драйверов.

Последнее изменение, сделанное с потоковыми мультипроцессорами, касается поддержки двойной точности (64-битное число с плавающей запятой вместо 32-битного). Честно говоря, дополнительная точность редко используется в графических алгоритмах. Но, как мы знаем, GPGPU (использование GPU для расчётов) становится для nVidia всё более важным, и в некоторых научных приложениях двойная точность необходима.

nVidia - не первая компания, которая это заметила. Не так давно IBM модернизировала процессоры Cell, чтобы повысить производительность SPU на этом типе данных. По производительности, конечно, реализация GT200 оставляет желать лучшего - вычисления с плавающей запятой двойной точности реализованы на отдельном блоке потокового мультипроцессора. Блок позволяет выполнять одно вычисление MAD двойной точности за такт, что даёт пиковую производительность 1,296 x 10 (TPC) x 3 (SM) x 2 (Multiply+Add) = 77,78 Gflops, или где-то между 1/8 и 1/12 от производительности с одинарной точностью. AMD добавила такую же поддержку, используя одинаковые вычислительные блоки за несколько тактов, что дало ощутимо лучший результат - всего в два-четыре раза медленнее, чем расчёты с одинарной точностью.

ROP

Как мы уже говорили, число блоков растровых операций (ROP) увеличилось, но каких-либо новых функций мы не получили. Впрочем, стоит признать ROP у G8x уже довольно полные, с поддержкой 16- и 32-битных кадровых буферов с плавающей запятой со смешением и сглаживанием; сглаживание до 8x или 16x в режиме CSAA; Z-рендеринг в восемь раз быстрее и т.д. Вряд ли нужно что-то добавлять. Поэтому nVidia занялась оптимизацией производительности. Для смешения в кадровых буферах RGBA8 мы получили на G8x/G9x производительность, уменьшенную в два раза, с 12 пикселями на такт. У GT200 это ограничение было снято, а добавление 512-битной шины, с пропускной способностью больше 140 Гбайт/с, новые ROP могут сделать карты GeForce непобедимыми по пропускной способности. Ниже приведены результаты для пиксельного Z-заполнения.

ROP

По чистой производительности результаты не разочаровывают, мы поставили новый рекорд: 75 537 мегапикселей в секунду! Впрочем, значение всё же можно признать разочарованием в том отношении, что мы получили четырёхкратный, а не восьмикратный прирост базовой скорости заполнения. Для 9800 GTX мы получили 5,2 увеличение - чуть лучше, но, опять же, ниже теоретического значения.

Результаты Fillrate Tester

Геометрические шейдеры

Производительность геометрических шейдеров предыдущих процессоров nVidia Direct3D 10 не очень впечатляла из-за неправильно оцененных и слишком маленьких внутренних буферов. Помните, что по спецификациям Direct3D 10 геометрический шейдер способен создавать до 1 024 значений с плавающей запятой одинарной точности на входящую вершину. Поэтому, с существенной нагрузкой на геометрию, буферы быстро заполнялись и предотвращали дальнейший расчёт геометрии. У GT200 размер буферов был увеличен в шесть раз, что существенно повышает производительность в некоторых случаях, как мы увидим. Чтобы выжать максимум из размера буферов, nVidia пришлось поработать над диспетчеризацией потоков геометрических шейдеров.

Геометрические шейдеры

На первом шейдере Galaxy прирост очень скромный - 4%. С другой стороны, на Hyperlight он составил 158% - свидетельство улучшений работы с подобными типами шейдеров, хотя всё зависит от реализации и от мощности (число точек/чисел с плавающей запятой, сгенерированных на одну входящую вершину). В целом, GTX 280 закрыла разрыв и обошла 3870 X2 на том же шейдере.

Теперь давайте взглянем на результаты теста Rightmark 3D Point Sprites (Vertex Shading 2.0).

Геометрические шейдеры

Почему мы говорим об этом тесте в разделе, посвящённом геометрическим шейдерам? Просто потому, что с момента Direct3D 10 за обработку точечных спрайтов отвечают геометрические шейдеры, что объясняет удвоение производительности между 9800 GTX и GTX 280!

Разные улучшения

nVidia оптимизировала несколько аспектов архитектуры. Кэш-память пост-трансформации была увеличена. Роль этой кэш-памяти заключается в том, чтобы избежать повторной трансформации одной вершины несколько раз с индексированными примитивами или полосками треугольников, записывая результат вершинных шейдеров. Из-за повышения числа ROP производительность отсечения Early-Z была существенно улучшена. GT200 способна отсекать до 32 пикселей по маске за такт перед применением пиксельного шейдера. Кроме того, nVidia заявляет об оптимизации передачи данных и команд между драйвером и началом конвейера GPU.

Производительность пиксельных и вершинных шейдеров

Поскольку от практически удвоения числа потоковых процессоров (ALU) можно ждать определённых улучшений, давайте сначала посмотрим, как карты работают в тесте вершинных шейдеров Rightmark Vertex Shaders.

Производительность пиксельных и вершинных шейдеров

Удивительно, несмотря на разные регулировки и повторные тестовые прогоны, GTX 280 не только показала меньшую производительность, чем 9800 GTX, но и упала на 12%! nVidia получила такие же результаты, и мы смогли их изменить, только включив сглаживание 4x - удивительный шаг для геометрического теста. Но следует заметить, что, несмотря на возросшую мощность обработки (и выросшую производительность трансформации), движок настройки (setup engine) не изменился. Как и в случае 9800 GTX, карта способна генерировать только один треугольник за такт. И преимущество 9800 GTX по частоте (675 МГц против 600 МГц) объясняет разницу.

Производительность пиксельных и вершинных шейдеров

Как обычно бывает в случае RightMark 2.0, первый тест шейдеров не показал улучшения на новой видеокарте, а второй дал 25% прирост.

Мы уже весьма подробно поговорили об улучшениях в расширенных пиксельных шейдерах (в частности, в разделе арифметических тестов), но давайте посмотрим на простые шейдеры, а именно на тест попиксельного затенения Fillrate Tester, который мы используем уже четыре года.

Производительность пиксельных и вершинных шейдеров

Прошло уже немало лет, поэтому мы могли бы ожидать прирост производительности GTX 280 побольше 40%. Мы не будем показывать все результаты ShaderMark (который использует Pixel Shader 3.0), но и там улучшение составило от 20 до 26% для последних шести шейдеров, а максимальный прирост - не больше 43%.

Все результаты оказались удивительными, они демонстрируют разрыв между теоретическим увеличением мощности (которое должно повлиять на вершинные и пиксельные шейдеры, даже старые) и реальным приростом в приложениях. Конечно, драйверы пока ещё не полностью оптимизированы, и не следует забывать, что при запуске даже самого специфического теста очень сложно изолировать какую-либо часть конвейера, чтобы на неё не влияли остальные, особенно в современных архитектурах.

Спецификации: ещё выше!

Как часто случалось, nVidia подготовила к анонсу две видеокарты: экстремальную high-end версию GeForce GTX 280 и чуть более доступную, но всё ещё high-end видеокарту GeForce GTX 260. Давайте посмотрим на характеристики этих видеокарт по сравнению с конкурентами.

Спецификации основных видеокарт
GPU HD 3870 X2 9800 GX2 8800 Ultra GTX 260 GTX 280
Частота GPU 825 МГц 600 МГц 612 МГц 576 МГц 602 МГц
Частота ALU 825 МГц 1 500 МГц 1 512 МГц 1 242 МГц 1 296 МГц
Частота памяти 900 МГц 1 000 МГц 1 080 МГц 999 МГц 1 107 МГц
Ширина шины памяти 2x256 битов 2x256 битов 384 бита 448 битов 512 битов
Тип памяти GDDR3 GDDR3 GDDR3 GDDR3 GDDR3
Объём памяти 2 x 512 Мбайт 2x512 Мбайт 768 Мбайт 896 Мбайт 1 024 Мбайт
Число ALU (потоковых процессоров) 640 256 128 192 240
Число текстурных блоков 32 128 32 64 80
Число ROP 32 32 24 28 32
Производительность шейдеров 1 TFlops (1152) GFlops (581) GFlops 715 GFlops 933 GFlops
Пропускная способность памяти 115,2 Гбайт/с 128 Гбайт/с 103,7 Гбайт/с 111,9 Гбайт/с 141,7 Гбайт/с
Число транзисторов 1 334 млн. 1 010 млн. 754 млн. 1 400 млн. 1 400 млн.
Техпроцесс 55 нм 65 нм 80 нм 65 нм 65 нм
Площадь кристалла 2 x 196 мм² 2 x 324 мм² 484 мм² 576 мм² 576 мм²
Поколение 2008 2008 2007 2008 2008
Поддерживаемая модель шейдеров 4.1 4.0 4.0 4.0 4.0

С 1 400 млн. транзисторов и площадью кристалла 576 мм², nVidia создала ещё одного "монстра" - самый крупный GPU, когда либо производившийся, который побил уже впечатляющий рекорд G80 (он на 16% меньше). В принципе, площадь кристалла меняется мало с поколениями (хотя для "массовых" процессоров она снижается). Очевидно, что производство GT200 обходится nVidia очень дорого, даже на хорошо отработанном, но не самом тонком техпроцессе, что и объясняет существование такого крупного чипа.

Ещё один интересный момент: продолжая использовать GDDR3 nVidia отстаёт уже не на одно, а на два поколения от конкурента, поскольку GDDR5 появится в Radeon HD 4870, который выйдет в ближайшее время. Однако следует отметить, что благодаря 512-битной шине памяти, увеличение пропускной способности всё ещё составляет 64% по сравнению с 86,4 Гбайт/с у 8800 GTX. Мы, наконец, увидели появление high-end видеокарты с объёмом памяти больше 512 Мбайт (не считая относительно старую и не самую распространённую 8800 Ultra)! С 1 Гбайт (и 896 Мбайт для GTX 260, что тоже неплохо), производительность в разрешении 2 560 x 1 600 должна быть очень даже достойной.

Наконец, частоты оказались весьма консервативными, особенно для потоковых процессоров (ALU), которые, кроме всего прочего, медленнее, чем на 8800 Ultra.

GTX 280 или GTX 260?

С 30% большей производительностью расчётов с плавающей запятой и на 27% большей пропускной способностью памяти, теоретический разрыв между двумя новыми видеокартами nVidia вполне заметен. На практике карты очень похожи друг на друга, а также и на последние high-end модели GeForce 9 - печальное последствие универсальных "чёрных коробок", корпусов, которые nVidia использует на последних видеокартах. Только крупный 8-см радиальный вентилятор, немного наклонённый, чтобы продувать основание, а также разъёмы дополнительного питания, без которых уже не обойтись, выставляются наружу. Для питания используется два шестиконтактных разъёма PCI Express или один шести- и один восьмиконтактный: с такой мощностью придётся работать блоку питания, если вы хотите установить GeForce GTX 280 или GTX 260. Но и здесь ничего нового, поскольку ATI приучила нас к подобным требованиям в прошлом году, выпустив 2900 XT.

nVidia GeForce GTX 260, 280

Нажмите на картинку для увеличения.

Разъёмы SLI и звуковой вход HDMI, которые присутствуют, скрыты за съёмными заглушками. Единственное реальное отличие от GeForce 9800 GTX заключается в том, что хотя во второй слотовой заглушке есть вентиляционная решётка для выброса горячего воздуха, часть воздуха от карты выходит через вторую решётку, поступая наверх, поэтому он остаётся внутри корпуса - не очень хорошая новость. Длина карт по-прежнему составляет 26,7 см (10,5") - стандарт для high-end моделей за последние два года, а вес чуть не дотягивает до килограмма - 915 грамм, что чуть легче, чем 940 грамм HD 3870 X2.

nVidia GeForce GTX 260, 280

Нажмите на картинку для увеличения.

Для тестов мы получили видеокарты Leadtek, которые, традиционно для high-end моделей в момент запуска, используют эталонный дизайн, а производителя можно узнать разве что по паре наклеек на корпусе. В комплект GTX 280 входит игра NeverWinter Nights 2 (не самый свежий вариант, который бы показал мощь видеокарты), переходник DVI-VGA, кабель HDTV (YUV и S-Video), два переходника с Molex на шестиконтактную вилку PCI Express и переходник с Molex на восьмиконтактную вилку PCI Express.

Тест

Для данного теста мы использовали эталонную конфигурацию, а также тестировали игры исключительно с помощью Fraps, в реальных условиях. Большинство игр, которые помогали нам раньше, включены в обзор, мы традиционно их обновили (установив последние патчи), однако мы добавили две новые игры: Mass Effect, космическую сагу-RPG от Bioware, которая, несмотря на корни Xbox 360, была успешна портирована. Без этой игры мы бы вряд ли могли обойтись (тем более, что она закрывает разрыв после того, как мы отказались от Fable). Вторая игра - Race Driver: GRID, которая, несмотря на интерфейс, является кошмаром для тестеров (подобно предыдущей Colin McRae Dirt от того же издателя, Codemasters). Данная игра визуально очень привлекательная, она использует последнюю версию Ego Engine.

Все синтетические тесты DirectX 9 проводились под Windows XP из-за их нестабильности под Vista (Fillrate Tester, RightMark 1050, ShaderMark 2.1 и SPECviewperf 10). RightMark 3D 2.0 (DirectX 10) запускался, вполне понятно, под Windows Vista (без SP1, поскольку с ним тест тоже был нестабилен), а для всех игр мы использовали Vista SP1, как и для тестов CUDA, измерений шума и температуры, а также для разгона. Мы отключили UAC, Aero, SuperFetch и индексацию, чтобы получать повторяемые результаты.

Для теста мы использовали только два разрешения: 1 920 x 1 200 (24/26") и, конечно, 2 560 x 1 600, поддерживаемое 30" мониторами (Samsung 305T в нашем случае). Причина в том, что, как нам кажется, подобные high-end видеокарты будут использовать только для таких разрешений. Если ваш монитор имеет меньшее разрешение (вплоть до 22"), то вам вряд ли стоит тратиться на подобные модели, чтобы получить плавную и красивую картинку, как мы уже неоднократно отмечали.

Тест

Тестовая конфигурация
Материнская плата Asus P5E3 Deluxe (Intel X38)
Процессор Intel Core 2 Quad QX6850 (3 ГГц)
Память Crucial 2 x 1 Гбайт DDR3 1333 МГц 7-7-7-20
Жёсткий диск Western Digital WD5000AAKS
Оптический привод Asus 12x DVD
Блок питания Cooler Master RealPower Pro 850W
Программное обеспечение
ОС Windows XP, Vista, Vista SP1
Драйверы nVidia ForceWare 177.34 beta (GTX 260 и GTX 280 под Vista)
ForceWare 177.26 beta (GTX 280 под XP)
ForceWare 175.16 WHQL (9800 GTX, 9800 GX2, 8800 Ultra)
Драйверы AMD Catalyst 8.5 WHQL (HD 3870 X2)

Flight Simulator

nVidia GeForce GTX 260, 280

Нажмите на картинку для увеличения.

Зачем тестировать последние high-end видеокарты на игре, которая, как известно, упирается в CPU? Причина простая: нужно убедиться, что новые видеокарты ведут себя, по крайней мере, не хуже, чем предыдущее поколение, а также проверить проработанность драйвера. Как мы уже не раз убеждались, Flight Simulator X может скрывать некоторые сюрпризы.

Flight Simulator

Flight Simulator

Как видим, новые GeForce GT200 отнюдь не радуют. Ни одна из них не смогла выдать больше 23 fps, что смущает, пусть даже это Flight Simulator X. Но 9800 GX2 и 8800 Ultra подобрались вплотную к порогу 30 fps, что намного лучше. Мы уверены, что в следующей версии драйверов ситуация должна улучшиться, так как несколько парадоксально покупать последнее поколение видеокарт nVidia, чтобы получить падение производительности. Даже в игре, где производительность CPU играет важную роль.

Call of Duty 4

nVidia GeForce GTX 260, 280

Нажмите на картинку для увеличения.


Call of Duty 4

Call of Duty 4

Если видеокарта GTX 280 хорошо показала себя в Call of Duty 4, обогнав 9800 GTX на 41% (1 920 x 1 200) и 91% (2 560 x 1 600 + фильтры), то 9800 GX2 оказалась тяжёлым соперником. Она даже обогнала 280 на разрешении 1 920 x 1 200 (на солидные 17%), вероятно из-за большего числа текстурных блоков - единственное теоретическое значение, по которому последние видеокарты nVidia с двумя GPU обгоняют других. На 30" пропускная способность памяти и её удвоенное количество дали GTX 280 лидерство, но только после включения сглаживания 4x (играть всё ещё можно). Мы начали подозревать, что на данных видеокартах можем получить результаты, очень близкие друг к другу. Обратите внимание, что GTX 260 на 21-26% отстаёт от "старшей" модели, что вполне ожидаемо по спецификациям. Видеокарта явно обходит 8800 Ultra, но ощутимо уступает 9800 GX2 в данном тесте.

Test Drive Unlimited

nVidia GeForce GTX 260, 280

Нажмите на картинку для увеличения.


Test Drive Unlimited

Test Drive Unlimited

В игре Test Drive Unlimited нет никакого сомнения в превосходстве новых high-end видеокарт nVidia, пусть даже 9800 GX2 оказалась очень близка (отставание меньше 8% на первых трёх режимах и 17% на максимальном). Ещё одна хорошая новость для производителя - превосходство GTX 280 становится заметным от разрешения 1 920 x 1200, где производительность в два раза превышает 9800 GTX (с фильтрацией и сглаживанием). Однако переход на 30" не усилил лидерство, а, наоборот, уменьшил, однако отрыв всё ещё составляет 50% без фильтров и 76% с ними. Что касается GTX 260, то её отрыв от 8800 Ultra на том же разрешении тоже снизился, до 11% в среднем.

Crysis

nVidia GeForce GTX 260, 280

Нажмите на картинку для увеличения.

Crysis по-прежнему привлекает к себе удивительно много внимания. Ниже представлены наши тесты (мы тестировали игру на новой сцене, которая не так загружает GPU, как предыдущая).

Crysis

Crysis

Из-за высоких требований игры (на этот раз мы тестировали её на тех же разрешениях, что и другие игры), иерархия на диаграмме соответствует результатам без фильтров, поскольку они бесполезны. Можно ли играть в Crysis на разрешении 1 920 x 1 200 на новой GTX 280? Да, но не так плавно, как на 9800 GX2 на нашей тестовой сцене. Только включение сглаживания позволило 280 выйти вперёд, но частота кадров слишком низкая, чтобы играть в режиме детализации "Very High". И проблема в том, что хотя на трёх из четырёх тестовых прогонах GTX 280 обгоняла 9800 GX2 в Crysis, играть вряд ли получится. И это несмотря на боле, чем удвоенную производительность на 2 560 x 1 600 и тот факт, что новые карты оказались единственными, за исключением 8800 Ultra, кто мог выводить игру с активным сглаживанием. В целом, мы были разочарован.

World in Conflict

nVidia GeForce GTX 260, 280

Нажмите на картинку для увеличения.


World in Conflict

World in Conflict

Перед нами ещё одна "тяжёлая" игра, но, в любом случае, играть можно и на разрешении 2 560 x 1 600 без фильтров. Однако видеокарта в World in Conflict уступила "тёмной лошадке" на разрешении 1 920 x 1 200: Radeon HD 3870 X2! Опять же, после включения фильтров карта AMD на двух GPU, которая замечательно подходит для этой игры, обеспечила более высокую производительность, ненамного обогнав GTX 280. На 30" дисплее карта AMD сохранила своё преимущество, а объём памяти GTX 280 вновь хорошо показал себя на последнем режиме, хотя вряд ли на нём можно комфортно играть. И это ещё не всё: на этом же разрешении в лидеры вышла карта nVidia, но 9800 GX2, а не GT200. Поэтому, если вы играете в World in Conflict и Crysis, то GTX 280 вряд ли вам понадобится...

Supreme Commander

nVidia GeForce GTX 260, 280

Нажмите на картинку для увеличения.


Supreme Commander

Supreme Commander

Данная игра со временем стала уже не такой прожорливой, особенно по сравнению с некоторыми свежими играми. Однако Supreme Commander всё ещё актуальна, особенно для игр по сети. На поле боя, но с не слишком большим числом юнитов (чтобы производительность не упиралась в CPU), GTX 280 так ни разу и не смогла обойти 9800 GX2, которая лидирует на 39% на разрешении 2 560 x 1 600. Да, результаты GTX 280 вряд ли можно назвать ужасными, поскольку они на 45% превышают 9800 GTX и 8800 Ultra, хотя мы ожидали большего.

Unreal Tournament 3

nVidia GeForce GTX 260, 280

Нажмите на картинку для увеличения.


Unreal Tournament 3

Unreal Tournament 3

Две новинки интересно проанализировать в Unreal Tournament 3. Если результаты в 1 920 x 1 200 не удивляют, то в 2 560 x 1 600 "тёмная лошадка" 9800 GX2 вновь вышла вперёд. К сожалению, ограниченный объём памяти на этой видеокарте не позволил нам протестировать её с фильтрами, хотя GTX 280 справилась с этой задачей и обеспечила плавную игру. Средний отрыв от видеокарты предыдущего поколения 9800 GTX составил 59%. GTX 260 хорошо показала себя, выдав около 83% производительности GTX 280 на трёх из четырёх разрешений, что даёт этой видеокарте хорошее соотношение цена/производительность, как мы увидим ниже.

Mass Effect

nVidia GeForce GTX 260, 280

Нажмите на картинку для увеличения.


Mass Effect

Mass Effect

Будучи портированной с Xbox 360, игра Mass Effect очень хорошо работает на Radeon HD 3870 X2, за исключением того, что она не справилась со сглаживанием. Однако она вполне хороша для 1 920 x 1 200 и 2 560 x 1 600. Но это не помешало тому, что GTX 280 не смогла выйти в лидеры, поскольку 9800 GX2 не очень хорошо показывает себя в этой игре, заметно уступая (34% на 1 920 x 1 200 + фильтры и 62% на 2 560 x 1 600). Отрыв GTX 280 от 9800 GTX составил 220% на разрешении 1 920 x 1 200 + фильтры, а GeForce GTX 260 идёт чуть позади "старшей" модели.

Race Driver: GRID

nVidia GeForce GTX 260, 280

Нажмите на картинку для увеличения.


Race Driver: GRID

Race Driver: GRID

Игра слишком новая для появления профиля SLI (он необходим для работы карт с двумя GPU, такими как 9800 GX2), поэтому 9800 GX2 среди аутсайдеров. Это как раз помогает GTX 280 выйти вперёд. Производительность видеокарты очень хороша: если она обходит GTX 260 всего примерно на 20%, лидерство над 9800 GTX увеличивается до 50% (за исключением 1 920 x 1 200 и 2 560 x 1 600 + фильтры). Что более важно, две новых видеокарты оказались единственными, которые позволяют играть в разрешении 2 560 x 1 600 + 4X сглаживание, режим, очень приятный для глаз.

BadaBOOM Media Converter, Folding@Home

BadaBOOM Media Converter является программой перекодирования видео, разработанной Elemental Technologies, которая преобразовывает Video DVD (только MPEG2) в формат H.264 для большинства портативных медиаплееров, включая iPhone, iPod и PSP (только с предварительно заданными профилями). Программа оптимизирована для CUDA (через видеоплатформу RapiHD от ETI), поэтому она позволяет удобно сравнить мощность совместимых GeForce (все модели GeForce 8 и 9), которые ускоряют эту требовательную задачу - когда то объявленную AMD через AVIVO. Однако кодировщик Elemental не такой "глючный" и даёт более высокую скорость компрессии.

nVidia GeForce GTX 260, 280

Нажмите на картинку для увеличения.

На предыдущей версии, которая была совместима только с GT 200, мы смогли сжать тестовое видео (400 Мбайт) в формат iPhone (640 x 365) с максимальным качеством за 56,5 секунд на GTX 260 и 49 секунд на GTX 280 (на 15% быстрее). В целях сравнения, кодировщик iTunes H.264 работает восемь минут, используя ресурсы CPU (потребляя больше мощности в целом, но существенно меньше на пиках). Впрочем, следует помнить, что перед нами далеко не самый оптимизированный компрессор H.264, да и BadaBOOM явно не хватает гибкости в работе, пусть даже результат весьма хороший.

Folding@Home

У нас появилась возможность протестировать пре-бета клиент Folding@Home на CUDA, чья финальная версия должна появиться в ближайшие дни. К сожалению, он тоже работает только на GeForce 200.

nVidia GeForce GTX 260, 280

Нажмите на картинку для увеличения.

Здесь, опять же, nVidia имеет более, чем годовую задержку по сравнению с ATI, чьи видеокарты Radeon участвуют в проекте, но GeForce 200 (поскольку мы не смогли протестировать другие видеокарты nVidia) дают более высокую производительность. На нашей тестовой конфигурации мы получили 560 ns в день на GTX 280 и 480 ns в день на GTX 260. Для сравнения PS3 даёт производительность около 150-200 ns в день по сравнению с менее 10 для процессора и 200 для простого Radeon HD 3870.

Однако важно понимать, что производительность может легко меняться в зависимости от клиента на данной архитектуре (оптимизация кода ещё далеко не завершеня для клиентов ATI и nVidia). Mike H считает, что тот же самый HD 3870 может дать 300 ns в день, но не меньше 250. Ещё одна проблема в том, что при смене протеина, требующаяся для клиента GeForce, производительность тоже меняется. В общем, на сегодня мы бы хотели подчеркнуть случайную природу и временный характер приведённых выше результатов. Мы уверены, что с появлением клиента, который будет поддерживать CUDA-совместимые видеокарты GeForce (все, начиная с GeForce 8, включая модели начального уровня), для проекта появятся интересные возможности, поскольку установочная база насчитывает примерно 7 000 TFlops.

nVidia GeForce GTX 260, 280

Нажмите на картинку для увеличения.

Энергопотребление

1 400 млн. транзисторов по 65-нм техпроцессу заставляют ожидать высокое энергопотребление видеокарты. Давайте посмотрим на энергопотребление системы, включающее потери на блоке питания (энергопотребление всей системы и 20% потерь на блоке питания).

Энергопотребление

Первое, что стоит отметить: в играх энергопотребление новых видеокарт очень высокое, но не рекордное. GTX 280 демонстрирует энергопотребление, сравнимое с 8800 Ultra, но уступающее 9800 GX2. А то, что видеокарта 3870 X2 потребляет меньше энергии, связано с недостаточной нагрузкой в протестированной игре. В том же Fillrate Tester мы заметили более высокие пики энергопотребления: 404 Вт для 3870X2 против всего 340 Вт для GTX 280 и 279 Вт для 9800 GTX. Энергопотребление GTX 260 лишь ненамного превышает 9800 GTX, что радует. Что касается максимального энергопотребления самих карт, то nVidia указывает 236 Вт для GTX 280 и 182 Вт для GTX 260.

С другой стороны, инженеры nVidia хорошо поработали над энергопотреблением в режиме бездействия. У видеокарт есть чип, который постоянно замеряет процент использования GPU, и в соответствие с данной информацией драйвер автоматически регулирует частоты, напряжение и активность каждого участка чипа. Следует признать, что результаты GT 200 действительно впечатляют, устраняя историческое отставание чипов nVidia от GPU AMD и даже обгоняя последнюю по минимальному энергопотреблению. GTX 260 получает 20-Вт падение в энергопотреблении на входе блока питания по сравнению с 9800 GTX, да и GTX 280 потребляет существенно меньше энергии - около 25 Вт в 2D (частоты падают до 300 МГц для GPU и 100 МГц для памяти) и примерно 35 Вт во время воспроизведения дисков Blu-ray. Результат действительно великолепен, он в той или иной степени отменяет преимущество технологии HybridPower, для которой нужно менять материнскую плату, чтобы полностью отключать внешнюю 3D-карту, теряя при этом игровую 3D-производительность!

Уровень шума

Учитывая низкое энергопотребление в режиме бездействия и высокое, но не чрезмерное энергопотребление под нагрузкой, мы были уверены, что GT200 от nVidia будет соответствовать репутации относительно тихих high-end видеокарт со времён GeForce 7800 GTX. Мы ошибались.

Уровень шума

После старта Windows вентилятор GT200 работал тихо (516 об/мин или 30% от максимальной скорости). Затем, после запуска игры, он превращал компьютер в пылесос, достигая уровня шума, который вряд ли можно назвать терпимым - особенно у GTX 280. GTX 260 показала себя чуть лучше, но тоже сильно шумела на 1 250 об/мин (причём шумел воздушный поток, а не сам вентилятор). Впрочем, наши значения шума в режиме бездействия замерялись после проведения всех тестов, после всего нескольких минут бездействия. Проблема в том, что GTX 280 никогда не спускается обратно на минимальный уровень, да и вентилятор GTX 260, который шумит меньше, всё равно вращается на 700 об/мин - относительно громко.

Результаты сложно понять, учитывая низкое энергопотребление GT200 в режиме бездействия, они могут быть связаны как с ошибкой в BIOS (хотя она тогда проявлялась на обеих видеокартах) или в драйверах, что оставляет надежду на исправление. С другой стороны, вентилятор всегда можно заметить вручную с помощью специального ПО, если вы будете следить за температурой (см. следующую страницу). В общем, вентиляторы данных видеокарт нас сильно разочаровали, особенно с учётом того, что часть горячего воздуха возвращается обратно в корпус и нагревает другие компоненты, включая сам GPU.

Наконец, мы обратили, что и аналогично тестам энергопотребления, результаты 3870 X2 под нагрузкой слишком хорошие. Тому есть причина: Test Drive Unlimited одна из немногих игр, в которой у этой видеокарты работает только один GPU, что снижает нагрев.

Температуры, разгон

Теперь давайте посмотрим на температуру GPU, которую мы записали (для Radeon HD 3870 X2 она указана для активного GPU, вторая температура никогда не превышает 56°C под нагрузкой).

Температуры, разгон

Неудивительно, что 260 GTX и 280 GTX очень хорошо охлаждаются - мы получили самые низкие температуры в режиме бездействия и одни из самых низких под нагрузкой. Неудивительно, поскольку данные видеокарты потребляют не самый высокий уровень энергии, и, как мы уже упоминали, используют агрессивную систему охлаждения. Мы так никогда и не подошли к уровню 105°C, когда частоты автоматически уменьшаются для защиты видеокарты. То есть, как мы и предполагали, nVidia имеет хороший запас для снижения уровня шума видеокарты как в режиме бездействия, так и под нагрузкой.

Разгон

В тестах разгона мы смогли разогнать GeForce GTX 260 с частот 576/1242/999 МГц (GPU/ALU/память) до 648/1397/1184 МГц, то есть на 12% и 18%, соответственно. Результат неплохой, он позволил выжать ещё 16% или 8,4 кадров в секунду в тестах 2 560 x 1 600 в Test Drive Unlimited - всего на 6% медленнее, чем GTX 280!

Вполне понятно, что мы разогнали и GTX 280: с частот 602/1296/1107 МГц до 655/1410/1290 при сохранении очень хорошей стабильности, с приростом 9% и 16%. Test Drive Unlimited вновь выиграла от прироста, увеличив частоту кадров на 13% - весьма неплохо по сравнению с 16%, которые мы получили у 9800 GTX. В целом, результаты приятные, особенно для разгона, который иногда определяется больше долей везения.

Заключение

Каково будет наше заключение по поводу новых видеокарт? Начнём с того, что параллель с GeForce 7800 GTX слишком очевидна. Карты построены на уже проверенной архитектуре, с исправленными слабыми местами, которые обнаружили инженеры nVidia, и с существенным приростом вычислительной мощности. Поэтому никаких неприятных сюрпризов по поводу архитектуры мы не выявили, за возможным исключением отсутствия поддержки Direct3D 10.1 или немного разочаровывающей производительности с числами с плавающей запятой двойной точности.

С другой стороны, в отличие от современной ситуации, во времена 7800 GTX у nVidia не было такой мощной видеокарты с двумя GPU, какой является 9800 GX2. Это можно считать недостатком во время объявления новых продуктов. У GTX 280 практически удвоилась чистая теоретическая производительность по сравнению с предыдущим поколением (и даже практическая производительность благодаря улучшению эффективности, хотя некоторые наши синтетические тесты не показали такое увеличение скорости, на какое мы надеялись). Но GTX 280 не так хорошо работает по сравнению с 9800 GX2, которая часто обгоняет новинку в игровых тестах. Конечно, вряд ли имеет смысл рекомендовать карту предыдущего поколения, которая имеет в два раза меньше полезной памяти и намного более высокое энергопотребление в режиме бездействия (если не считать других недостатков), её результаты в тестах всё же отняли часть славы у новой экстремальной high-end видеокарты. В этом сложно винить nVidia, поскольку на уже гигантском ядре сложно увеличивать число потоковых процессоров (АЛУ). Да и сравните с производительностью конкурента.

Есть ещё несколько огорчений. И самое основное среди них - очень высокий уровень шума, который сложно для GTX 280 и 260 сложно объяснить, поскольку их энергопотребление ниже, чем у видеокарт с двумя GPU под нагрузкой и очень незначительное в режиме бездействия. Не забывайте и про отсутствие поддержки DirectX 10.1, что можно назвать явно политическим выбором, который замедлит или даже предотвратит распространение этого стандарта среди разработчиков, а это несколько обидно в свете игры Assassin's Creed. Да и цена GTX 280 ($650 на мировом рынке), благодаря которой карта позиционируется на самый экстремальный high-end, тоже весьма проблематична в свете очень агрессивной цены на "младшую" GTX 260 - а производительность последней всего на 18% уступает "старшей" модели. Цена для GTX заявлена почти в два раза ниже - $400! В итоге на дату начала продаж (26 июня) видеокарта станет весьма привлекательным решением, тем более, что она использует такой же GPU GT200.

Наконец, мы не можем не упомянуть очень интересных перспектив приложений CUDA. Хотя последние полтора года почти никто не упоминал CUDA в качестве позитивных особенностей GeForce 8, но сегодня ситуация изменилась, первые три интересные приложения уже готовы или почти готовы. Мы имеем в виду кодировщик видео BadaBOOM и бета-клиент Folding@Home GeForce, которые оставляют CPU и конкурирующие Radeon далеко позади, а также и поддержку GeForce PhysX, которая немало бы дала разработчикам. Они смогли бы объявить о поддержке технологии в следующих играх, хотя нам ещё предстоит оценить, какую разницу даст реализация на практике. Всё это существенно расширяет сферу применения CUDA-совместимых GeForce GPU (начиная с GeForce 8), если выход оптимизированного ПО для разных вычислений продолжится, и если AMD не попытается "перетянуть одеяло на себя".

nVidia GeForce GTX 280

Заключение по GTX 280 будет таково. Новая экстремальная high-end видеокарта GTX 280 от nVidia ($650) немного уступает в сравнении с 9800 GX2, которая регулярно выходит в лидеры в игровых тестах, несмотря на все недостатки карт с двумя GPU. Но, в реальности, настоящей угрозой является "младшая" модель GTX 260, особенно с учётом того, что за цену GTX 280 вы почти что сможете купить две GTX 260 в SLI!

Преимущества.

  • Улучшенная архитектура GeForce 8;
  • общая высокая производительность;
  • очень низкое энергопотребление в режиме бездействия;
  • ускорение CUDA-совместимых программ.

Недостатки.

  • Нет поддержки DirectX 10.1;
  • слабая производительность по сравнению с 9800 GX2;
  • высокий уровень шума;
  • высокая цена GTX 280 по сравнению с конкурентами nVidia.

nVidia GeForce GTX 260

Карта намного более привлекательная благодаря очень приятной цене. GTX 260 достойно себя показывает в игровых тестах и имеет большинство преимуществ GTX 280 без высокой цены. Карта начнёт продаваться на следующей неделе на мировом рынке за $400.

Мы вынуждены обратить внимание, что представительство nVidia в России работает неудовлетворительно: мы до сих пор не получили никакой информации ни о ценах, ни о доступности карт в нашей стране. Будем надеяться, что в России не станут задирать на них цены.

Преимущества.

  • Улучшенная архитектура GeForce 8;
  • производительность всего на 18% уступает GTX 280;
  • очень низкое энергопотребление в режиме бездействия;
  • ускорение CUDA-совместимых программ.

Недостатки.

  • Нет поддержки DirectX 10.1;
  • высокий уровень шума.

Мы выдаём GTX 260 награду "Рекомендовано к покупке", поскольку производительность видеокарты великолепная, а цена на 45% меньше GTX 280.

Заключение по производительности

Заключение по производительности

Заключение по производительности




Свежие статьи
RSS
Лучшие игровые ноутбуки: текущий анализ рынка Искусственный интеллект: правда и вымысел Лучший процессор для игр: текущий анализ рынка Главные новости за неделю Лучшая материнская плата: текущий анализ рынка
Лучшие игровые ноутбуки Искусственный интеллект Лучший процессор для игр Главные новости за неделю Лучшая материнская плата
РЕКЛАМА
РЕКОМЕНДУЕМ ПРОЧЕСТЬ!

История мейнфреймов: от Harvard Mark I до System z10 EC
Верите вы или нет, но были времена, когда компьютеры занимали целые комнаты. Сегодня вы работаете за небольшим персональным компьютером, но когда-то о таком можно было только мечтать. Предлагаем окунуться в историю и познакомиться с самыми знаковыми мейнфреймами за последние десятилетия.

Пятнадцать процессоров Intel x86, вошедших в историю
Компания Intel выпустила за годы существования немало процессоров x86, начиная с эпохи расцвета ПК, но не все из них оставили незабываемый след в истории. В нашей первой статье цикла мы рассмотрим пятнадцать наиболее любопытных и памятных процессоров Intel, от 8086 до Core 2 Duo.

ССЫЛКИ