Обзор видеокарт Nvidia GeForce GTX 970 и 980 | Представляем устройства с новым чипом Maxwell
Компания применяет в Maxwell те же приёмы, которые она успешно реализовала в Tegra на GeForce: каждый компонент графического процессора работает на максимуме возможностей с учётом крайне ограниченного энергопотребления. Но энтузиастам нужна не только эффективность: в большинстве своём от игровых систем им нужно быстродействие. И мы действительно ожидали появления высокопроизводительных видеокарт на чипе Maxwell с тех пор, как появилась
![]() |
GPU GM204 в них похож на масштабированный в соответствии с графическими потребностями GM107, который используется в
Несмотря на сходство обоих GPU, преимущество GM204 над GM107 заключается в существенном количестве усовершенствований. Например, каждый из SMM в GeForce GTX 980 имеет 96 Кбайт общего адресного пространства для выполнения вычислений, в отличие от
В отличие от GM107, GM204 обладает четырьмя GPC вместо одного, так что в работе задействованы четыре блока растеризации. Конечно, высококлассным видеокартам требуется более мощный "тыл" для обработки всех данных, и GeForce GTX 980 использует четыре блока растеризации, способных обрабатывать 16 полноцветных операций ROP за такт. Четыре 64-битных контроллера в совокупности составляют 256-битную шину. Наверное, вы заметили, что 13 SMM у GeForce GTX 970 не могут быть поровну распределены на 4 GPC, и Nvidia утверждает, что в этой видеокарте нет определённого набора SMM на каждый GPC, так что каждый графический процессор может быть сконфигурирован по-разному.
GeForce GTX 980 работает на базовой частоте 1126 МГц, повышенная частота с GPU Boost составляет 1216 МГц, в то время как соответствующие показатели GeForce GTX 970 равны 1050 и 1178 МГц. Обе модели содержат 4 Гбайт памяти GDDR5 с частотой 1750 (7000) МГц и пропускной способностью 224 Гбайт/с.
Модель | Nvidia GeForce GTX 980 | Nvidia GeForce GTX 970 | Nvidia GeForce GTX 780 Ti | Nvidia GeForce GTX 780 |
Лучшая цена в США, $ (в России, руб) | 549 | 329 | 618 | 670 |
GPU | GM204 (Maxwell) | GM204 (Maxwell) | GK110 (Kepler) | GK110 (Kepler) |
Техпроцесс | 28 нм | 28 нм | 28 нм | 28 нм |
Кол-во шейдерных ядер | 2048 | 1664 | 2880 | 2304 |
Блоки текстур | 104 | 104 | 240 | 192 |
Блоки растеризации | 64 | 64 | 48 | 48 |
Частота GPU, МГц | 1126 | 1050 | 875 | 863 |
Частота памяти, МГц | 1750 | 1750 | 1750 | 1502 |
Шина памяти, бит | 256 | 256 | 384 | 384 |
Пропускная способность памяти, Гбайт/с | 224 | 224 | 336 | 288,4 |
Объём видеопамяти, Гбайт | 4 | 4 | 3 | 3 |
DirectX, Shader, OpenG | 12/?/? | 12/?/? | 11/5.0/4.3 | 11/5.0/4.3 |
TDP макс., Вт | 165 | 145 | 250 | 250 |
Разъёмы питания | 2x 6-pin | 2x 6-pin | 1x 6-pin, 1x 8-pin | 1x 6-pin, 1x 8-pin |
Минимальная мощность блока питания, Вт | 500 | 500 | 600 | 600 |
Возможно, лучше сравнивать GM204 с GK110 Kepler в видеокарте
Мы ожидаем, что GeForce GTX 980 сможет конкурировать с
Необходимо также затронуть вопрос эффективности Maxwell. TDP GeForce GTX 980 составляет 165 Вт, и это не опечатка, хотя данный показатель почти на 100 Вт меньше, чем у
Независимо от более эффективной архитектуры Maxwell, GeForce GTX 980 демонстрирует падение пиковой пропускной способности памяти на 33% в сравнении с
Следует отметить, что в GM204 также улучшена работа тесселяции. PolyMorph Engine 2.0 использовался и в Kepler, и даже в GM107 на Maxwell, но в GM204 уже применяется PolyMorph третьей ревизии. Представители Nvidia утверждают, что при улучшениях архитектуры можно добиться прироста производительности до 50% при высоких степенях тесселяции.
Новый GPU также имеет несколько уникальных параметров для связи с внешним источником сигнала: GeForce GTX 970 и GeForce GTX 980 стали первыми видеокартами в мире с поддержкой HDMI 2.0, позволяя получить изображение с разрешением 4К на частоте 60 Гц в сравнении с HDMI 1.2, поддерживающим предельную частоту 30 Гц. Референсная видеокарта также имеет два выхода DisplayPort 1.2 и двухканальный DVI, в то время как GPU способен одновременно работать с четырьмя дисплеями 4К при помощи движка, поддерживающего разрешение потенциально до 5К.
Nvidia также включила возможность аппаратного кодирования H.265. Что касается поддержки H.264, то пропускная способность аппаратного кодировщика видео в Maxwell на карте
Nvidia не раскрывает сведения о том, используется ли в GeForce GTX 980 полная версия GM204. Вполне возможно, что будущий продукт получит даже больше (или меньше) ядер CUDA.
Обзор видеокарт Nvidia GeForce GTX 970 и 980 | Новые особенности
GM204 имеет обширный выбор возможностей, и мы давно не видели графического процессора с таким набором возможностей. Некоторые из этих функций сразу пригодятся геймерам, в то время как остальные, безусловно, будут полезны в будущих продуктах. Давайте начнём с тех, которые уже актуальны.
Динамическое сверхвысокое разрешение (DSR)
DSR – это функция, которая помогает сгладить неровности по краям пикселей – данный эффект называется "алиасинг" или "наложение". Проще говоря, DSR и является формой антиалиасинга.
Те, кто знаком с понятием антиалиасинга, вероятно, знают о старейшей, наиболее визуально совершенной, и, возможно, самой требовательной к ресурсам доступной технике сглаживания SSAA (SuperSampling Anti-Aliasing). SSAA обрабатывает игру на более высоком разрешении, чем установлено, а затем происходит сжатие до необходимого разрешения. В результате артефакты алиасинга. Однако самая большая проблема SSAA – это высокие требования к аппаратным ресурсам, так что большинство игровых движков вообще игнорируют данную функцию. Иногда можно заставить её работать при помощи драйвера, но это ненадёжный способ.
При помощи DSR Nvidia задействует антиалиасинг на основе суперсэмплинга в обход ограничениям по использованию сглаживания, и тогда видеокарты GeForce GTX 970/GeForce GTX 980 в режиме реального времени осуществляют сжатие изображения высокого разрешения до нативного разрешения монитора. Это позволяет получить преимущества сглаживания SSAA без обязательной поддержки сглаживания на уровне ПО. Nvidia утверждает, что DSR может использоваться, пока движок игры способен осуществлять рендеринг высокого разрешения.
Что касается недостатков технологии, то DSR, как и SSAA, негативно влияет на производительность. Выбор виртуального 4К-разрешения в игре для просмотра в 1080p приведёт к той же потере производительности, что и при рендеринге изображения для 4К-монитора. При даунсемплинге может наблюдаться незначительная задержка сверх имеющейся, что мы планируем проверить в тестах. В связи с этим, DSR более пригодна для использования с легкими игровыми движками и более старыми играми. К примеру, при частоте кадров 120 FPS на максимальных настройках детализации в Counter-Strike DSR может помочь обеспечить большую точность изображения без заметного снижения частоты кадров.
Ещё один ограничивающий фактор DSR – это масштабируемость интерфейса. Не все игры, способные технически справиться с 4К-разрешением, могут быть кодированы с точки зрения пользовательского интерфейса. Многие современные игры имеют гибкий интерфейс, но старые игры, которые могли бы выгодно использовать DSR, могут стать непригодными из-за экранных кнопок и индикаторов, которые едва можно различить на разрешении 3840x2140 пикселей. Конечно, DSR не ограничивается конкретным разрешением, так что пользователи могут задать, например, 2560x1440 пикселей, хотя это будет не так эффективно с точки зрения сглаживания.
DSR доступна через программное обеспечение GeForce Experience и позволяет настроить резкость фильтра даунсемплинга. Хотя эта функция пока будет доступна на GeForce GTX 970 и GeForce GTX 980, со временем она будет применяться и в остальной продукции GeForce.
На наш взгляд, это отличный метод, который может обеспечить желаемое усовершенствование картинки во многих не слишком передовых с точки зрения графики игр. Использование её для обеспечения обратной совместимости мониторов и стары игр выглядит многообещающе.
Многокадровое сглаживание (MFAA)
MFAA – это ещё один метод уменьшения проявлений артефактов, который используют видеокарты GeForce GTX 970 и GeForce GTX 980. Как и в случае с DSR, в данном случае задействована более старая технология, и одно из ключевых преимуществ её новой вариации состоит в том, что Nvidia реализовала её так, чтобы она имела совместимость с движком игры. Ключевое различие между двумя технологиями заключается в том, что DSR предназначена для улучшения точности изображения в играх за счёт производительности. В свою очередь, MFAA используется для повышения производительности без ущерба для визуальной точности.
По своей сути, технология MFAA очень похожа на режим антиалиасинга Temporal MSAA, реализованный в Radeon X800. AMD с тех пор отказалась от него из-за недостатков во внедрении, однако, похоже, Nvidia сумела возродить технологию и улучшить её благодаря временному фильтру синтеза.
Для тех, кто незнаком с Temporal MSAA, укажем, что в технологии используется смена паттернов MSAA от кадра к кадру. Например, 2x Temporal MSAA может соответствовать 4x MSAA, что требует вдвое большее количество фильтров на пиксель и приводит к снижению частоты кадров. Проблема Temporal MSAA заключается в том, что визуальные артефакты могут появиться неожиданно, к тому же необходимо сохранять высокую частоту кадров. При падении частоты кадров ниже 60 FPS эффект отключается.
Возможно, Nvidia решила эти проблемы при помощи временного фильтра синтеза, которые использует оба пиксельных образца относительно времени и движения в сцене и усредняет результат. Это позволяет MFAA работать с частотой кадров не ниже 60 FPS и минимизировать артефакты при движении камеры.
Конечно, когда пользовательская камера двигается очень быстро, MFAA может за ней не успеть, но вся прелесть состоит в том, что при быстром движении камеры артефакты алиасинга невозможно заметить. Если технология работает так, как утверждает Nvidia, то качество сглаживания 4x MSAA может обеспечиваться при уровне производительности, требуемого для 2x MSAA.
Технология будет представлена в самое ближайшее время, но в GeForce GTX 970 и GeForce GTX 980 MFAA не реализована. Более подробная информация о технологии будет доступна позже.
VR Direct
Теперь мы обратимся к функциям, которые находятся в стадии разработки и, может быть, не появятся ещё в течение нескольких месяцев. Одна из таких – VR Direct – разработана для работы в виртуальной реальности, например, при использовании таких носимых дисплеев, как Oculus Rift.
Если вы поклонник решений в области виртуальной реальности, то, возможно, уже смогли оценить потенциальную пользу от использования DSR в Oculus Rift. Так как 1080p-экран разделяется на два дисплея с разрешением 960x1080 пикселей для каждого глаза, потенциал технологии, позволяющей минимизировать алиасинг, в этом случае очевиден. MFAA – это также подходящий тип технологии антиалиасинга для HMD-устройства, так как лёгкая вычислительная нагрузка 2x MFAA обеспечивает меньшую дополнительную задержку по сравнению с 4x MSAA.
Говоря о задержке, Nvidia уже работает над устранением этой проблемы в графическом конвейере VR. Задержка может парализовать работу HMD-устройств, мешая при этом пользователю. Asynchronous Warp – технология, которая предназначена для борьбы с задержкой у HMD. Она обрабатывает максимальную графическую нагрузку раньше времени, а затем повторно проверяет положение HMD перед самим рендерингом и регулирует положение кадра для лучшей синхронизации изображения с положением головы пользователя.
Кроме того, компания упоминала возможность включения автоматического стереодрайвера. При пользовании Oculus Rift мы подумали о том, как было б хорошо, если бы Nvidia включила поддержку HMD в 3D Vision, чтобы пользователи прочувствовали виртуальную реальность в играх, не имеющих встроенной поддержки VR. Очевидно, что кто-то в Nvidia уже разрабатывал эту идею, так что мы ждём, когда компания её реализует в своих устройствах.
DirectX 12
Microsoft объявила, что её новый графический API выйдет к новогодним праздникам в 2015 году, и доступ для разработчиков к текущей сборке уже открыт. Полноценная реализация появится, возможно, позже, чем через год. Nvidia утверждает, что GeForce GTX 970 и GeForce GTX 980 совместимы с DirectX 12.
Если вы что-то слышали об этом обновлении, то знаете, что одна из особенностей DirectX 12 – это снижение нагрузки на процессор, поскольку разработчикам предоставляется более полный контроль над вычислительными ресурсами. Новые функции включают в себя упрощение состояния конвейера и распараллеливание команд, что позволяет значительно оптимизировать распределение вычислительной нагрузки между ядрами процессора.
![]() |
DirectX 12 не только более эффективно использует ресурсы процессора. Он также включает в себя новые и более эффективные функции и техники рендеринга для разработчиков, что позволяет производить правильную и постоянную обработку налагаемых полупрозрачных объектов; технология Tiled Resources облегчает рендеринг высокодетализированных текстур, сокращая расход видеопамяти; консервативная растеризация – метод для тестирования содержимого целого пикселя, что особенно полезно для обнаружения столкновений.
Можно подробно рассказать об этих технологиях, но, учитывая довольно скорый выпуск GeForce GTX 970 и GeForce GTX 980, у нас не так много времени для подробного описания спецификаций. Мы бы предпочли сконцентрироваться на новых видеокартах Nvidia и вернуться к обсуждению DirectX 12 позже, ближе к его официальному выходу. Кстати, множество функций DirectX 12 выйдет в обновлении DirectX 11.3, чтобы реализовать их в системах на Windows 7.
Технология воксельного глобального освещения (VXGI)
VXGI – возможно, самая амбициозная функция, которая имеется в GM204 (и не была реализована в GM107 в видеокарте GeForce GTX 750). VXGI переосмысляет подход к созданию игр, реализуя переход к реалистичному глобальному освещению, что предполагает огромную вычислительную нагрузку.
VXGI использует воксельное пространство и воксельную коническую трассировку для обеспечения реалистичного освещения. Такую нагрузку гораздо легче обработать, если сравнивать со стандартными методами трассировки 3D-лучей. Давайте начнём с определения некоторых из используемых нами терминов.
Воксел – это комбинация из слов "volume" и "pixel". Воксел представляет собой элемент объёмного изображения, содержащий значение элемента растра в трёхмерном пространстве. Представьте, что помещение, в котором вы находитесь, полностью заполнено невидимыми коробками, расположенными близко друг к другу вплоть до потолка. Каждая из этих коробок представляет собой воксел, объём в 3D-пространстве. Воксельная решётка используется в качестве структуры для хранения данных источника света и затенения.
Коническая трассировка – это метод, использующий различные разрешения вокселов вдоль пути светового луча для хранения данных о том, как свет влияет на объекты на своём пути. С точки зрения вычислительной нагрузки, этот процесс становится более эффективным по мере того, как увеличивается размер вокселов (при снижении разрешения), так как световой конус перемещается дальше от последней точки отражения.
Рендеринг происходит в три этапа: вокселизация сцены, ввод светового потока и, наконец, окончательная сборка. На заключительном этапе происходит геометрическая обработка, оценивается уровень освещения, и отражённый свет "собирается" для фотореалистичного результата.
Nvidia показала принцип работы VXGI на примере демонстрации посадки на Луну, реалистично воссоздав известное историческое изображение. Оно смотрится абсолютно достоверным при освещении в режиме реального времени. Оно было продемонстрировано в системе с двумя видеокартами GeForce GTX 980 в режиме SLI, но при этом данная фотография воспроизводит не самую сложную с точки зрения обработки сцену и содержит только один источник света. Потенциальные требования к вычислительным ресурсам при использовании VXGI в реальной компьютерной игре заставляют призадуматься.
Во многом, VXGI – это та технология, которая нацелена больше на разработчиков, и она потенциально упрощает способ создания игр: с нынешними игровыми движками световые эффекты должны быть привязаны к текстурам в сцене. С VXGI изображение будет обработано для игрока в режиме реального времени, позволяя разработчикам вносить изменения в уровень игры без добавления нагрузки. VX3D привлекательна для разработчиков игр, использующих новую модель освещения.
Нам кажется, что глобальное освещение и трассировка пути света неизбежны для будущей игровой графики. С потребительской точки зрения, VXGI – это ещё одна вариация вопроса про курицу и яйцо, который актуален в случае каждой революционной технологии. Мы сомневаемся в том, что GeForce GTX 970 и GeForce GTX 980 достаточно быстры для обеспечения такой высокой вычислительной мощности, которая необходима для работы технологии глобального воксельного освещения. Возможно, VXGI может быть использована для улучшения современных световых моделей, чтобы придать сцене больше реализма, но не для полной их замены. Мы с нетерпением ждём интеграции данной технологии в движок Unreal 4 в четвёртом квартале этого года, о чём Nvidia нам сообщила, и мы очень хотели бы увидеть, какой эффект она окажет на качество видео и производительность.