РЕКЛАМА
ИНФОРМАЦИЯ
ПОЛЕЗНЫЕ ССЫЛКИ
ATI Radeon HD 5970 2GB: самая быстрая видеокарта в мире

nVidia GeForce GTX 295: первые тесты

ATI Radeon HD 5870: DirectX, Eyefinity и прекрасная скорость

Rambler's Top100 Рейтинг@Mail.ru

ВИДЕОКАРТЫ

nVidia GF100: графическая архитектура нового поколения
Краткое содержание статьи: Многие геймеры с нетерпением ждут появления на рынке архитектуры nVidia GF100 следующего поколения. Она действительно припозднилась, но сегодня мы получаем всё больше и больше подробностей о GF100. nVidia обещает представить видеокарты на новом графическом процессоре в первом квартале 2010. Остаётся только ждать, но между тем нам удалось получить некоторые подробности об архитектуре GF100, которыми мы поделимся с нашими читателями.

nVidia GF100: графическая архитектура нового поколения


Редакция THG,  18 января 2010
Страница: Назад  1 2 3 Далее


Зачем перестраивать GF100? Причина одна: геометрия

Успешные архитектуры не переделывают просто для того, чтобы потешить публику. Есть немало причин в решении nVidia оснастить каждый кластер GPC собственным движком растеризации, а каждый мультипроцессор SM - так называемым движком PolyMorph (нет, игроки WoW, вы не о том подумали).

nVidia GF100

Нажмите на картинку для увеличения.

Сначала главное: движок PolyMorph состоит из пяти ступеней логики с фиксированными функциями, которая работает совместно с остальной частью мультипроцессора SM, чтобы запрашивать вершины, выполнять тесселяцию, трансформацию области просмотра, настройку атрибутов и запись в память. Между каждым этапом потоковый мультипроцессор SM обеспечивает функции vertex/hull shading и domain/geometry shading. Из каждого движка PolyMorph примитивы отсылаются на движок растеризации, каждый из которых способен обрабатывать восемь пикселей на такт (в сумме 32 пикселя за такт по всему чипу).

Зачем нужно было разбивать обработку геометрии на все эти этапы по сравнению с монолитной "передней частью" конвейера, которая в прошлом работала замечательно? В конце концов, не активировала ли AMD блоки тесселяции ещё в шестом поколении своих GPU (помните TruForm в 2001)? Да, верно. Но сколько игр с тех пор смогли получить преимущество от блоков тесселяции? В этом суть.

nVidia GF100

Нажмите на картинку для увеличения.

nVidia GF100

Нажмите на картинку для увеличения.

Ещё с дней архитектуры Nvidia GeForce 2 мы слышим о программируемых пиксельных и вершинных шейдерах. Сегодня мы получили весьма впечатляющие шейдеры, которые добавляют огромное количество деталей в последние игры DirectX 9 и 10 (Nvidia заявляет о 150x увеличении производительности шейдеров при переходе с линейки GeForce FX 5800 на GT200). Но все мы видели не самую идеальную геометрию ландшафта, которая полностью "хоронит" реализм наших любимых игр. Вероятно, следующей планкой в поднятии реализма графики будет увеличение детализации геометрии.

DirectX 11 реализует подобный шаг через три новых этапа в конвейере рендеринга: шейдер корпуса (hull shader), который вычисляет трансформации контрольных точек, тесселятор (tessellator), который добавляет тесселяцию к шейдеру корпуса и выдаёт доменные точки (domain points) и шейдер домена (domain shader), который уже обрабатывает эти точки.

nVidia GF100

Нажмите на картинку для увеличения.

Но чтобы получить производительность, которая бы позволяла эффективно реализовывать тесселяцию, nVidia пришлось перейти с монолитной "передней части" конвейера на более параллельный дизайн. Поэтому мы получили четыре блока растеризации и 16 движков PolyMorph. Вполне естественно, что у компании есть собственные демонстрации, показывающие, насколько более эффективен дизайн GF100 по сравнению с архитектурой Cypress, которая упирается в "узкий" монолитный дизайн. Впрочем, мы бы всё же хотели сравнить производительность в таких играх, как Aliens Vs. Predator от Rebellion Developments с включённой и выключенной тесселяцией. В любом случае, nVidia заявляет о том, что GF100 обеспечивает до 8x лучшую производительность, чем GT200 в окружениях, упирающихся в геометрию.

Не просто вычислительная архитектура

До объявления деталей о выходе GF100 мы уже немало слышали о том, что компания воспринимает новинку как возможность изменить свою роль в графике с акцентом на вычисления на GPU. Конечно, представители nVidia первыми выразили опасения по поводу этого "мифа", но всё же компания сама виновата за распространение подобного мнения.

Архитектура Fermi была впервые объявлена на собственной конференции nVidia GPU Technology Conference в конце сентября 2009 года, и в то время обсуждались только характеристики дизайна, относящиеся к вычислениям. Подобное объявление через неделю после выхода ATI Radeon HD 5870 произвело довольно сильный эффект, поскольку финальный продукт (по слухам) должен был появиться не раньше, чем через квартал, а AMD уже поставляла на рынок первые в мире видеокарты с поддержкой DirectX 11. В любом случае, мы с интересом ознакомились с одним из первых детальных обзоров возможностей архитектуры Fermi.

Не просто вычислительная архитектура

Конечно, сейчас nVidia пытается всех убедить, что она и не отходила от основной идеи графической производительности. Архитектура GPC, с акцентом на геометрии, а также полное соответствие DirectX 11 должны убедить всех сомневающихся. Впрочем, беглый взгляд на GF100 всё равно показывает, что компания пыталась достичь баланса между вычислениями и графикой, включая такие намёки, как работу с числами с плавающей запятой двойной точности или архитектуру кэша на чипе.

Каждый из 16 потоковых мультипроцессоров SM поддерживает собственные 64 кбайт общей памяти/кэша L1, которые могут быть сконфигурированы, например, как 16 кбайт общей памяти/48 кбайт кэша L1 или наоборот. У GT200 использовалось 16 кбайт общей памяти на мультипроцессор SM, чтобы данные были как можно ближе, то есть чтобы минимизировать обращение к кадровому буферу за информацией. Расширив этот массив памяти и сделав его фактически динамически настраиваемым, nVidia решила одновременно и проблемы графики, и вычислений. Например, в сценариях расчёта физики или трассировки лучей у вас нет предсказуемого механизма адресации, так что небольшая общая память/большой кэш L1 улучшают работу с памятью. Это будет особенно заметно, когда разработчики начнут лучше использовать преимущества DirectCompute в своих играх.

GT200 GF100 Преимущества
Текстурный кэш L1 (на квад) 12 кбайт 12 кбайт Текстурная фильтрация
Выделенный кэш L1 загрузки/ хранения Нет 16/48 кбайт Полезен в расчётах физики/ трассировки лучей
Общая память 16 кбайт 16/48 кбайт Более эффективное повторное использование данных между потоками
Кэш L2 256 кбайт (только чтение текстур) 768 кбайт (все операции чтения/запись клиентов) Производительность вычислений, покрытие текстур

Сейчас графический процессор обладает 768 кбайт кэша L2, который существенно больше и функциональнее, чем 256 кбайт кэша GT200, использовавшегося только для чтения текстур. Из-за унификации кэш L2 у GF100 заменяет кэш текстур L2, кэш ROP и буферы FIFO чипа, поскольку любой клиент может считывать информацию из кэша или записывать её в кэш. Это ещё одна область, в которой nVidia явно нацелилась на повышение вычислительной производительности. Впрочем, производительность в играх тоже должна возрасти, поскольку мультипроцессоры SM при работе над одними и теми же данными будут реже обращаться в память.

Конечно, верно, что GF100 представляет собой серьёзный шаг вперёд в области того, что сторонние разработчики смогут сделать в сфере вычислений. Катализатором служит и то, что стандарты DirectCompute и OpenCL уже доступны, AMD поддерживает оба API, а в будущем мы должны увидеть повышение реализма игр через поддержку вычислений на GPU. Трассировка лучей (используемая как по отдельности, так и вместе с растеризацией), рендеринг вокселей, изменение глубины резкости, гидродинамика частиц и поиск пути AI - всё это потенциальные сферы, в которых проявят себя вычисления на GPU.

Поддержка Surround

Мы ещё помним времена, когда Matrox запускала свою видеокарту Parhelia. Однослотовая видеокарта позволяла подключать до трёх дисплеев через переходник. Как можно догадаться по названию, технология Surround Gaming позволяла играть на трёх мониторах (GPU даже поддерживал адаптивную тесселяцию полигонов - в 2002 году!) К сожалению, видеокарта Parhelia была недостаточно быстрой, чтобы насладиться игрой даже на одном мониторе, не говоря уже о трёх.

Выход ATI Radeon HD 5870 дал нам достаточно 3D-производительности даже в разрешении 2560x1600, причём графическая мощь даже оставалась. Конечно, игра в разрешении 5760x1200 в режиме Eyefinity даёт существенную нагрузку на GPU Cypress, но играть всё же можно - и даже с наслаждением!

nVidia столкнулась со схожей ситуацией с GF100 - GPU должен обеспечивать существенную графическую производительность. Включение GeForce 3D Vision может задействовать часть бюджета производительности, поскольку стереоскопический рендеринг уполовинивает частоту кадров. Но nVidia, вне всякого сомнения, испытывает давление со стороны технологии Eyefinity, причём открывается путь и весьма интересной реализации 3D Vision Surround. Технология поддерживает дисплеи с разрешением до 1920x1080 и может выводить стереоскопический рендеринг до трёх ЖК-мониторов 120 Гц. Конечно, добавление коррекции на рамку монитора приводит к тому, что между дисплеями вы получаете невидимую область, скрывающую часть пространства игры, но nVidia указывает, что это как раз ближе по реалистичности к виду из окон кабины.

nVidia GF100

Нажмите на картинку для увеличения.

Если вы не готовы потратить деньги на три 120-Гц дисплея, то nVidia поддерживает и обычный режим Surround - та же самая технология на тройке дисплеев с разрешением 2560x1600, очень похожая на Eyefinity. Но есть и два существенных отличия. Первое: обе функции будут реализованы в "будущем драйвере", который, как сообщают, должен появиться к тому моменту, как на рынок выйдут видеокарты GF100 (причём будет поддерживаться не только GPU GF100, но и видеокарты GT200 тоже смогут выводить режим 3D Vision Surround). Второе: для конфигураций с тремя дисплеями потребуется установка SLI, поскольку GPU GT200 и GF100 поддерживают выходы только на два монитора.

Преимущества: вы получите приличный потенциал производительности в играх, объединив три дисплея 1920x1080 (5760x1080) в стерео.

Недостатки: при существующих ценах на GeForce GTX 285, вам придётся выложить за видеокарты Nvidia Surround весьма приличную сумму, сопоставимую с одной Radeon HD 5970. А если требуется поддержка стереоскопии, то следует дождаться появления Acer G245 - сегодня вы будете, по большей части, ограничены небольшими панелями 1680x1050 от ViewSonic и Samsung.

Заключение

nVidia обещает, что мы должны увидеть видеокарты на основе GF100 в первом квартале этого года - то есть в течение следующих двух месяцев или через шесть месяцев после того, как AMD начала поставки своей видеокарты Radeon HD 5870. Немалый срок для индустрии ИТ. Но если одна GF100 хорошо покажет себя в современных играх и сможет конкурировать с флагманом AMD Radeon HD 5970, то мы можем с уверенностью сказать, что выпуск видеокарт DirectX 11 на полгода позднее вряд ли омрачит будущее Nvidia, пусть даже сегодня компания получает немало критики.

Но больше всего нас беспокоит то, что чип с тремя миллиардами транзисторов вряд ли будет продаваться по доступным ценам. По крайней мере, пока мы не увидим на рынке появление производных от него, видеокарты GF100 останутся эксклюзивом для тех геймеров, которые могут себе позволить топовые видеокарты в линейке Radeon HD 5800.

Впрочем, если вы ждёте новых событий на рынке high-end графики, то скоро будете вознаграждены. Сложно не обсуждать представленные nVidia спецификации, и они действительно впечатляют. Мы должны получить более чем двукратное увеличение производительности в современных играх по сравнению с GeForce GTX 285, а также невероятный потенциал в будущих играх (благодаря архитектуре, оптимизированной под сложную геометрию, и GPU с расширенной поддержкой вычислительных способностей). Так что GF100 может оказаться одним из революционных дизайнов nVidia.

Конечно, мы не можем относиться к результатам nVidia с полным доверием. Все результаты тестов, которые были нам представлены, были получены на собственных компьютерах nVidia с видеокартами, чьи частоты не объявлены. И в данном случае у нас есть только предварительные данные. Да и видеокарты должны получиться дорогими, "прожорливыми" и горячими. Мы по-прежнему не знаем точный срок выхода, ассортимент моделей на GPU GF100 и цены.

Между тем AMD выпускает видеокарты DirectX 11 по ценам от $99 до $649 (впрочем, вам придётся потратить не меньше $150, чтобы получить нормальную производительность DirectX 11). Вы сразу же получите поддержку Eyefinity, что весьма полезно и для погружения в игры, и для плодотворной работы на нескольких мониторах. Да и новые видеокарты AMD весьма хорошо вписываются в окружение домашнего кинотеатра.

Время покажет

AMD последние месяцы наслаждается своим лидирующим положением на рынке видеокарт, но "зелёная" команда nVidia готовится к мощному и длительному рывку, который обещает оказаться весьма впечатляющим, когда видеокарты GF100 начнут появляться на рынке. Скорее всего, видеокарты предоставят геймерам собственные преимущества, добавят производительности в играх и в вычислениях PhysX и CUDA, а также скорости в поддержке GeForce 3D Vision. GF100 - весьма амбициозный проект, с этим не поспоришь. Но нам нужно заполучить видеокарту в лабораторию, чтобы на практике оценить усилия nVidia.


СОДЕРЖАНИЕ

nVidia GF100: отзывы в Клубе экспертов THG [ 278 отзывов] nVidia GF100: отзывы в Клубе экспертов THG [ 278 отзывов]


РЕКЛАМА
РЕКОМЕНДУЕМ ПРОЧЕСТЬ!

История мейнфреймов: от Harvard Mark I до System z10 EC
Верите вы или нет, но были времена, когда компьютеры занимали целые комнаты. Сегодня вы работаете за небольшим персональным компьютером, но когда-то о таком можно было только мечтать. Предлагаем окунуться в историю и познакомиться с самыми знаковыми мейнфреймами за последние десятилетия.

Пятнадцать процессоров Intel x86, вошедших в историю
Компания Intel выпустила за годы существования немало процессоров x86, начиная с эпохи расцвета ПК, но не все из них оставили незабываемый след в истории. В нашей первой статье цикла мы рассмотрим пятнадцать наиболее любопытных и памятных процессоров Intel, от 8086 до Core 2 Duo.

ССЫЛКИ