РЕКЛАМА
ИНФОРМАЦИЯ
ПОЛЕЗНЫЕ ССЫЛКИ
APU AMD против CPU Intel с дискретной графикой: тесты производительности

AMD Radeon HD 7970: тест видеокарты на новой архитектуре

OpenCl: приложения с ускоренной постобработкой

GeForce GTX 680: SLI, разрешение 5760x1080 и разгон

Обзор GeForce GTX 680: Kepler против Tahiti

AMD Radeon HD 7870 и Radeon HD 7850: обзор и тест видеокарт на базе GPU Pitcairn

AMD Radeon HD 7950: обзор, тест и сравнение с GeForce GTX 580

nVidia GeForce GTX 560: обзор пяти разогнанных видеокарт

Что технология DirectCompute значит для геймеров?

Rambler's Top100 Рейтинг@Mail.ru

ВИДЕОКАРТЫ

Что технология DirectCompute значит для геймеров?
Краткое содержание статьи: Мы много лет пытались узнать у AMD, на что способны приложения ускоренные графическим процессором. Наконец компания готова связать нас с независимыми разработчиками ПО (ISV) в девяти различных сегментах, чтобы продемонстрировать, как аппаратное обеспечение может помочь их оптимизированным приложениям.

Что технология DirectCompute значит для геймеров?


Редакция THG,  24 апреля 2012
Назад
Вы читаете страницу 1 из 5
1 2 3 4 5
Далее


GPGPU находит ещё одно практическое применение

Всего несколько месяцев назад представители THG начали более тесно общаться с поставщиками и разработчиками программного обеспечения, желая более подробно оценить возможности компонентов OpenCL и DirectCompute в реальных условиях. Мы стараемся максимально углубиться в данную тему, но на текущий момент рассказать особо нечего. Мы уже проводили тесты Metro 2033 с включённым и выключенным фильтром глубины резкости, который использует DirectCompute. Но пока можно только сказать, что он действительно влияет на производительность.

Наконец ситуация начала меняться. Всё больше и больше игр включают поддержку DirectCompute. В данной статье мы протестируем четыре из них: Battlefield 3, DiRT 3, Civilization 5 и, конечно, Metro 2033. В отличие от предыдущих игр, которые мы тестировали, сейчас наше внимание сконцентрировано не на чистой производительности системы или отдельных компонентов. Да, это ещё одна статья, в которой AMD оказывает помощь в технических аспектах и при разговорах с разработчиками, поэтому мы рассматриваем APU этой компании и сравниваем их с дискретными видеокартами. Но в данном материале мы изучаем не только влияние на частоту кадров. Здесь мы рассматриваем технологии, которые помогают добиться более высокого уровня реализма, который без поддержки вычислений на базе GPU был невозможен.

Нил Робисон (Neal Robison) - директор по связям с ISV из компании AMD говорит, что за последние годы получать более высокую скорость в играх, основанных исключительно на аппаратных усовершенствованиях, стало не так эффективно, как раньше. По его словам разработчикам ПО обычно не приходится переписывать свой софт, поскольку улучшения аппаратного обеспечения в большинстве случаев дадут им двойной прирост производительности по сравнению с предыдущим поколением. Но наступил тот момент, когда мы добавляем ядра, а не увеличиваем производительность отдельных компонентов. Разработчикам, по сути, придётся делать изменения в своём ПО, и в некоторых случаях фундаментальные изменения в архитектуре. Гетерогенные вычисления - это один из ключей, который позволит вам как разработчику в буквально смысле покопаться во внутренностях процессора и сделать гигантский скачок вперёд, подталкивая пользователей к обновлению своего софта.

Оценка Робисона относительно того, что разработчики будут делать с гетерогенными вычислениями имеет место, когда речь идёт о таких приложениях, как Adobe Premiere Pro CS 5 (в частности движок Mercury Playback Engine с поддержкой CUDA) и в перекодировании видео. Обе параллельных нагрузки легко используют преимущества графического процессора. Тем не менее, мы ещё не видели пользу от OpenCL или DirectCompute в играх. Оба API, кажется, позволяют разработчикам ПО, использующим новые подходы, добиться увеличения уровня реализма. Хотя нам по-прежнему интересно, как в топовых играх используются последние достижения в гетерогенных вычислениях и как они развиваются. За ответом на эти вопросы необходимо обратиться к разработчикам, и это именно то, что мы искали.

Прежде чем двигаться дальше давайте немного поговорим о производительности. В недавнем обзоре под названием "APU AMD против CPU Intel с дискретной графикой: тесты производительности" мы чётко видели пределы современных APU. Мы запускали Metro 2033, Battlefield 3, DiRT 3 и в каждом случае, в эти игры можно было играть на умеренном разрешении 1024x768, используя самые низкие настройки детализации. Больший упор на графические ресурсы для обработки OpenCL или DirectCompute не изменил ситуацию. Весьма вероятно, что вы сможете играть в любимые игры на ноутбуке, оборудованном APU, но не получите красивую картинку.

Но не забывайте, что до появления новых процессоров от Intel и новых APU Trinity от AMD осталось совсем немного. Показатели производительности должны вырасти и надлежащая поддержка обоих вычислительных стандартов почти наверняка улучшит впечатления от ваших любимых игр, и обе компании смогут обеспечить больше кадров в секунду на оборудовании нового поколения.

DirectCompute помогает реализовать Ambient Occlusion

Способность GPU выполнять большие параллельные рабочие нагрузки довольно много обсуждалась на THG. В результате разные архитектуры, CPU и GPU просто предназначены для разных типов приложений. Например, когда вы применяете эффект на изображении, операция повторяется в тысяче пиксельных элементах одновременно. Есть ли какие-нибудь предположения насчёт того, какой подход более эффективно использует доступные вычислительные ресурсы, если у вас есть четырёхядерный процессор и 2000 ALU?

В теории, такой подход к обработке может существенно увеличить пропускную способность, поскольку у вас будет память GDDR5 со скоростью 4 GT/s вместо системной памяти со скоростью 1600 MT/s или около того, а также большой прирост вычислительной производительности и производительности на ватт, когда используются верные алгоритмы. Также учитывайте, что хотя CPU всё же превосходит GPU во многих задачах, ресурсы и задержки, необходимые для коммуникации между чипами, могут сильнее навредить скорости, чем выполнение задачи только на GPU.

Использование дополнительного потенциала GPU требует дополнительной работы над софтом. Есть несколько способов использовать способности аппаратного обеспечения, и DirectCompute - часть DirectX - это API от Microsoft, связывающие GPU и приложения. В прошлом, мы рассматривали, как ранние попытки использовать универсальные вычислительные возможности графического процессора давали пользу для различных рынков, таких как рынки исследования (например, SETI @ Home и Folding @ Home), научного моделирования и изучения. Оттуда GPGPU начали просачиваться на потребительский рынок, но очень медленно, особенно видеообработка и перекодирование. Теперь мы видим, как DirectCompute и OpenCL выполняют дополнительные функции. Разработчики игр начинают применять DirectCompute для улучшения рендеринга, AI, окклюзии, освещения и физики.

Использование DirectCompute для затенения фонового освещения (Ambient Occlusion (AO))

Наиболее часто DirectCompute используется в играх для технологии Ambient Occlusion (изначально разработанной компанией Industrial Light and Magic более десяти лет назад), которая имитирует, как свет взаимодействует с поверхностью и текстурами. Лучи исходят от всей поверхности и те, которые достигают фона, добавляют яркость поверхности, в то время как луч, который ударяется о другой объект не даёт света, а поглощается. Таким образом, объекты, окружённые другими объектами тёмные, а те, которые не окружены препятствиями, более яркие.

Если представить угол в затенённом переулке, для ваших глаз он будет выглядеть темнее, поскольку в него проникает и отражается меньше света. Стены мешают проникновению света в эту область, кроме того, который отражается от соседних зданий. Технология AO ответственна за такое "улавливание света". Без неё поверхности кажутся плоскими и искусственными.

Гарет Томас (Gareth Thomas) из Codemasters представил нам скриншоты из DiRT 3, чтобы проиллюстрировать данный эффект. Обратите особое внимание на область покрышек.

AO выключено


AO включено

Как объяснил Томас, затенение фонового освещения высокой чёткости (HDAO) – это экранный эффект, который отвечает за глубину картинки и вычисляет коэффициент затемнения зависящий от того, закрыта или открыта область с точки зрения буфера глубины. Например, расщелины между покрышками на скриншотах должны быть более тёмными, поскольку меньше отражённого света может достичь этой области. HDAO можно охарактеризовать как количество отражённого света, которое может увидеть пиксель. Потом он включается в модель освещения при рендеринге сцены. Это не самый идеальный метод, поскольку глубина сцены с точки зрения камеры содержит недостаточно информации для корректного расчёта AO. Однако так определённо лучше, чем без затенения фонового освещения вообще.

Затенение фонового освещения можно также представить через пиксельные шейдеры. Разработчики могут выбирать между двумя методами, и на данном этапе нам непонятно, почему DirectCompute может быть предпочтительнее. В конце концов, в более ранних тестах мы видели как DC-эффекты оказывали значительной влияние на производительность (и не обязательно положительное). Использовать вычислительные ресурсы, чтобы получить функции, которые нельзя получить иным путём – это одно дело, но зачем выбирать DirectCompute, когда с этой работой вполне могут справиться шейдеры? Ну, для начала, DirectCompute больше не влияет на производительность в отличие от пиксельных шейдеров.

По словам Томаса, каждый пиксель, для которого рассчитывается AO, требует множества считываний глубины текстуры. В пиксельном шейдере каждое считывание текстуры занимает цикл. В вычислительном шейдере LDS (локальный обмен данными) заполнен информацией глубины текстуры, и последовательные считывания проходят намного быстрее, чем текстурная выборка.

От tbubb на umbcretrievers.wordpress.com

В этой части мы хотим вернуться к вопросу гетерогенных вычислений и насколько сегодняшнее аппаратное обеспечение адаптировано под обсуждаемые задачи. Как справляются APU по сравнению с дискретной графикой и отдельным процессором, работающими через PCI Express? Сможет ли выборка текстур, которая идёт из памяти (а APU полагаются на архитектуру общей системной памяти), помешать APU эффективно выполнять задачи, или же близость к ресурсам хост-процессора благоприятно повлияет на процесс?

Источник: www.geforce.com


Источник: www.geforce.com

Томас говорит, что HDAO требует глубину сцены только как вход. Сначала она должна быть визуализирована, но на практике в большинстве игр эта информация уже находится в g-буфере или буфере глубины. Буфер глубины – это ресурс видеопамяти и HDAO выполняется одинаково как на APU так и на GPU. Метод очень эффективный, поскольку для вывода текстуры необходима только дополнительная память. Это ещё одна причина того, почему популярность данного метода быстро растёт.

Стоит отметить один важный момент, который выявился во время наших тестов. В предстоящих результатах Battlefield 3 вы увидите, как с включённым HBAO (horizon-based ambient occlusion) APU достигает только 14 FPS, что определённо недостаточно для комфортной игры. После установки видеокарты Radeon HD 7970 результат возрастает в 8.5 раз, естественно можно предположить, что APU не может справиться с нагрузкой DirectCompute. Но не дайте себя запутать. Даже без AO система с APU достигает в среднем только 16.6 FPS.

Просто Battlefield 3 – слишком тяжёлая нагрузка для APU. Это не значит, что гетерогенная архитектура снижает производительность. Просто нужно более мощное оборудование.
Назад
Вы читаете страницу 1 из 5
1 2 3 4 5
Далее


СОДЕРЖАНИЕ

Отзывы о технологии DirectCompute в Клубе экспертов THG [ 2 отзывов] Отзывы о технологии DirectCompute в Клубе экспертов THG [ 2 отзывов]


РЕКЛАМА
РЕКОМЕНДУЕМ ПРОЧЕСТЬ!

История мейнфреймов: от Harvard Mark I до System z10 EC
Верите вы или нет, но были времена, когда компьютеры занимали целые комнаты. Сегодня вы работаете за небольшим персональным компьютером, но когда-то о таком можно было только мечтать. Предлагаем окунуться в историю и познакомиться с самыми знаковыми мейнфреймами за последние десятилетия.

Пятнадцать процессоров Intel x86, вошедших в историю
Компания Intel выпустила за годы существования немало процессоров x86, начиная с эпохи расцвета ПК, но не все из них оставили незабываемый след в истории. В нашей первой статье цикла мы рассмотрим пятнадцать наиболее любопытных и памятных процессоров Intel, от 8086 до Core 2 Duo.

ССЫЛКИ
Реклама от YouDo
Компьютерная помощь: сколько стоит у специалиста переустановить виндовс: лучшие цены здесь.
Перевозка грузов во Владимире: подробности по ссылке.