РЕКЛАМА
ИНФОРМАЦИЯ
ПОЛЕЗНЫЕ ССЫЛКИ
Как себя ведёт Radeon R9 290X в закрытом корпусе?

Обзор партнёрских видеокарт: одна Radeon R9 290 и три 290X

Обзор Radeon R7 240 и 250: игровые видеокарты до $100

Мобильные видеокарты: GeForce GTX 780M, 770M и 765M против Radeon HD 8970M

Asus Mars 760: два GPU в режиме SLI на одной видеокарте в ценовом диапазоне $650

Развенчиваем мифы о производительности видеокарт: часть первая

Обзор AMD Radeon R7 265: Curacao за $150

Обзор AMD Radeon R7 260: время для GPU Bonaire

Обзор AMD Radeon R7 250X: новая модификация Radeon HD 7770 за $100

Обзор GeForce GTX 750 Ti: новая видеокарта на архитектуре Maxwell

GeForce GTX 750 Ti: видеокарта с пассивным охлаждением… от AMD!

PowerColor LCS AXR9 290X: жидкостное охлаждение как лучшее решение для GPU Hawaii

GeForce GTX 750 Ti: как мы изобрели однослотовую видеокарту

Обзор Radeon R9 270 и 270X: тест и сравнение десяти видеокарт

Radeon R9 295X2 8 Гбайт: обзор видеокарты с жидкостным охлаждением

Обзор видеокарты MSI R9 290X Lightning: правильное охлаждение для GPU Hawaii

GeForce GTX 880M, 870M и 860M: тестирование мобильных графических процессоров

Radeon R9 295X2 в CrossFire: 25 миллиардов транзисторов в играх с разрешением 4K. Обновление

Обзор видеокарты PowerColor PCS+ R9 290X: приемлемый уровень охлаждения, шума и конечной стоимости

Графика для рабочих станций: тестирование 19 видеокарт в SPECviewperf 12

Обзор видеокарты AMD FirePro W9100: Hawaii в рабочих станциях

GeForce GTX Titan Black: меняем кулер своими руками

AMD Mantle: углублённое тестирование графического API

Обзор PowerColor Devil 13 Dual Core R9 290X 8 Гбайт: видеокарта на базе Hawaii с воздушным охлаждением

Обзор видеокарты AMD FirePro W8100: Radeon R9 290 в профессиональной среде

Обзор видеокарты Sapphire Dual-X R9 280 OC

Обзор AMD Radeon R9 285: Tonga и обновление GCN 3.0

AMD Radeon R9 295X2: энергопотребление двух видеокарт и блока питания на 1000 Вт

Обзор видеокарт Nvidia GeForce GTX 970 и 980: максимум возможностей от Maxwell

Обзор видеокарты Nvidia GeForce GTX 1080 Pascal. Часть 1

Rambler's Top100 Рейтинг@Mail.ru

ВИДЕОКАРТЫ

Обзор видеокарты Nvidia GeForce GTX 1080 Pascal. Часть 1
Краткое содержание статьи: Теоретическая часть обзора новой видеокарты: новые частоты, новые технологии, новое "железо". Изменения в SLI и GPU Boost.

Обзор видеокарты Nvidia GeForce GTX 1080 Pascal. Часть 1


Редакция THG,  23 мая 2016
Назад
Вы читаете страницу 1 из 4
1 2 3 4
Далее


Обзор Nvidia GeForce GTX 1080 Pascal | Знакомимся с графическим процессором GP104

В преддверии выставки Computex Nvidia решила представить свою долгожданную новинку - адаптированную для геймеров архитектуру Pascal. В новых видеокартах GeForce GTX 1080 и 1070 производитель устанавливает графический процессор GP104. Сегодня, мы рассмотрим старшую модель, а младшая должна оказаться в наших руках в начале июня.

Архитектура Pascal обещает более быструю и более эффективную работу, больше вычислительных модулей, уменьшенную площадь кристалла и более быструю память с модернизированным контроллером. Она лучше подходит для виртуальной реальности, игр в 4K и других задач, требующих высокой производительности.

Как всегда, мы постараемся разобраться в обещаниях производителя и проверить их на практике. Начнем.

Обзор Nvidia GeForce GTX 1080 Pascal

Изменит ли GeForce GTX 1080 расстановку сил в сегменте High-End?

Nvidia GeForce GTX 1080 – наиболее быстрая из двух игровых видеокарт, анонсированных в начале месяца. Обе используют графический процессор GP104, который, кстати, является уже вторым GPU с микроархитектурой Pascal (первым был GP100, появившийся на GTC в апреле). CEO Nvidia Жэнь-Сунь Хуань подразнивал энтузиастов, когда представлял новинку широкой общественности, утверждая, что GeForce GTX 1080 обгонит две 980 в SLI.

Также он отметил, что GTX 1080 при большей производительности имеет меньшее энергопотребление, чем 900-я серия. Она вдвое производительнее и втрое эффективнее бывшего флагмана GeForce Titan X, но если всмотреться в сопутствующие графики и диаграммы, то выясняется, что такая внушительная разница проявляется в определенных задачах, связанных с виртуальной реальностью. Но даже если эти обещания подтвердятся лишь частично, нас все равно ждут весьма интересные времена в плане развития high-end игр на ПК.

Виртуальная реальность начинает понемногу набирать обороты, но высокие аппаратные требования для графической подсистемы создают существенный барьер для доступа к этим технологиям. Кроме того, большинство доступных сегодня игр не умеют использовать преимущества многопроцессорного рендеринга. То есть, вы, как правило, ограничены возможностями одного быстрого видеоадаптера с одним GPU. GTX 1080 способна превзойти по скорости работы две 980-х и не должна испытывать затруднений в современных VR-играх, нивелируя потребность в многопроцессорных конфигурациях в будущем.

Не меньшими темпами прогрессирует экосистема 4K. Интерфейсы с повышенной пропускной способностью, такие как HDMI 2.0b и DisplayPort 1.3/1.4 должны открыть дверь для 4K мониторов со 120 Гц панелями и поддержкой динамической частоты обновления экрана уже к концу этого года. Хотя предыдущие поколения топовых графических процессоров AMD и Nvidia позиционировались как решения для игр в 4K, пользователям приходилось идти на компромиссы по качеству, чтобы поддерживать приемлемую частоту кадров. GeForce Nvidia GTX 1080 может стать первым графическим адаптером, скорости которого будет достаточно для поддержания высокой частоты кадров в разрешении 3840x2160 точек с максимальными настройками детализации графики.

Какова ситуация с конфигурациями из нескольких мониторов? Многие геймеры готовы устанавливать по три монитора с разрешением 1920x1080, но при условии, что графическая система справится с нагрузкой, ведь в этом случае карте приходится отрисовывать полмиллиона пикселей, поскольку разрешение составляет 7680x1440. Есть даже энтузиасты, готовые взять три 4K-дисплея с совокупным разрешением 11520x2160 точек.

Последний вариант слишком экзотичный даже для новой геймерской флагманской видеокарты. Тем не менее, процессор Nvidia GP104 оснащен технологией, которая обещает улучшить впечатления от типичных для новой модели задач, то есть 4K и Surround. Но прежде, чем мы перейдем к новым технологиям, давайте поближе познакомимся с процессором GP104 и лежащей в его основе архитектурой Pascal.

Обзор Nvidia GeForce GTX 1080 Pascal

Из чего состоит GP104?

С начала 2012 года AMD и Nvidia используют 28-нанометровый техпроцесс. Перейдя на него, обе компании сделали существенный рывок вперед, представив нам видеокарты Radeon HD 7970 и GeForce GTX 680. Тем не менее, за последующие четыре года им пришлось сильно изворачиваться, чтобы вытянуть больше производительности из существующей технологии. Достижения видеокарты Radeon R9 Fury X и GeForce GTX 980 Ti - это настоящее чудо, учитывая их сложность. Первым чипом, созданным Nvidia по техпроцессу 28 нм, был GK104, состоявший из 3,5 миллиардов транзисторов. GM200, который устанавливается в GeForce GTX 980 Ti и Titan X, имеет уже восемь миллиардов транзисторов.

Переход на 16 нм технологию TSMC FinFET Plus позволил инженерам Nvidia реализовать новые идеи. Согласно техническим данным чипы 16FF+ на 65% быстрее, могут иметь вдвое большую плотность, чем 28HPM, либо потреблять на 70 меньше энергии. При создании своих GPU Nvidia использует оптимальную комбинацию этих достоинств. TSMC утверждает, что в основу были положены инженерные наработки существующего процесса 20 нм, но вместо плоских транзисторов использовала транзисторы FinFET. В компании говорят, что такой подход снижает количество брака, и повышает выход рабочих пластин. Также утверждается, что 20-нанометрвого техпроцесса с быстрыми транзисторами у компании не было. Повторимся, мир компьютерной графики более четырех лет "сидит" на техпроцессе 28 нм.

Обзор Nvidia GeForce GTX 1080 Pascal

Блок-схема процессора GP104

Преемник GM204 состоит из 7,2 миллиардов транзисторов, размещенных на площади 314 мм2. Для сравнения площадь кристалла GM204 составляет 398 мм2 при 5,2 миллиардах транзисторов. В полной версии один GPU GP104 имеет четыре кластера обработки графики (Graphics Processing Clusters - GPC). Каждый GPC включает пять кластеров обработки потоков/текстур (Thread/Texture Processing Clusters - TPC) и блок растеризации. TPC сочетает в себе один потоковый мультипроцессор (Streaming Multiprocessor SM) и движок PolyMorph. SM объединяет 128 ядер CUDA одинарной точности, 256 Кбайт регистровой памяти, 96 Кбайт общей памяти, 48 Кбайт кэша L1/текстур и восемь текстурных блоков. Четвертое поколение движка PolyMorph включает новый блок логики, который находится в конце конвейера геометрии перед блоком растеризации, он управляет функцией мультипроекции Simultaneous Multi-Projection (об этом чуть ниже). В общем итоге мы получаем 20 SM, 2560 ядер CUDA и 160 блоков обработки текстур.

Обзор Nvidia GeForce GTX 1080 Pascal

Один потоковый мультипроцессор (SM) в GP104

Бек-энд графического процессора включает восемь 32-битных контроллеров памяти (суммарная ширина канала 256-бит), восемь блоков растеризации и 256 Кбайт кэша L2 для каждого блока. В итоге мы имеем 64 ROP и 2 Мбайт разделенной кэш-памяти L2. Хотя на блок-схеме процессора Nvidia GM204 было показано четыре 64-битных контроллера и 16 ROP, они были сгруппированы и с функциональной точки зрения эквивалентны.

Некоторые структурные элементы GP104 похожи на GM204, ведь новый GPU был создан из "строительных блоков" своего предшественника. В этом нет ничего плохого. Если вы помните, в архитектуре Maxwell компания сделала ставку на энергоэффективность и не стала перетряхивать блоки, которые являлись сильной стороной Kepler. Аналогичную картину мы видим и здесь.

Добавление четырех SM не может заметно повлиять на производительность. Однако у GP104 есть несколько козырей в рукаве. Первый козырь – существенно более высокие тактовые частоты. Базовая тактовая частота GPU составляет 1607 МГц. В спецификациях GM204, для сравнения, указано 1126 МГц. Максимальная частота GPU Boost достигает 1733 МГц, но мы довели наш образец до 2100 МГц, используя бета-версию утилиты EVGA PrecisionX. Откуда такой запас для разгона? По словам Джона Албина, старшего вице-президента отдела разработки GPU, его команда знала, что техпроцесс TSMC 16FF+ повлияет на работу архитектуры чипа, поэтому они сосредоточили силы на оптимизации таймингов в микросхеме, чтобы убрать узкие места, препятствующие достижению более высоких тактовых частот. В результате скорость вычислений одинарной точности GP104 достигла 8228 GFLOPs (на базовой частоте) по сравнению с потолком в 4612 GFLOPs у GeForce GTX 980. Скорость закраски текселей подскочила с 155,6 Гтекс/с у 980-й (с GPU Boost) до 277,3 Гтекс /с.

GPU GeForce GTX 1080 (GP104) GeForce GTX 980 (GM204)
SM 20 16
Количество ядер CUDA 2560 2048
Базовая частота GPU, МГц 1607 1126
Частота GPU в режиме Boost, МГц 1733 1216
Скорость вычислений, GFLOPs (при базовой частоте) 8228 4612
Количество блоков текстурирования 160 128
Скороть заполнения текселей, Гтекс/с 277,3 155,6
Скорость передачи данных памяти, Гбит/с 10 7
Пропускная способность памяти, Гбайт/с 320 224
Количество блоков растеризации 64 64
Объем кэша L2, Мбайт 2 2
Тепловой пакет, Вт 180 165
Количество транзисторов 7,2 млрд. 5,2 млрд.
Площадь кристалла, мм2 314 398 мм
Техпроцесс, нм 16 28

Бэк-энд по-прежнему включает 64 блоков ROP и 256-разрядную шину памяти, но чтобы увеличить доступную пропускную способность Nvidia внедрила память GDDR5X. Компания приложила много усилий для раскрутки нового типа памяти, особенно на фоне памяти HBM, которая используется в разных видеокартах AMD и HBM2, которую Nvidia устанавливает в Tesla P100. Складывается ощущение, что на рынке сейчас имеется нехватка памяти HBM2, при этом компания не готова принять ограничения HBM (четыре стека по 1 Гбайт, либо трудности, связанные с реализацией восьми стеков по 1 Гбайт). Таким образом, мы получили видеопамять GDDR5X, поставки которой, судя по всему, тоже ограничены, поскольку GeForce GTX 1070 уже использует обычную GDDR5. Но это не перекрывает достоинств нового решения. Память GDDR5 в GeForce GTX 980 имела скорость передачи данных 7 Гбит/с. Это обеспечивало 224 Гбайт/с пропускной способности через 256-разрядную шину. GDDR5X стартует с 10 Гбит/с, повышая пропускную способность до 320 Гбайт/с (увеличение на ~43%). По словам Nvidia прирост достигается благодаря модернизированной схеме ввода-вывода, причем без повышения энергопотребления.

Архитектура Maxwell стала более эффективно использовать пропускную способность путем оптимизации кэша и алгоритмов сжатия, тем же путем идет и Pascal с новыми методами сжатия без потерь, чтобы более экономно использовать доступную ширину канала подсистемы памяти. Алгоритм дельта-компрессии цветов пытается достигнуть выигрыша 2:1, причем этот режим был улучшен с целью более частого применения. Также есть новый режим 4:1, который применяется в тех случаях, когда различия на пиксель очень небольшие. Наконец, в Pascal представлен еще один новый алгоритм 8:1, который применяет сжатие 4:1 к блокам 2х2, разница между которыми обрабатывается по алгоритму 2:1.

Обзор Nvidia GeForce GTX 1080 Pascal

Обзор Nvidia GeForce GTX 1080 Pascal

Обзор Nvidia GeForce GTX 1080 Pascal

Разницу не трудно проиллюстрировать. На первом изображении показан несжатый снимок экрана из игры Project CARS. На следующем снимке показаны элементы, которые может сжать карта на архитектуре Maxwell, они закрашены фиолетовым. На третьем снимке видно, что Pascal сжимает сцену еще больше. Согласно данным Nvidia, эта разница преобразуется примерно в 20%-ое сокращение информации в байтах, которую необходимо выбрать из памяти для каждого кадра.
Назад
Вы читаете страницу 1 из 4
1 2 3 4
Далее


СОДЕРЖАНИЕ

Обзор Nvidia GeForce GTX 1080 Pascal. Отзывы в Клубе экспертов THG [ 6 отзывов] Обзор Nvidia GeForce GTX 1080 Pascal. Отзывы в Клубе экспертов THG [ 6 отзывов]


Свежие статьи
RSS
7 альтернатив Apple AirPods: беспроводные наушники-вкладыши Canon EOS 200D: компактная зеркалка с отличным качеством съёмки Fossil Q Marshal: смарт-часы с упором на внешность HyperX Cloud Alpha: обзор лучшей игровой гарнитуры до $100 Обзор монитора BenQ PD3200Q: дизайнерам и инженерам
7 альтернатив Apple AirPods Обзор зеркальной фотокамеры Canon EOS 200D Обзор смарт-часов Fossil Q Marshal Обзор гарнитуры HyperX Cloud Alpha Обзор монитора BenQ PD3200Q: Дизайнерам и инженерам
РЕКЛАМА
РЕКОМЕНДУЕМ ПРОЧЕСТЬ!

История мейнфреймов: от Harvard Mark I до System z10 EC
Верите вы или нет, но были времена, когда компьютеры занимали целые комнаты. Сегодня вы работаете за небольшим персональным компьютером, но когда-то о таком можно было только мечтать. Предлагаем окунуться в историю и познакомиться с самыми знаковыми мейнфреймами за последние десятилетия.

Пятнадцать процессоров Intel x86, вошедших в историю
Компания Intel выпустила за годы существования немало процессоров x86, начиная с эпохи расцвета ПК, но не все из них оставили незабываемый след в истории. В нашей первой статье цикла мы рассмотрим пятнадцать наиболее любопытных и памятных процессоров Intel, от 8086 до Core 2 Duo.

ССЫЛКИ
Реклама от YouDo
Объявление: https://youdo.com/lp-cookers22881/ - подробнее >>
Услуги специалиста: https://youdo.com/lp-podklyuchenie-elektropliti-beko/, варианты по ссылке.
Дизайн-проект интерьера квартиры II-18: http://remont.youdo.com/interior/dizproekt/flats/type/ii18/.