Детали игровой NVIDIA "GeForce RTX 40": вдвое больше ROP, огромный кэш L2 и на 50% больше блоков FP32, тензорных ядра 4-го поколения и RT-ядра 3-го поколения
Недавно были раскрыты подробности о игровом графическом процессоре NVIDIA Ada Lovelace, который будет работать на видеокартах серии GeForce RTX 40. Новая информация поступила от Kopte7kimi и рассказывает в том числе о блок-схеме архитектуры следующего поколения. Известны конкретные конфигурации, которые будут использоваться в SKU следующего поколения серии AD10* для видеокарт серии GeForce RTX 40, а также спецификации этой линейки.
Начиная с конфигурации графического процессора, Kopite7kimi сравнивает лучший графический процессор AD102 с другими графическими процессорами «зеленой команды», такими как Ampere GA102 и Turing TU102. Графический процессор NVIDIA Ada Lovelace AD102 будет иметь до 12 GPC (кластеров обработки графики). Это на 70 % больше, чем в GA102, где их всего 7. Каждый GPU будет состоять из 6 TPC и 2 SM, что соответствует конфигурации существующего чипа. Каждый SM (потоковый мультипроцессор) будет содержать четыре подъядра, что также соответствует графическому процессору GA102. Что изменилось, так это конфигурация ядра FP32 и INT32. Каждое подъядро будет включать 128 блоков FP32, но общее количество блоков FP32+INT32 увеличится до 192. Это связано с тем, что блоки FP32 не используют то же подъядро, что и блоки IN32. 128 ядер FP32 отделены от 64 ядер INT32.
Таким образом, каждое подъядро будет состоять из 128 блоков FP32 плюс 64 блока INT32, всего 192 блока. Каждый SM будет иметь в общей сложности 512 модулей FP32 плюс 256 модулей INT32, всего 768 модулей. А поскольку всего имеется 24 модуля SM (по 2 на GPC), мы рассматриваем 12 288 модулей FP32 и 6 144 модуля INT32, что в сумме составляет 18 432 ядра. Это на 50 % больше ядер (FP32+INT32) и на 33 % больше потоков по сравнению с графическим процессором GA102.
Переходя к кешу, это еще один сегмент, в котором NVIDIA дала большой прирост по сравнению с существующими графическими процессорами Ampere. Графические процессоры Ada Lovelace будут иметь 192 КБ кэш-памяти L1 на SM, что на 50% больше, чем у Ampere. Это в общей сложности 4,5 МБ кэш-памяти L1 на топовом графическом процессоре AD102. Кэш L2 будет увеличен до 96 МБ, как упоминалось в утечках. Это в 16 раз больше, чем у графического процессора Ampere, который содержит всего 6 МБ кэш-памяти второго уровня. Кэш будет общим для GPU.
Наконец, у нас есть ROP, которые также увеличены до 32 на GPC, что в 2 раза больше, чем у Ampere. Вы видите до 384 ROP на флагмане следующего поколения против всего 112 на самом быстром графическом процессоре Ampere, RTX 3090 Ti. Также будут добавлены новейшие ядра Tensor 4-го поколения и RT (Raytracing) 3-го поколения, встроенные в графические процессоры Ada Lovelace, которые помогут поднять производительность DLSS и трассировки лучей на новый уровень. В целом, графический процессор Ada Lovelace AD102 предлагает:
В два раза больше GPC (по сравнению с Ampere)
На 50% больше ядер (по сравнению с Ampere)
На 50 % больше кэш-памяти L1 (по сравнению с Ampere)
В 16 раз больше кэш-памяти L2 (по сравнению с Ampere)
Удваивание ROP (по сравнению с Ampere)
Тензорные ядра 4-го поколения и RT-ядра 3-го поколения
Обратите внимание, что тактовые частоты, которые, как говорят, находятся в диапазоне 2-3 ГГц, здесь не учитываются, поэтому они также будут играть важную роль в повышении производительности на ядро по сравнению с Ampere. Ожидается, что видеокарты серии NVIDIA GeForce RTX 40 с игровыми графическими процессорами Ada Lovelace следующего поколения будут выпущены во второй половине 2022 года и, как сообщается, будут использовать тот же технологический узел TSMC 4N, что и графический процессор Hopper H100.
Ранее редакция THG.ru опубликовала обзор лучших видеокарт для игр. Выбрать лучшую видеокарту для игр непросто - для кого-то лучшей может быть самая доступная видеокарта, для других самая производительная. Мы стараемся учитывать все факторы и публикуем ежемесячно обновляемый материал, в котором стараемся рекомендовать действительно лучшую видеокарту для игр в любой ценовой категории - от дешевле $100 до топового сегмента. Подробнее об этом читайте в статье "Лучшая видеокарта для игр: текущий анализ рынка".