NVIDIA объявила о выпуске процессора NVIDIA A100 на архитектуре Ampere, модуля DGX A100 и кластера DGX SuperPOD

15 мая 2020, 12:42

Вчера NVIDIA объявила о начале производства и поставок своего первого графического процессора на базе архитектуре NVIDIA Ampere – NVIDIA A100. Как стало ясно из опубликованного компанией пресс-релиза, вся информация, которую THG.ru изложил во вчерашней новости, собрав полученную в сети из различных утечек информацию, полностью подтверждена.

a100_front

Благодаря передовой архитектуре NVIDIA Ampere, на базе которой выстроен графический процессор A100, новый процессор обеспечивает значительный прирост производительности по сравнению с моделями предыдущих поколений. Прирост в скорости вычислений может составлять от 2,5 до 20 раз. NVIDIA отметила, что такой значительный скачок в производительности по сравнению с моделями предыдущего поколения был достигнут впервые. Отметим, что опыт у NVIDIA большой, вчера компания объявила о выпуске GPU NVIDIA уже восьмого поколения.

dgx_100_4

dgx_100_3

Новый графический процессор NVIDIA A100 создает единую платформу для обучения ИИ и инференса. Универсальный ускоритель A100 предназначен также для решения прикладных задач анализа данных, научных вычислений и облачной графики.

Первое промышленное решение, которое компания NVIDIA готова предложить рынку – это поставки ИИ-системы 3-го поколения NVIDIA DGX A100 с заявленной для задач ИИ производительностью в размере 5 петафлопс.

dgx_100_1

NVIDIA DGX A100

Анонс NVIDIA DGX A100 состоялся вчера вместе с запуском NVIDIA A100. Уже на старте NVIDIA заявила, что первый заказ NVIDIA DGX A100 уже отправлен в Аргоннскую национальную лабораторию Министерства энергетики США – там сейчас ведутся работы по разработке вакцины против COVID-19.

Система DGX A100 состоит из восьми графических процессоров NVIDIA A100 с тензорными ядрами, 320 Гбайт памяти и высокоскоростных интерконнектов NVIDIA Mellanox HDR 200Gbps.

DGX A100

Для ускорения процессов вычислений применяется технология MIG (Multi-Instance GPU). Она позволяет разделять машину DGX A100 на отдельные параллельные инстансы, количество которых может достигать 56 в системе. Благодаря этому, открывается возможность для оптимизации модели использования ресурсов для отдельных приложений. Путем программного управления и общей настройки системы можно выделять ресурсы, необходимые приложениям, с учетом вида их текущей нагрузки.

Предполагается, что основной вычислительной нагрузкой для таких систем станут прикладные расчеты для решения задач в области анализа данных, обучения и инференса (задач прикладного применения).

По имеющимся данным, вычислительный блок NVIDIA DGX A100 обеспечивает следующую производительность:

INT8 – до 10 PetaOPS – целочисленные вычисления (передача данных, телеком etc.)

FP16 – до 5 PFLOPS – вычисления c плавающей точкой (игры etc.)

TF32 – до 2,5 PFLOPS – матричные вычисления (ИИ etc.)

FP64 – до 156 PFLOPS – вычисления c плавающей точкой повышенной точности (научные вычисления etc.)

dgx_100_2

Прямые цены на новый серверный блок не озвучены, однако в качестве примера NVIDIA показала серверный комплект для обучения и инференса ИИ, выстроенный на базе 5 модулей DGX A100. Его мощность потребления составляет 28 кВт, а стоимость около $1 млн.

Этот образец приблизительно в 10 раз дешевле, чем аналогичная система, которую можно было бы получить сегодня, если применять ныне существующие технологии. Для получения сравнимой вычислительной мощности потребуется собрать систему с уровнем потребляемой мощности около 630 кВт. Ее цена составит около $11 млн.

DGX SuperPOD

NVIDIA также представила новое поколение вычислительного кластера DGX SuperPOD с вычислительной мощностью 700 петафлопс в задачах ИИ. Он выстраивается на базе 140 систем DGX A100, объединенных в единый блок с помощью интерконнета NVIDIA Mellanox HDR 200Gbps InfiniBand.

dgx_superpod_1

Такой кластер был выстроен самой компанией NVIDIA. Он получил название DGX SuperPOD AI и применяется для внутренних исследований NVIDIA в таких областях, как диалоговый ИИ, геномика и автономное вождение.

dgx_superpod

Ранее редакция THG.ru опубликовала обзор лучших видеокарт для игр. Выбрать лучшую видеокарту для игр непросто – для кого-то лучшей может быть самая доступная видеокарта, для других самая производительная. Мы стараемся учитывать все факторы и публикуем ежемесячно обновляемый материал, в котором стараемся рекомендовать действительно лучшую видеокарту для игр в любой ценовой категории – от дешевле $100 до топового сегмента. Подробнее об этом читайте в статье “Лучшая видеокарта для игр: текущий анализ рынка”.