Вчера NVIDIA объявила о начале производства и поставок своего первого графического процессора на базе архитектуре NVIDIA Ampere – NVIDIA A100. Как стало ясно из опубликованного компанией пресс-релиза, вся информация, которую THG.ru изложил во вчерашней новости, собрав полученную в сети из различных утечек информацию, полностью подтверждена.
Благодаря передовой архитектуре NVIDIA Ampere, на базе которой выстроен графический процессор A100, новый процессор обеспечивает значительный прирост производительности по сравнению с моделями предыдущих поколений. Прирост в скорости вычислений может составлять от 2,5 до 20 раз. NVIDIA отметила, что такой значительный скачок в производительности по сравнению с моделями предыдущего поколения был достигнут впервые. Отметим, что опыт у NVIDIA большой, вчера компания объявила о выпуске GPU NVIDIA уже восьмого поколения.
Новый графический процессор NVIDIA A100 создает единую платформу для обучения ИИ и инференса. Универсальный ускоритель A100 предназначен также для решения прикладных задач анализа данных, научных вычислений и облачной графики.
Первое промышленное решение, которое компания NVIDIA готова предложить рынку – это поставки ИИ-системы 3-го поколения NVIDIA DGX A100 с заявленной для задач ИИ производительностью в размере 5 петафлопс.
NVIDIA DGX A100
Анонс NVIDIA DGX A100 состоялся вчера вместе с запуском NVIDIA A100. Уже на старте NVIDIA заявила, что первый заказ NVIDIA DGX A100 уже отправлен в Аргоннскую национальную лабораторию Министерства энергетики США – там сейчас ведутся работы по разработке вакцины против COVID-19.
Система DGX A100 состоит из восьми графических процессоров NVIDIA A100 с тензорными ядрами, 320 Гбайт памяти и высокоскоростных интерконнектов NVIDIA Mellanox HDR 200Gbps.
Для ускорения процессов вычислений применяется технология MIG (Multi-Instance GPU). Она позволяет разделять машину DGX A100 на отдельные параллельные инстансы, количество которых может достигать 56 в системе. Благодаря этому, открывается возможность для оптимизации модели использования ресурсов для отдельных приложений. Путем программного управления и общей настройки системы можно выделять ресурсы, необходимые приложениям, с учетом вида их текущей нагрузки.
Предполагается, что основной вычислительной нагрузкой для таких систем станут прикладные расчеты для решения задач в области анализа данных, обучения и инференса (задач прикладного применения).
По имеющимся данным, вычислительный блок NVIDIA DGX A100 обеспечивает следующую производительность:
INT8 – до 10 PetaOPS – целочисленные вычисления (передача данных, телеком etc.)
FP16 – до 5 PFLOPS – вычисления c плавающей точкой (игры etc.)
TF32 – до 2,5 PFLOPS – матричные вычисления (ИИ etc.)
FP64 – до 156 PFLOPS – вычисления c плавающей точкой повышенной точности (научные вычисления etc.)
Прямые цены на новый серверный блок не озвучены, однако в качестве примера NVIDIA показала серверный комплект для обучения и инференса ИИ, выстроенный на базе 5 модулей DGX A100. Его мощность потребления составляет 28 кВт, а стоимость около $1 млн.
Этот образец приблизительно в 10 раз дешевле, чем аналогичная система, которую можно было бы получить сегодня, если применять ныне существующие технологии. Для получения сравнимой вычислительной мощности потребуется собрать систему с уровнем потребляемой мощности около 630 кВт. Ее цена составит около $11 млн.
DGX SuperPOD
NVIDIA также представила новое поколение вычислительного кластера DGX SuperPOD с вычислительной мощностью 700 петафлопс в задачах ИИ. Он выстраивается на базе 140 систем DGX A100, объединенных в единый блок с помощью интерконнета NVIDIA Mellanox HDR 200Gbps InfiniBand.
Такой кластер был выстроен самой компанией NVIDIA. Он получил название DGX SuperPOD AI и применяется для внутренних исследований NVIDIA в таких областях, как диалоговый ИИ, геномика и автономное вождение.
Ранее редакция THG.ru опубликовала обзор лучших видеокарт для игр. Выбрать лучшую видеокарту для игр непросто – для кого-то лучшей может быть самая доступная видеокарта, для других самая производительная. Мы стараемся учитывать все факторы и публикуем ежемесячно обновляемый материал, в котором стараемся рекомендовать действительно лучшую видеокарту для игр в любой ценовой категории – от дешевле $100 до топового сегмента. Подробнее об этом читайте в статье “Лучшая видеокарта для игр: текущий анализ рынка”.