11 минут до окончания тренировки GPT-3! Nvidia H100 проходит 8 тестов MLPerf, следующее поколение видеокарт будет выпущено через 25 лет

2023-06-29 02:03:21

**Источник:**Синьчжиюань

Введение: Босс Хуанг снова выиграл! В последнем тесте производительности MLPerf H100 успешно установил 8 тестовых рекордов. По данным зарубежных СМИ, следующее поколение видеокарт потребительского уровня может быть выпущено в 2025 году.

В последнем тренировочном тесте MLPerf графический процессор H100 установил новые рекорды во всех восьми тестах!

Сегодня NVIDIA H100 в значительной степени доминирует во всех категориях и является единственным графическим процессором, используемым в новом тесте LLM.

Кластер из 3584 графических процессоров H100 выполнил крупномасштабный тест на основе GPT-3 всего за 11 минут.

Бенчмарк MLPerf LLM основан на модели OpenAI GPT-3 и содержит 175 миллиардов параметров.

По оценкам Lambda Labs, для обучения такой большой модели требуется около 3,14E23 FLOPS вычислений.

11 минут, чтобы обучить GPT-3 формированию монстра

Система с самым высоким рейтингом в тестах обработки естественного языка (NLP) LLM и BERT была разработана совместно NVIDIA и Inflection AI.

Размещено CoreWeave, поставщиком облачных услуг, специализирующимся на рабочих нагрузках корпоративного уровня с GPU-ускорением.

Система объединяет 3584 ускорителя NVIDIA H100 с 896 процессорами Intel Xeon Platinum 8462Y+.

Потому что Nvidia представила новый движок Transformer в H100, который специально разработан для ускорения обучения и рассуждений модели Transformer, увеличивая скорость обучения в 6 раз.

Производительность, которую CoreWeave может обеспечить из облака, очень близка к той, которую Nvidia может обеспечить на суперкомпьютере с искусственным интеллектом, работающем в локальном центре обработки данных.

Это стало возможным благодаря сети с малой задержкой в сети NVIDIA Quantum-2 InfiniBand, используемой CoreWeave.

Поскольку количество графических процессоров H100, задействованных в обучении, увеличивается с сотен до более чем 3000.

Хорошая оптимизация позволяет всему стеку технологий добиться почти линейного масштабирования производительности в требовательном тесте LLM.

Если количество графических процессоров уменьшить вдвое, время обучения той же модели увеличится до 24 минут.

Демонстрация того, что потенциал эффективности всей системы при увеличении количества графических процессоров является сверхлинейным.

Основная причина заключается в том, что Nvidia учитывала эту проблему с самого начала проектирования графических процессоров, используя технологию NVLink для эффективной реализации связи между графическими процессорами.

Из 90 протестированных систем 82 были ускорены с помощью графических процессоров NVIDIA.

Эффективность тренировки с одной картой

Сравнение времени обучения системного кластера

В обзорных системах Intel использовалось от 64 до 96 процессоров Intel Xeon Platinum 8380 и от 256 до 389 ускорителей Intel Habana Gaudi2.

Однако Intel представила GPT-3 со временем обучения 311 минут.

По сравнению с Nvidia результаты немного жалкие.

Аналитик: у Nvidia слишком большое преимущество

Отраслевые аналитики считают, что техническое преимущество Nvidia в GPU совершенно очевидно.

Как поставщик инфраструктуры искусственного интеллекта, ее доминирующее положение в отрасли также отражается в устойчивости экосистемы, которую Nvidia создала за эти годы.

Сообщество ИИ также очень зависит от программного обеспечения Nvidia.

Почти все ИИ-фреймворки основаны на базовых библиотеках и инструментах CUDA, предоставляемых Nvidia.

Кроме того, он предлагает полнофункциональные инструменты и решения для искусственного интеллекта.

Помимо поддержки разработчиков ИИ, Nvidia продолжает инвестировать в инструменты корпоративного уровня для управления рабочими нагрузками и моделями.

В обозримом будущем лидирующее положение Nvidia в отрасли будет очень стабильным.

Аналитики также отметили, что мощные функции и эффективность системы NVIDIA для обучения ИИ в облаке, как показали результаты теста MLPerf, являются самым большим капиталом «войны за будущее» NVIDIA.

Графический процессор нового поколения Ada Lovelace, выпущенный в 2025 году

Жие Лю, независимый автор Tom's Hardware, также недавно опубликовала статью, в которой рассказывает о планах на следующее поколение графических карт Nvidia Ada Lovelace.

Нет никаких сомнений в способности H100 обучать большие модели.

Имея всего 3584 H100, модель GPT-3 можно обучить всего за 11 минут.

На недавней пресс-конференции Nvidia поделилась новой дорожной картой с подробным описанием продуктов следующего поколения, включая преемников графических процессоров GeForce RTX 40-й серии Ada Lovelace, первые из которых являются одними из лучших игровых видеокарт, доступных сегодня.

Согласно дорожной карте, Nvidia планирует выпустить видеокарту «Ada Lovelace-Next» в 2025 году.

Если текущая схема именования сохранится, следующее поколение продуктов GeForce должно быть указано как серия GeForce RTX 50.

Согласно информации, полученной южноамериканской хакерской организацией LAPSU$, Hopper Next, скорее всего, будет называться Blackwell.

На видеокартах потребительского уровня Nvidia поддерживает двухлетний ритм обновления.

Они запустили Pascal в 2016 году, Turing в 2018 году, Ampere в 2020 году и Ada Lovelace в 2022 году.

Если преемница Ады Лавлейс будет запущена в 2025 году, на этот раз Nvidia, несомненно, сломает привычный ритм.

Недавний взрыв ИИ создал огромный спрос на графические процессоры NVIDIA, будь то последний H100 или A100 предыдущего поколения.

Согласно сообщениям, в этом году крупный производитель заказал графические процессоры Nvidia на сумму 1 миллиард долларов.

Несмотря на экспортные ограничения, моя страна остается одним из крупнейших рынков Nvidia в мире.

(Говорят, что на рынке электроники Huaqiangbei в Шэньчжэне вы можете купить небольшое количество Nvidia A100 по 20 000 долларов каждый, что вдвое превышает обычную цену.)

В связи с этим Nvidia доработала некоторые продукты с искусственным интеллектом и выпустила определенные SKU, такие как H100 или A800, для соответствия экспортным требованиям.

Чжи Лю проанализировал это.С другой стороны, экспортные правила на самом деле выгодны для Nvidia, потому что это означает, что клиенты производителей чипов должны покупать больше вариантов оригинального графического процессора, чтобы получить ту же производительность.

Это также может объяснить, почему Nvidia отдает приоритет созданию вычислительных графических процессоров, а не игровых графических процессоров.

Недавние отчеты показывают, что Nvidia увеличила производство графических процессоров вычислительного класса.

Не сталкиваясь с серьезной конкуренцией со стороны стека продуктов AMD RDNA 3, и Intel не представляет серьезной угрозы дуополии графических процессоров, поэтому Nvidia может остановиться на стороне потребителя.

Совсем недавно Nvidia расширила свой стек продуктов серии GeForce RTX 40 за счет GeForce RTX 4060 и GeForce RTX 4060 Ti.

Есть потенциал для GeForce RTX 4050, а также RTX 4080 Ti или GeForce RTX 4090 Ti сверху и т. д.

При необходимости Nvidia также может изъять продукт из старой версии Turing, обновить Аду Лавлейс, придать ему статус «Супер» и еще больше расширить линейку Ады.

Наконец, Zhiye Liu сказал, что по крайней мере в этом или следующем году архитектура Lovelace действительно не будет обновляться.

Использованная литература:

Посмотреть Оригинал

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

Награда
лайк
комментарий
Поделиться

комментарий

0/400

Нет комментариев

Тема
Gate xStocks Trading Open
18k Популярность
Nonfarm Payrolls Update
2k Популярность
Gate Alpha Trading Share
4k Популярность
4BTC
30213k Популярность
5contentstar
10719k Популярность
6NADA
11186k Популярность
7BOME
11564k Популярность
8BTC
30213k Популярность
9SMILE
9062k Популярность
10比特币
13312k Популярность

Закрепить

Карта сайта