NVIDIA заблаговременно прекратила поставки высококлассных чипов, и прорвались вычислительные мощности китайских компаний

Первоисточник: Кремниевая лаборатория

Источник изображения: Generated by Unbounded AI

17 октября Бюро промышленности и безопасности (BIS) Министерства торговли США выпустило новый запрет на экспорт чипов, ужесточив ограничения на покупку Китаем важных высококачественных чипов.

Ограничение импорта Китаем высококачественных чипов, несомненно, сдерживает развитие технологической промышленности Китая. Предыдущие исследования показали, что на каждый 1 пункт увеличения индекса вычислительной мощности цифровая экономика и ВВП будут увеличиваться на 3,5‰ и 1,8‰ соответственно.

Однако ужесточение внешних ограничений не стало причиной стагнации вычислительной энергетики Китая, которая перешагнула отметку в триллион долларов. **По данным Китайской академии информационных и коммуникационных технологий, к концу 2021 года масштабы основной вычислительной мощности Китая превысили 1,5 трлн юаней, а масштабы смежных отраслей превысили 8 трлн юаней.

За рынком стоимостью в триллион долларов предприятия и правительства работают вместе, чтобы захватить эру ИИ.

С одной стороны, с момента запуска ChatGPT отечественные предприятия и научно-исследовательские институты всего за полгода запустили более 130 крупных моделей, среди которых ведущие игроки начали применять крупные модели под конкретные сценарии и создавать взрывные приложения.

С другой стороны, для создания вычислительной базы местные органы власти приступили к строительству интеллектуальных вычислительных центров, обеспечивающих высокую скорость передачи информации в эпоху больших данных, способствующих промышленным инновациям и модернизации, а также снижению затрат предприятий, называющих научно-технические достижения, представленные большими моделями.

Внешняя торговля чипами постепенно остыла, а внутренний рынок вычислительных мощностей засверкал, и между двумя небесами льда и пламени люди не могут не любопытствовать:

Какой город захватил прорыв китайской вычислительной энергетики? Как разорвать цепочку вычислительной мощности? Какие компании взяли на себя ответственность первопроходцев в этом процессе?

**01 NVIDIA прекратила поставки, повлияла на геометрию? **

Если большая языковая модель используется в качестве основы для одновременной обработки запросов на логический вывод 1,4 миллиарда человек в Китае, то объем требуемых вычислений превышает общую вычислительную мощность центров обработки данных Китая на 3 порядка. "**

На Всемирной конференции по искусственному интеллекту (WAIC) 2023 года в Шанхае в июле этого года профессор электронной инженерии Университета Цинхуа Ван Юй раскрыл масштабы разрыва в мощности отечественных компьютеров.

На самом деле, не только большие модели, но и популярность диверсифицированных приложений в 5G, умных городах и Интернете вещей также привели к постоянному ускорению генерации данных.

IDC прогнозирует, что масштаб интеллектуальных вычислительных мощностей Китая достигнет 1271 EFLOPS в 2026 году, при этом совокупный годовой темп роста составит 69,45%. По состоянию на конец 2022 года «Белая книга по развитию интеллектуальных вычислительных мощностей на 2023 год», составленная New H3C Group и Китайской академией информационных и коммуникационных технологий, показывает, что общая внутренняя вычислительная мощность составляет всего 180 ЭФЛОПС. (Примечание: FLOPS относится к операциям с плавающей запятой в секунду, а 1271EFLOPS означает 1271 экзафлопсные операции в секунду.) )

** В целях решения сложившейся ситуации дефицита вычислительных мощностей государство последовательно издало ряд документов, поддерживающих и направляющих все населенные пункты для ускорения строительства инфраструктуры вычислительных мощностей. **

Среди них в опубликованном в октябре Плане действий по качественному развитию инфраструктуры вычислительных мощностей четко указано, что в 2025 году масштаб вычислительных мощностей превысит 300 ЭФЛОПС, из которых доля интеллектуальных вычислительных мощностей, которые могут быть использованы для обучения больших моделей, должна достигать 35%.

В настоящее время существует около 31 интеллектуального вычислительного центра, финансируемого правительством, что соответствует общей вычислительной мощности 10,13 EFLOPS в плане, с общим объемом инвестиций почти 47 млрд юаней, что все еще далеко от запланированного общего масштаба интеллектуальной вычислительной мощности 105E, 50 интеллектуальных вычислительных центров и масштаба одноцентровых вычислительных мощностей в 2,1 EFLOPS.

**На самом деле не только в Китае, но и во всем мире наблюдается дефицит вычислительных мощностей. По данным OpenAI, существует 10 000-кратный разрыв между темпами роста объема модельных вычислений и темпами роста аппаратных вычислительных мощностей искусственного интеллекта. **

Нехватка вычислительных мощностей сначала способствовала стремительному росту цен на графические процессоры. С декабря прошлого года цена NVIDIA A100 выросла почти на 40% за 5 месяцев. Новый H100 этого года еще более бесценен.

Из-за наплыва заказов цикл поставки NVIDIA, производителя графических процессоров с наибольшей долей рынка, был продлен с одного месяца до более чем трех месяцев, и даже некоторые заказы могут быть доставлены не раньше 2024 года. Основная причина заключается в том, что цепочка поставок чипов длинная и фрагментированная, и быстро расширить производственные мощности невозможно.

**Из-за ограничений, связанных с запретом в США, планы отечественных производителей по расширению вычислительных мощностей реализовать сложнее, чем у Google, Meta и OpenAI. **

Перед тем, как объявить о новом раунде запрета, Nvidia адаптировала правила ограничения, поставив на китайский рынок «кастрированные версии» флагманских вычислительных чипов A800 и H800, которые имеют сниженные скорости межсоединений.

В августе СМИ сообщили, что такие компании, как Baidu, Tencent, Alibaba и ByteDance, заказали у Nvidia чипы на $5 млрд. Из этой суммы 1 миллиард долларов был заказан на A800, который, как ожидается, будет поставлен в этом году. Оставшийся заказ на 4 миллиарда долларов будет доставлен в 2024 году.

После объявления этого запрета, в связи с плотностью производительности в качестве актуального требования для ограничения нового стандарта, чипы A800 и H800, из-за превышения стандарта, также будут полностью запрещены.

В обновленной заявке NVIDIA 8-K в Комиссию по ценным бумагам и биржам США (SEC) упоминается, что правительство США перенесло срок действия запрета на пять графических процессоров NVIDIA, включая A100, A800, H100, H800 и L40S, с первоначального конца ноября, чтобы он вступил в силу немедленно.

** Вышеуказанные изменения означают, что примерно 100 000 чипов A800, которые BAT уже заказала, скорее всего, не будут поставлены. **

Тем не менее, отечественная инфраструктура вычислительных мощностей, похоже, не сильно пострадала. В настоящее время в стадии строительства или завершения строительства находится около 30 интеллектуальных вычислительных центров, из которых более 50% поставщиков чипов — Huawei Ascend.

Ранее председатель совета директоров iFLYTEK Лю Цинфэн заявил на пресс-конференции, что производительность Huawei Ascend 910B уже можно сравнить с A100.

** В целом, несмотря на то, что дальнейшее ужесточение ограничений США в отношении Китая затормозило прогресс итерации крупных моделей некоторых интернет-гигантов, отечественная инфраструктура вычислительных мощностей по-прежнему неуклонно развивается. **

А поскольку в обозримом будущем сложность импорта чипов будет продолжать расти, из соображений безопасности цепочки поставок ожидается, что отечественные производители чипов откроют новую волну возможностей для развития.

02 Прорыв в вычислительной мощности: левостороннее самоисследование, правосторонняя экология

Хотя единственными производителями графических процессоров, которые общепризнаны на международном рынке, являются NVIDIA и AMD, это не значит, что нет других вариантов, кроме них.

** По сравнению с чипами ASIC, графические процессоры обладают преимуществом высокой универсальности и подходят для различных областей исследований. Тем не менее, подразделяясь на различные предприятия, на самом деле существует общий избыток вычислительной мощности, ** такой как возможность вывода большой модели, которая требует только использования графического процессора и не нуждается в его графической вычислительной мощности.

Поэтому многие производители встали на путь самостоятельных исследований и разработок в соответствии с собственными потребностями. **

Например, Alibaba выпустила чип собственной разработки Hanguang 800 в мае этого года, который, как говорят, является самой высокой производительностью среди чипов искусственного интеллекта на тот момент, с вычислительной мощностью, эквивалентной 10 процессорам; Разработанный Baidu облачный полнофункциональный чип искусственного интеллекта Kunlun также был доведен до версии 3.0 и достигнет массового производства в 2024 году.

Среди компаний, производящих чипы собственной разработки, громче всех, несомненно, вышеупомянутая Huawei.

Недавно моноблок Spark, созданный совместно Huawei и iFLYTEK, снова был поставлен на порог.

Согласно публичной информации, моноблок Xinghuo основан на процессоре Kunpeng + графическом процессоре Ascend, использующем хранилище и сеть Huawei, чтобы обеспечить комплексное решение для кабинета с вычислительной мощностью FP16 2,5 PFLOPS. Напротив, 8-графический процессор NVIDIA DGX A100, который является наиболее популярным при обучении больших моделей, может выдавать вычислительную мощность FP16 в 5 PFLOPS.

«Wisdom» сообщает, что в конкретных сценариях больших моделей, таких как Pangu и Xunfei Xinghuo, Ascend 910 немного превзошел версию A100 PCIe 80 ГБ, достигнув отечественной замены. Тем не менее, универсальность все еще недостаточна, и другие модели, такие как GPT-3, нуждаются в глубокой оптимизации, прежде чем они смогут бесперебойно работать на платформе Huawei.

Кроме того, Moore Thread и Walltech, которые недавно были включены в список организаций в этом раунде санкций, также имеют соответствующие продукты с одной картой GPU, а некоторые показатели близки к NVIDIA.

В дополнение к влиянию санкций США, чипы собственной разработки также могут ослабить чрезмерную зависимость от NVIDIA, повысить стратегическую автономию предприятий и занять лидирующие позиции в расширении масштабов вычислительной мощности, опередив конкурентов. **

Одним из доказательств является то, что даже такие компании, как Google, OpenAI и Apple, которые не подпадают под санкции, запустили планы по разработке собственных чипов.

Чтобы больше не зависеть от одного поставщика, некоторые производители серверов также начали внедрять открытую архитектуру, совместимую с отечественными независимыми инновационными чипами. **

Например, компания Inspur Information, на долю которой в настоящее время приходится самая высокая доля рынка отечественных серверов, запустила открытую вычислительную архитектуру, которая, как говорят, обладает характеристиками большой вычислительной мощности, высокой взаимосвязанности и сильного расширения.

Исходя из этого, Inspur выпустила три поколения серверных продуктов ИИ, реализовала приземление нескольких вычислительных продуктов ИИ с более чем 10 партнерами по чипам и запустила платформу AIStation, которая может эффективно планировать более 30 чипов ИИ.

**Объективно говоря, производители серверов являются относительно слабым звеном в цепочке вычислительной мощности, для закупки чипов нужны международные гиганты с монопольным положением, такие как NVIDIA, а нисходящий — это G-end и облачные производители, которым не хватает переговорной силы сверху донизу. **

Таким образом, мы видим, что, хотя выручка NVIDIA за один квартал достигла рекордного уровня, достигнув $13,51 млрд, увеличившись в годовом исчислении на 101%, а чистая прибыль взлетела на 843% в годовом исчислении до $6,188 млрд, чистая прибыль Inspur в первой половине этого года все еще находится в минусе.

** Для того, чтобы гарантировать, что они смогут дожить до триллиона рыночных денег, поставщики серверов не жалеют усилий, чтобы доказать свою ценность. В частности, он предоставляет решения для управления кластерами серверов ИИ и их развертывания, чтобы обеспечить высокую доступность, высокую производительность и высокую эффективность серверов.

В то же время производители также соревнуются за выпуск отраслевых отчетов, стандартов и руководящих принципов в надежде получить право голоса.

С чипами собственной разработки в левой руке и открытой экологией в правой руке, цепочка отечественной вычислительной мощности находится в беспрецедентно сложной ситуации, с конкуренцией и кооперацией между ними.

В долгосрочной перспективе реальным решающим фактором в прорыве вычислительных мощностей по-прежнему остаются технологии, которые охватывают экологию, программное и аппаратное обеспечение и т.д., что требует от игроков на начальном и нисходящем уровнях проделать дыру, чтобы вместе преодолеть трудности.

Но прежде чем действительно пройти самостоятельный путь чипа, более критично то, как использовать каждый цент вычислительной мощности на блейде, в какой-то степени ответ на этот вопрос также намекает на очертания игроков, которые в будущем завоюют 100-миллиардный рынок. **

03 Рациональное использование вычислительных мощностей является главным приоритетом

Прежде чем ответить на вопрос, как правильно использовать вычислительные мощности, нужно подумать о другом вопросе: как использовать вычислительные мощности, чтобы использовать их правильно?

**Дилемма, стоящая перед отечественной вычислительной промышленностью, в основном состоит из трех частей: **

**Во-первых, нехватка вычислительной мощности. ** Ресурсы качественной вычислительной мощности недостаточны и разбросаны, приращения GPU ограничены, а запаса серьезно недостаточно, что затрудняет дальнейшую поддержку обучения больших моделей и постепенно становится новой проблемой «застрявшей шеи».

Во-вторых, вычислительная мощность стоит дорого. ** Инфраструктура вычислительных мощностей является капиталоемкой отраслью, характеризующейся большими первоначальными инвестициями, быстрой итерацией технологий и высоким порогом строительства, а ее строительство и эксплуатация требуют огромных временных и капитальных затрат, далеко выходящих за рамки малых и средних предприятий.

** В-третьих, спрос на вычислительные мощности диверсифицирован и фрагментирован, и время от времени возникают несоответствия между спросом и предложением на вычислительные мощности. **

Первая дилемма решается, но это не однодневные усилия, поэтому на данном этапе фактический смысл использования вычислительных мощностей должен заключаться в том, чтобы сделать вычислительные мощности менее дорогими и способными удовлетворять разнообразные потребности.

Итак, у каких компаний самые изобретательные ходы?

** С точки зрения снижения потребления и повышения эффективности интеллектуального вычислительного центра, стоит с нетерпением ждать концепции Alibaba по «экологизации всей отраслевой цепочки вычислительных мощностей». **

Как мы все знаем, затраты энергии на обучение больших моделей очень высоки. Но на самом деле только 20% этой мощности используется для самих вычислений, а остальное используется для поддержания работы сервера. Экологический отчет Google за 2023 год подтверждает это со стороны. Согласно отчету, в 2022 году Google потребил почти 5,2 миллиарда галлонов воды для охлаждения центров обработки данных, что эквивалентно 1/4 ежедневной питьевой воды в мире, и может заполнить полтора Западных озера.

Для достижения большей степени общего эффекта энергосбережения и сокращения выбросов Ant Group и Китайская академия информационных и коммуникационных технологий (CAICT) выпустили «Белую книгу по экологизации вычислений для приложений вычислительной мощности», в которой была выдвинута концепция «сквозных зеленых вычислений».

В частности, сквозные «зеленые» вычисления должны учитывать затраты на энергопотребление во время эксплуатации на ранней стадии строительства, от производства электроэнергии, производства вычислительной мощности (включая строителей интеллектуальных вычислительных центров, производителей оборудования, поставщиков облачных услуг) до приложений вычислительной мощности.

В некоторой степени, исходя из доли использования энергии в прошлом, снижение затрат, вызванное экологизацией отраслевой цепочки, может быть более рентабельным, чем прорыв в технологии чипов в краткосрочной перспективе, что способствует модернизации цифрового интеллекта малых и средних предприятий.

** С точки зрения повышения уровня планирования вычислительных мощностей, Huawei, Alibaba, Tencent, Baidu и другие предприятия внесли свой вклад, но среди них наиболее совместимыми корпоративными генами по-прежнему остаются Huawei. **

В настоящее время наиболее основным проектом планирования вычислительных мощностей в Китае является проект «East Data and West Computing», впервые явно предложенный в «Плане внедрения Национальной интегрированной интегрированной инновационной системы совместной инновационной системы вычислительной мощности Национального интегрированного центра больших данных» в 2021 году, направленный на создание национальной системы вычислительных мощностей.

Хранение и обработка данных на востоке и западе сопряжены с серьезными проблемами как со стороны предложения, так и со стороны распределения.

Возьмем, к примеру, распространенную проблему потери пакетов.

Когда несколько серверов одновременно отправляют на сервер большое количество пакетов, количество пакетов превышает емкость кэша коммутатора и происходит потеря пакетов, что, в свою очередь, влияет на эффективность вычислений и хранения.

Чтобы решить эту проблему, компания Huawei внедрила интеллектуальные алгоритмы в сетевые коммутаторы центров обработки данных, собирала информацию о состоянии сети в режиме реального времени, такую как глубина очереди, пропускная способность полосы пропускания, модель трафика и другие параметры, и динамически устанавливала идеальный конвейер очереди с помощью интеллектуальных алгоритмов без потерь, в конечном итоге достигнув баланса между отсутствием потери пакетов, высокой производительностью и низкой задержкой после обучения моделирования.

Кроме того, Huawei внедрила инновационные технологии, такие как распределенная адаптивная маршрутизация и интеллектуальные алгоритмы облачных карт, для участия в проектировании и строительстве национальных узлов-хабов.

По мере того, как отечественные большие модели становятся все более и более практичными на пути к расширению возможностей тысяч отраслей промышленности, вопрос о том, «как решить дилемму вычислительной мощности Китая», будет становиться все более и более важным. Мы видим, что в цепочке вычислительной энергетики Китая произошло много изменений, таких как добавление интернет-гигантами чипов собственной разработки, вычислительная база, построенная на отечественных чипах, и прорастание экологии программного обеспечения, которая не ценилась в прошлом. За этими изменениями стоит настойчивость и решимость китайских предприятий преодолеть технические барьеры.

** Объективно говоря, с точки зрения технической мощи отечественные игроки все еще находятся на определенной дистанции от производителей мирового уровня, но нельзя игнорировать тот факт, что даже NVIDIA, которая находится в самом разгаре, уже много лет балансирует на грани жизни и смерти еще много лет до наступления эры ИИ. **

Ночь перед рассветом самая темная, но солнечные лучи уже за горизонтом.

Ресурсы:

Расследование правды о нехватке ИИ-серверов: цена выросла на 300 000 за два дня, и даже «Король MSG» вышел на рынок|Мудрые вещи

  • Интеллектуальная вычислительная мощность, новая инфраструктура, наложенная на зарубежную мультимодальную модернизацию, приложение вычислительной мощности для удовлетворения катализатора | Чжэшан Секьюритиз*

  • Руководитель технологической цепочки, экосистема Huawei | Ценные бумаги ФТ*

Тренировочная потребность в выбросе «жажды вычислительных мощностей» как решить | Netinfo Jilin

  • Запрет на чипы в США усилился! NVIDIA, Intel или Limited | Экономические новости 21 века*
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить