Вычислительный карнавал, кто такая «китайская версия» Nvidia?

Question

**Источник: **Core Tide IC**Текст: Десять переулков Ван Ике****Редактор: Су Ян Сюбай**![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-f79a8848a2-dd1a6f-7649e1) * «Основные вещи тяжелы», план исследования полупроводниковой промышленности Tencent Technology, этот выпуск Core Tide IC и Tencent Technology, посвященный взрыву больших моделей, формированию новой модели на глобальном рынке вычислительной мощности чипов, компоновке ведущие компании и рост отечественных производителей преследуют. *Волна ИИ-революции, случайно вызванная ChatGPT, снова взорвала рынок ИИ-чипов."Такие чипы, как A800 и H800, подешевели со 120 000 юаней до 250 000 или даже 300 000, а то и до 500 000". количества, и они должны иметь «прямую связь» с Хуан Ренсюнь.Поскольку так называемый «нет чипа, нет ИИ», поскольку спрос на вычислительную мощность больших моделей стремительно растет, чипы, которые являются основой технологии ИИ, открывают важные возможности для бизнеса. OpenAI однажды предсказал, что для того, чтобы совершить прорыв в научных исследованиях искусственного интеллекта, вычислительные ресурсы, необходимые для потребления, будут удваиваться каждые 3-4 месяца, а средства также должны сопровождаться экспоненциальным ростом («Закон Мура»).Финансовый директор Nvidia Кресс сказал, что текущий рыночный спрос на вычислительную мощность ИИ превысил ожидания компании на следующие несколько кварталов, и слишком много заказов нужно выполнить.Волна генеративного ИИ принесла Nvidia много денег. После 14 лет листинга Nvidia успешно вошла в клуб с рыночной капитализацией в триллион долларов.Чтобы достичь этой цели, гигантам Силиконовой долины, таким как Apple, потребовалось 37 лет, Microsoft — 33 года, Amazon — 21 год, а Tesla бежала быстрее всех. прошло всего 11 лет.Это также побудило китайские компании-производители чипов попробовать себя в этой области. полагаться на свои собственные исследования Расширение прав и возможностей отечественной крупномасштабной модели. Некоторые крупные производители также начали использовать микросхемы искусственного интеллекта собственной разработки для поддержки части задач обучения или рассуждений модели, таких как микросхемы Baidu Kunlun, Ali Hanguang 800...Столкнувшись с рынком в триллион долларов, созданным вычислительной мощностью ИИ, смогут ли отечественные компании насладиться этой волной дивидендов? Как отечественным производителям чипов преодолевать «гору» Nvidia? Это проблема, от которой не может уйти ни одна компания.## 01. Безумие ИИ создало рыночную стоимость Nvidia в триллион долларовМужчины, которые любят носить кожаную одежду, первыми получают дивиденды от ИИ.В конце 2022 года, после выхода ChatGPT, он быстро вызвал безумие ИИ во всем мире. Среди них Nvidia, которая делала ставку на будущее ИИ, стала одной из компаний, получивших наибольшую выгоду от волны ChatGPT. На конференции Nvidia GTC в этом году основатель и генеральный директор Nvidia Джен-Хсун Хуан представил новый искусственный интеллект и технологии чипов и сказал, что «момент iPhone» для искусственного интеллекта настал.На пресс-конференции Хуан Ренсюнь сказал, что развертывание крупномасштабных языковых моделей, подобных ChatGPT, является важной новой рабочей нагрузкой для рассуждений.Для поддержки крупномасштабных рассуждений языковых моделей Nvidia выпустила серию продуктов и услуг, связанных с ИИ. Поле.Среди них принята новая архитектура.И наиболее привлекательным является чип H100 с более продвинутым техпроцессом.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-9befd68a73-dd1a6f-7649e1) Источник: официальный сайт NVIDIAЭтот графический процессор представляет собой H100 на основе архитектуры NVIDIA Hopper, оснащенный движком Transformer, предназначенным для обработки и управления предварительно обученными моделями, аналогичными ChatGPT. Стандартный сервер с четырьмя парами H100 и NVLink с двумя графическими процессорами может ускорить обучение в 10 раз по сравнению с HGX A100 для обработки GPT-3.«H100 может снизить стоимость обработки больших языковых моделей на порядок», — сказал однажды Хуан Ренсюнь. На основе чипа H100 компания Nvidia также построила новейший суперкомпьютер DGX, оснащенный 8 графическими процессорами H100, которые можно соединить в один огромный графический процессор, предоставив «чертеж» для построения инфраструктуры ИИ. Суперкомпьютер DGX полностью запущен в производство.После этого высокопроизводительные графические чипы Nvidia, такие как A100, H100, A800 и H800, соответственно повысили свои цены, особенно флагманский чип H100, который был продан более чем за 40 000 долларов США на зарубежных платформах электронной коммерции в середине апреля. некоторые продавцы даже оценили его в 6,5 десяти тысяч долларов США.В то же время китайские чипы Nvidia A800 и H800 также были разграблены. "Отечественным крупным модельным компаниям в принципе трудно получить эти чипы. Спрос на всем рынке превышает спрос, и дефицит очень серьезный", - откровенно сказал Чжан Цзюэ, основатель поставщика электронных компонентов "Guangxin Century". Xinchao IC: «В этом году этот тип чипа графического процессора изменился со 120 000 юаней до 250 000 юаней или даже до 300 000 юаней или даже до 500 000 юаней».Нет никаких сомнений в том, что технологическое лидерство Nvidia в области высокопроизводительных графических процессоров и два ее чипа искусственного интеллекта, A100 и H100, являются основной движущей силой для больших языковых моделей, таких как ChatGPT.Некоторые специалисты по облачным вычислениям считают, что 10 000 чипов Nvidia A100 — это порог вычислительной мощности для хорошей модели ИИ. Суперкомпьютер с искусственным интеллектом, созданный Microsoft для OpenAI для обучения своих моделей, оснащен 10 000 чипов Nvidia GPU. Так совпало, что крупные отечественные интернет-компании также разместили крупные заказы у Nvidia.Согласно недавнему отчету LatePost, Byte заказала у Nvidia графические процессоры на сумму более 1 миллиарда долларов США.Еще одна крупная компания, которую нельзя назвать, имеет заказ как минимум на более чем 1 млрд. юаней юаней.Что еще более преувеличено, так это то, что смогут ли эти компании, наконец, захватить карту, больше зависит от деловых отношений, особенно от того, были ли они крупными клиентами Nvidia в прошлом. «Говорите ли вы с китайской Nvidia или едете в Соединенные Штаты, чтобы поговорить напрямую с Лао Хуаном (Хуан Ренсюнем), есть разница».В результате финансовые данные Nvidia снова поднялись до новых максимумов. 25 мая Nvidia опубликовала свой финансовый отчет за первый квартал, в котором говорится, что выручка от центров обработки данных, в которых расположены чипы ИИ, достигла рекордно высокого уровня, сохранив темпы роста в годовом исчислении более чем на 10%.Хуан Ренсюнь сообщил, что вся линейка продуктов для центров обработки данных в настоящее время находится в производстве, и предложение значительно увеличивается, чтобы удовлетворить всплеск спроса.Серия хороших новостей напрямую подталкивала цену акций Nvidia все выше и выше. Вечером 30 мая фондовый рынок США открылся, и рыночная стоимость Nvidia сразу превысила 1 триллион долларов. 19 июля общая рыночная стоимость Nvidia за ночь выросла на 175 миллиардов долларов США, что снова вызвало инвестиционный бум.Согласно веб-сайту компании marketcap, общая рыночная стоимость Nvidia занимает шестое место в мире, и в настоящее время это компания-производитель чипов с самой высокой рыночной стоимостью, близкой к двум TSMC (533,6 млрд долларов). год. Я должен признать, что эта волна безумия ИИ заполнила Nvidia Хуанг Ренсюня.## 02. Nvidia не может наслаждаться безумием вычислительной мощности«У Nvidia не будет вечной монополии на крупномасштабные чипы для обучения и логического вывода».Это был ответ генерального директора Tesla Илона Маска на твит Адама Д’Анджело, генерального директора сайта социальных вопросов и онлайн-рынка знаний Quora, который написал: «Одна из причин, по которой бум ИИ недооценивается, — это нехватка графических процессоров/TPU. Это привело к различным ограничениям на запуск продуктов и обучение моделей, но ни одно из них не было очевидным. Вместо этого мы увидели стремительный рост цен на акции Nvidia. Как только предложение совпало со спросом, все ускорилось».![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-a221349bb0-dd1a6f-7649e1) Очевидно, с этим не согласен Железный Человек из Силиконовой долины, который также прокомментировал: «Многие другие чипы-ускорители нейронных сетей также находятся в стадии разработки, и Nvidia не будет вечно монополизировать крупномасштабное обучение и рассуждения».Шторм приближается.Насколько большим может стать рынок вычислительной мощности, вызванный безумием ИИ, сосредоточенным на больших моделях? Soochow Securities считает, что спрос на вычислительную мощность моделей ИИ продолжает расти, открывая рыночный спрос на высокопроизводительные вычислительные чипы.По оценкам, объем рынка чипов ИИ в моей стране достигнет 178 млрд юаней в 2025 году, а совокупный годовой темп роста с 2019 по 2025 год достигнет 42,9%. С точки зрения размера рынка чипы ИИ находятся в зачаточном состоянии, но у них есть огромный потенциал роста.Чип ИИ — это широкое понятие, которое обычно относится к модулю, специально используемому для обработки вычислительных задач в приложениях искусственного интеллекта.Это аппаратное обеспечение вычислительных задач, родившееся в эпоху быстрого развития приложений искусственного интеллекта.Все чипы для искусственного интеллекта приложения называются чипами ИИ. Существует три основных технических маршрута: универсальный (GPU), полузаказной (FPGA) и пользовательский (ASIC).С точки зрения крупномасштабного обучения моделей, тонкой настройки на основе сценариев и сценариев приложений для логического вывода гетерогенная вычислительная мощность, обеспечиваемая чипами ЦП + ИИ, превосходные возможности параллельных вычислений и высокая пропускная способность соединения могут поддерживать максимальную эффективность вычислений ИИ. и стать интеллектуальным основным решением для вычислений.С точки зрения доли рынка, по данным iResearch, ожидается, что к 2027 году китайский рынок микросхем искусственного интеллекта достигнет 216,4 млрд юаней. С внедрением оптимизации моделей ИИ доля логических чипов ИИ будет увеличиваться день ото дня. В 2022 году на китайские чипы для обучения ИИ и чипы для рассуждений ИИ будет приходиться 47,2% и 52,8% соответственно.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-8a23b1d74b-dd1a6f-7649e1) В настоящее время в области ИИ-чипов существует три типа игроков: один — старые гиганты чипов, представленные Nvidia и AMD, с выдающейся производительностью продукта, другой — гиганты облачных вычислений, представленные Google, Baidu и Huawei. , а также разработали чипы искусственного интеллекта, платформы глубокого обучения и т. д. для поддержки разработки больших моделей. Например, Kunpeng Ascend от Huawei, CANN и Mindspore, Kunlun Core от Baidu и т. д. Наконец, есть несколько маленьких и красивых единорогов с искусственным интеллектом, таких как Cambrian, Biren Technology, Tianshu Zhixin и т. д.Хотя распространение отечественных крупномасштабных моделей может привести к отставанию в вычислительной мощности, это лишь вопрос времени, когда отечественные производители чипов получат дивиденды от отечественной замены. Как разработчик чипов для обучения ИИ, Cambrian, «первая акция чипов ИИ», снова привлекла внимание рынка, и цена ее акций продолжает расти. Последняя рыночная стоимость превысила 90 миллиардов долларов.В линейке облачных продуктов Cambricon выпустила четыре поколения чипов: Siyuan 100 в 2018 г., Siyuan 270 в 2019 г., Siyuan 290 (автомобиль) в 2020 г. и серия Siyuan 370, выпущенная в 2021 г. Она используется для поддержки задач обработки искусственного интеллекта. с быстрым ростом сложности и пропускной способности данных в сценариях облачных вычислений и центров обработки данных. Кроме того, у Cambrian есть еще не выпущенный продукт Siyuan 590, который находится в стадии разработки. Кроме того, к концу 2022 года серия Siyuan 370 и продукт AIGC Baidu Flying Paddle пройдут тестирование на совместимость уровня II.Однако точной информации о том, приняли ли отечественные крупные модельные компании чипы Cambrian, пока нет. «В области высокопроизводительных микросхем искусственного интеллекта отечественные производители находятся в зачаточном состоянии, и для проверки многих вещей требуется время и деньги», — сказал старший инженер по микросхемам. Даже чипы таких компаний, как Huawei, Baidu и Haiguang Information, имеют явный разрыв с продуктами Nvidia.Кто-то однажды откровенно сказал, что разрыв между Nvidia и другими производителями чипов — это разница между академиками и старшеклассниками. Как сказал Хуан Рэнсюнь, Nvidia «работает», а другие производители чипов, которые хотят превзойти гигантов, могут только бешено работать.## 03. «Игра престолов» за большой моделью ИИВ дополнение к Nvidia, недавно к действиям присоединился AMD, еще один гигант графических процессоров.Недавно AMD выпустила новейшую ускорительную карту.На сайте конференции, где AMD представила новейшую ускорительную карту Instinct MI300X, на PPT была специально напечатана строка слов, посвященная большим языковым моделям.Это расценивается отраслью как прямое заявление войны против Nvidia!![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-fec37d1a75-dd1a6f-7649e1) Сообщается, что плотность памяти с высокой пропускной способностью (HBM) MI300X может достигать в 2,4 раза больше, чем у NVIDIA H100, а пропускная способность памяти с высокой пропускной способностью может достигать до 1,6 раза, чем у H100.Очевидно, что MI300X может работать более крупная модель AI, чем H100.Серия MI300, в которой находится MI300X, представляет собой серию новейших карт-ускорителей APU, созданных AMD для ИИ и высокопроизводительных вычислений. Среди них MI300A — «базовая модель», а MI300X — «оптимизированная модель для больших моделей» с более высокой аппаратной производительностью.В настоящее время были получены образцы MI300A, и предполагается, что они скоро будут доступны для покупки; ожидается, что образцы крупномасштабной выделенной карты MI300X и вычислительной платформы AMD Instinct, объединяющей 8 MI300X, будут представлены в третьем квартале этого года. года и будет запущен в четвертом квартале.В последние несколько лет, по сравнению с большими шагами Nvidia в области искусственного интеллекта, действия AMD кажутся немного медленными. Как сказал Эрик Джанг, генеральный директор DeepBrain AI, он чувствует, что AMD разочаровала его за последние несколько лет, и за последние пять лет ничего не изменилось. Особенно во время вспышки AIGC, если AMD не будет усердно работать, чтобы не отставать, разрыв только увеличится.С выпуском продуктов AMD серии MI300 мы, наконец, можем увидеть, как AMD и Nvidia сражаются лицом к лицу.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-15a250926b-dd1a6f-7649e1) К сожалению, похоже, рынок не покупает новые карты AMD.Во время этой конференции AMD цена ее акций не выросла, а упала. Напротив, цена акций Nvidia также выросла на волну. Настроения рынка понять нетрудно, потому что в сфере высоких технологий, особенно на развивающихся рынках, на коммерческом рынке становится обычной логикой идти в ногу с каждым шагом и оставаться сильным.Но на самом деле после тщательного изучения причин можно обнаружить, что главная причина, по которой Nvidia монополизирует рынок обучающих чипов с искусственным интеллектом, — это собственная разработка CUDA-экологии. Таким образом, если AMD MI300 хочет заменить Nvidia, сначала он должен быть совместим с экосистемой CUDA от Nvidia. Для этой цели AMD запустила экосистему ROCm и добилась полной совместимости с CUDA через HIP, тем самым снизив известную стоимость пользователей.В связи с этим Муронг Йи, известный инвестиционный блогер, считает, что трудность выбора пути, совместимого с NVIDIA CUDA, заключается в том, что его скорость итерации обновлений никогда не будет соответствовать скорости CUDA, и трудно достичь полной совместимости, т.е. , с одной стороны, итерация всегда на один шаг медленнее. Графический процессор Nvidia быстро повторяет микроархитектуру и набор инструкций, и соответствующие обновления функций требуются во многих местах верхнего стека программного обеспечения, но AMD не может знать дорожную карту продукта Nvidia, и обновления программного обеспечения всегда будут на один шаг медленнее, чем Nvidia (например, AMD может только что объявила о поддержке CUDA11, но Nvidia запустила CUDA12); с другой стороны, сложность полной совместимости увеличит нагрузку на разработчиков. очень сложно, и AMD нужно вложить много сил и материальных ресурсов.Чтобы наверстать упущенное, потребуются годы или даже более десяти лет, потому что неизбежно будут функциональные различия, и если совместимость не будет сделана хорошо, это повлияет представление. Следовательно, это также ключевые причины, по которым все не покупают его.По оценкам Khaveen Investments, доля Nvidia на рынке графических процессоров для центров обработки данных достигнет 88% в 2022 году, а остальное поделят между собой AMD и Intel.С тех пор, как OpenAI выпустила ChatGPT в прошлом году, брожение нового витка технологической революции продолжилось. Можно сказать, что ни один технологический прогресс не привлекал внимание мира так сильно, как ChatGPT на протяжении многих лет.За ними следуют различные технологические компании, научно-исследовательские институты, колледжи и университеты в стране и за рубежом Менее чем за полгода появилось много начинающих компаний для крупномасштабных модельных приложений, а масштабы финансирования неоднократно покорить новые вершины.По словам блогера wgang, Baidu, iFLYTEK, 4Paradigm, Университет Цинхуа, Фудань и другие крупные отечественные фабрики, начинающие компании и научно-исследовательские институты последовательно выпускали крупномасштабные модельные продукты:![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-0a9f6d33bd-dd1a6f-7649e1) *Источник: Чжиху Вгван*Можно увидеть, что не только в общей области, но и в конкретных отраслевых сценариях, особенно в некоторых областях с сильным профессионализмом и высокой плотностью знаний, технологические компании также выпускают большие модели в вертикальных областях. Например, компания Baijiayun (RTC), зарегистрированная в США, недавно выпустила продукт AIGC Market Easy на основе своего понимания потребностей предприятий в услугах.Это также первый механизм крупномасштабных моделей GPT, подходящий для сценариев производства контента. отделов маркетинга предприятия.Некоторые инсайдеры отрасли с улыбкой сказали: «Отечественные крупномасштабные модели сформировали ситуацию, когда группы моделей дико танцуют и соревнуются сотни моделей. Ожидается, что к концу год."Однако разработка больших моделей требует поддержки трех важных факторов: алгоритмов, вычислительной мощности и данных.Вычислительная мощность является важным энергетическим двигателем для обучения больших моделей, а также серьезным препятствием для развития индустрии больших моделей. в Китае.Возможности чипа напрямую влияют на эффект и скорость обучения высокопроизводительным вычислениям. Как было сказано выше, несмотря на частое появление отечественных масштабных модельных продуктов, судя по чипам, стоящим за ними, все эти платформы используют либо графические процессоры Nvidia A100 и H100, либо графические процессоры Nvidia с уменьшенной конфигурацией A800 и A800, специально выпущенные после запрета в прошлом году. H800, пропускная способность этих двух процессоров составляет около 3/4 и примерно половину от исходной версии, что позволяет избежать стандартного ограничения высокопроизводительного графического процессора.В марте этого года Tencent объявила об использовании H800 в новой версии высокопроизводительных вычислительных сервисов, выпущенной Tencent Cloud, и заявила, что это первая версия в Китае.Alibaba Cloud также предложила в мае этого года, что «Битва интеллектуальных вычислений» станет битвой номер один в этом году, и количество графических процессоров стало важным показателем этой битвы.Кроме того, Shangtang также объявила, что около 30 000 графических процессоров были развернуты в вычислительном кластере «больших устройств ИИ», из которых 10 000 — это Nvidia A100. Byte и Meituan напрямую выделяют графические процессоры других бизнес-групп компании для обучения больших моделей. Некоторые производители даже со второй половины 2022 года искали различные комплектные машинные продукты, способные вытеснить A100 с рынка, с единственной целью — получить чипы GPU. «Слишком много машин и недостаточно места для их хранения».Понятно, что ведущие отечественные технологические компании вложили значительные средства в ИИ и облачные вычисления.В прошлом накопление A100 достигало десятков тысяч.В то же время крупные технологические компании Китая все еще участвуют в новом раунде закупочной конкуренции.По словам поставщика облачных услуг, крупные компании, такие как Byte и Alibaba, в основном договариваются о покупках напрямую с оригинальным заводом Nvidia, и агентам и рынкам подержанных товаров трудно удовлетворить их огромные потребности.Как упоминалось выше, в этом году ByteDance заказала у Nvidia графических процессоров на сумму более $1 млрд. Объем закупок только Byte в этом году близок к общему объему продаж коммерческих графических процессоров, проданных Nvidia в Китае в прошлом году. По имеющимся данным, есть еще одна крупная компания с заказом не менее чем на 1 млрд юаней.Видно, что крупные технологические компании Китая очень срочно закупают графические процессоры.Не только отечественные компании, но и крупные зарубежные заказчики имеют очень большой спрос на чипы Nvidia A100/H100. Согласно статистике, Baidu, которая первой начала тестировать продукты, подобные ChatGPT, с 2020 года имеет ежегодные капитальные затраты в размере от 800 до 2 миллиардов долларов США, а Alibaba — от 6 до 8 миллиардов долларов США. За тот же период капитальные затраты Amazon, Meta, Google и Microsoft, четырех американских технологических компаний, построивших собственные центры обработки данных, составили не менее 15 миллиардов долларов США в год.В настоящее время видимость заказов Nvidia достигла 2024 года, а чипов высокого класса не хватает. При текущем графике производства даже A800/H800 не будут поставлены до конца этого или следующего года. В краткосрочной перспективе, с точки зрения популярности, единственное, что может повлиять на продажи высокопроизводительных графических процессоров Nvidia, — это производственные мощности TSMC.##04. За «сумасшедшей» Nvidia отечественные чипы не достаточны как в аппаратном, так и в программном обеспечении?Судя по поставке чипов крупномасштабных модельных продуктов, в настоящее время нет заменителей A100, H100 и уменьшенных версий A800 и H800, специально поставляемых в Китай с точки зрения обучения крупномасштабных моделей ИИ.Так почему же в этом витке бума GPT Nvidia взяла на себя инициативу и показала хорошие результаты?Чжан Гаонань, управляющий партнер Huaying Capital, сказал, что, с одной стороны, это связано с тем, что у Nvidia самый ранний макет, а структура ее микроядра также развивалась и совершенствовалась от поколения к поколению. Теперь, будь то с точки зрения параллелизма, скорости шины или зрелой поддержки микроядром матричных преобразований, его возможности уже очень эффективны, включая одновременное предоставление очень полной вычислительной платформы CUDA, которая фактически стала потенциальным отраслевым стандартом для алгоритмы глубокого обучения.Вспомогательные средства всей производственной цепочки также очень полны, а всесторонние конкурентные барьеры и глубина рва чрезвычайно высоки.Подводя итог, можно сказать, что нынешняя незаменимость графического процессора Nvidia связана с механизмом обучения больших моделей, основными этапами которого являются предварительное обучение и тонкая настройка, первый из которых заключается в закладке фундамента, что эквивалентно получению общего образования. ; последний оптимизирован под конкретные сценарии и задачи для повышения производительности труда.Итак, могут ли отечественные чипы GPU поддерживать требования к вычислительной мощности больших моделей?В практических приложениях потребность большой модели в вычислительной мощности делится на две стадии: одна — это процесс обучения большой модели ChatGPT, а другая — процесс коммерциализации модели. То есть обучение ИИ заключается в создании моделей, а рассуждения ИИ — в использовании моделей, а обучение требует более высокой производительности чипа.Исходя из этого, отечественные компании-производители ИИ-чипов продолжают появляться, выпуская продукты на рынок один за другим. Такие компании, как Suiyuan Technology, Biren Technology, Tianshu Zhixin и Cambrian, запустили свои собственные облачные продукты на GPU, и теоретические показатели производительности неплохие. Микросхема DCU «Shensu No. 1» от Haiguang Information имеет относительно полную экосистему программного и аппаратного обеспечения и совместима с архитектурой CUDA. И крупные интернет-компании, такие как Tencent, Baidu и Ali, также активно внедряют чипы ИИ посредством инвестиций и инкубации.Среди них обучение крупномасштабных моделей требует обработки информации с высокой степенью детализации, что требует более высокой точности и скорости вычислений для облачных обучающих чипов.В настоящее время большинство отечественных графических процессоров не имеют возможности поддерживать обучение крупномасштабных моделей.Это подходит для работы с выводом в облаке, которая не требует такой высокой степени детализации информации.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-b8232a1818-dd1a6f-7649e1) * Продукты искусственного интеллекта и прикладные основные волновые ИС некоторых отечественных родственных компаний отсортированы в соответствии с общедоступной информацией *В марте этого года Baidu Li Yanhong публично заявил, что чип Kunlun сейчас очень подходит для рассуждений больших моделей и будет пригоден для обучения в будущем.Цзоу Вэй, вице-президент Tianshu Zhixin, также сообщил Xinchao IC, что между отечественными чипами и последними продуктами Nvidia все еще существует определенный разрыв, но с точки зрения расчетов выводов отечественные чипы могут достичь той же производительности, что и обычные продукты, а с приложением Популярность искусственного интеллекта, рыночный спрос на чипы для рассуждений ускорит рост, и с расширением спроса отечественные чипы также будут иметь больший рынок.Другой представитель отрасли, не пожелавший назвать свое имя, сказал: «Отечественные продукты на базе графических процессоров общего назначения действительно имеют отставание от международных флагманских продуктов в плане обучения крупномасштабным моделям, но это не является невосполнимым. Просто в отрасли не рассчитан на крупномасштабные модели в определении продукта».В настоящее время отраслевые практики проводят соответствующие исследования и усилия, например, думают о том, можно ли повысить вычислительную мощность чипа с помощью чиплетов и усовершенствованной упаковки. В настоящее время отечественные производители графических процессоров занимаются разработкой и компоновкой чипов в области больших моделей.С точки зрения капитала, Чжан Гаонань, управляющий партнер Huaying Capital, сказал Xinchao IC, что Huaying уже давно уделяет пристальное внимание инфраструктуре вычислительной мощности, будь то GPU, DPU или более передовые фотоэлектрические гибридные вычисления, квантовые вычисления. , Есть Целевые исследования и макет. В целом, он фокусируется на вычислительной инфраструктуре общего назначения, такой как FPGA и граничные вычисления. Напротив, в настоящее время многие микросхемы вычислительной мощности, связанные с глубоким обучением, специальными алгоритмами, локальной оптимизацией вычислительной мощности и т. Д., Не находятся в центре внимания.На самом деле, помимо разрыва в аппаратной производительности, программная экосистема также является недостатком отечественных производителей ИИ-чипов.Чип должен адаптироваться к нескольким уровням, таким как аппаратная система, цепочка инструментов, компилятор и т. д. В противном случае может показаться, что этот чип может использовать 90% вычислительной мощности в одной сцене, но только в другой. сценарий Исчерпание 80% сценария производительности.Как было сказано выше, у Nvidia в этом плане есть очевидные преимущества. Еще в 2006 году Nvidia запустила вычислительную платформу CUDA, которая представляет собой программный движок для параллельных вычислений.Среда CUDA объединяет множество кодов, необходимых для использования вычислительной мощности графического процессора.Инженеры могут напрямую использовать эти коды, не записывая их один за другим. Разработчики могут использовать CUDA для более эффективного обучения и рассуждений ИИ, а также более эффективного использования вычислительной мощности графического процессора. Сегодня CUDA превратилась в инфраструктуру ИИ, и все основные фреймворки, библиотеки и инструменты ИИ разрабатываются на основе CUDA.Без этого набора языков программирования инженерам-программистам будет чрезвычайно сложно осознать ценность аппаратного обеспечения.Если графические процессоры и микросхемы искусственного интеллекта, отличные от Nvidia, хотят получить доступ к CUDA, им необходимо предоставить собственное программное обеспечение для адаптации. По словам инсайдеров отрасли, я связался с производителем графических процессоров, не принадлежащим NVIDIA.Хотя его расценки на чипы и услуги ниже, чем у NVIDIA, и они обещают предоставить более своевременные услуги, общие затраты на обучение и разработку при использовании его графического процессора будут выше, чем у NVIDIA. неопределенность результатов и сроков разработки.Хотя графические процессоры Nvidia дороги, на самом деле они самые дешевые в использовании. Для компаний, которые намереваются воспользоваться возможностью крупномасштабных моделей, деньги часто не являются проблемой, а время является более ценным ресурсом.Каждый должен как можно скорее получить достаточную передовую вычислительную мощность, чтобы обеспечить преимущество первопроходца.Таким образом, для отечественных поставщиков микросхем, даже если продукт с сопоставимой вычислительной мощностью может быть стекирован путем стекирования микросхем, клиентам сложнее принять адаптацию и совместимость программного обеспечения. Кроме того, с точки зрения эксплуатации сервера, расходы на его материнскую плату, плату за электроэнергию, эксплуатационные расходы и такие вопросы, как энергопотребление и тепловыделение, которые необходимо учитывать, значительно увеличат эксплуатационные расходы центра обработки данных.Поскольку ресурсы вычислительной мощности часто должны быть представлены в виде пула, центры обработки данных обычно охотнее используют один и тот же чип или чипы одной и той же компании, чтобы упростить объединение вычислительных мощностей.Высвобождение вычислительной мощности требует сложного взаимодействия программного и аппаратного обеспечения, чтобы превратить теоретическую вычислительную мощность чипа в эффективную вычислительную мощность. Для клиентов непросто использовать отечественные ИИ-чипы. Замена облачных ИИ-чипов требует определенных затрат и рисков при миграции, если только новый продукт не обладает преимуществами в производительности или не может создавать проблемы, которые другие не могут решить в определенном измерении. клиентов для замены очень мало.Как единственный поставщик графических процессоров, который действительно может обрабатывать ChatGPT, Nvidia является заслуженным «королем вычислительной мощности ИИ». Шесть лет назад Хуан Ренсюнь лично поставил OpenAI первый суперкомпьютер, оснащенный чипом A100, помог последней создать ChatGPT и стал лидером эпохи ИИ.Однако, поскольку в прошлом году Соединенные Штаты ввели экспортный контроль, Nvidia запретили экспортировать в Китай два своих самых передовых чипа GPU, H100 и A100. Это, несомненно, удар по нижестоящим прикладным компаниям.С точки зрения безопасности и самоконтроля это также открывает новые возможности для отечественных производителей чипов. Хотя отечественные чипы уступают гигантам индустрии, таким как Nvidia и AMD, по производительности и экологии программного обеспечения, что обусловлено сложными международными торговыми отношениями и геополитическими факторами, «отечественное замещение» стало основной темой развития отечественной полупроводниковой промышленности.## 05. ЗаключениеКаждое увеличение вычислительной мощности вызовет волну технологических и промышленных изменений: ЦП ведут человечество в эру ПК, мобильные чипы вызывают волну мобильного Интернета, а чипы ИИ преодолевают десятилетиями существовавшее узкое место вычислительной мощности в ИИ. промышленность.Сегодня настал «момент AI iPhone», и дорога в следующую эру, возможно, уже впереди.Хотя в области чипов искусственного интеллекта и программных систем в этих центрах обработки данных по-прежнему доминируют иностранные производители, рыночные двери для «локализации вычислительной мощности», возможно, уже сейчас открываются.