Захватив «еду и траву» войны ИИ, цена видеокарты Nvidia AI стремительно растет

Оригинальный текст: Синсей

Источник изображения: сгенерировано Unbounded AI

От эпохи майнинга до эпохи искусственного интеллекта вычислительная мощность графического процессора снова вступила в игру. Конкуренция за резерв вычислительных мощностей среди отечественных и зарубежных облачных вендоров в самом разгаре...

Byte приобрела у Nvidia 100 000 ускорителей A100 и H800 на сумму более 1 млрд долл. США (более 7 млрд юаней).Объем закупок только Byte в этом году близок к общему объему продаж коммерческих графических процессоров, проданных Nvidia в Китае в прошлом году. , Еще одно крупное предприятие имеет стоимость заказа не менее 1 млрд юаней.

OpenAI, которая уже использует около 25 000 графических процессоров Nvidia, говорит, что по-прежнему не хватает графических процессоров. ChatGPT требуется 13,5 EPLOPS вычислительной мощности на каждые 100 миллионов активных пользователей, поддерживаемых примерно 69 000 серверов NVIDIA DGX A100 80G, а текущая глобальная вычислительная мощность может поддерживать только 100 миллионов среднестатистических онлайн-пользователей в день.

На рынке спотового обращения этих высококлассных графических процессоров даже половина непрофессионала стремится попробовать, когда видит возможность, и его глаза полны «золотых кирпичей».

** A800, который первоначально стоил около 74 000 юаней, теперь вырос до более чем 85 000 юаней, а версия высокого класса выросла примерно до 100 000 юаней. ** В конце апреля котировка фьючерса на 8-карточный модуль А800 на рынке составляла еще 900 000, а срок поставки 2 недели, сейчас котировка достигла более 1 млн, а срок поставки продлен. до 7-8 недель. В мае А800 даже уволили до 100 000 юаней.

"Сроки доставки для тех, кто на вторых ролях дольше, а цена дороже. Те, кому не хватило ни одной карты, пошли покупать модули, а те, кто не смог купить модули, позже купили целый сервер.

От одиночной карты GPU до модуля и сервера ИИ, рост цен сумасшедший, нехватка серьезная, а время доставки становится все больше и больше.Действительно ли спрос на рынке так высок? Почему графический процессор Nvidia такой короткий? Кроме того, нет гарантированной даты доставки абсолютно новых оригинальных продуктов, рынок секонд-хенд, серые каналы, депозит не возвращается после оплаты, и вокруг ИИ-сервера разворачивается хаос...

Хаос на рынке графических процессоров NVIDIA

«Мне нужно 1000 или 3000 билетов за один раз, и я не могу их доставить вообще. Спрос здесь настоящий или фиктивный?»

«Хорош ли рынок? У меня есть способ получить товар, но я боюсь, что он будет разбит».

**В мае графических процессоров Nvidia все еще не было в наличии, и их цена росла. **

По словам агента, цена Nvidia A100 начала расти в декабре прошлого года, по состоянию на первую половину апреля этого года ее совокупный рост цен за пять месяцев достиг 37,5%, совокупный рост цен A800 достиг 20,0% в течение тот же период.

Сроки выполнения заказа были увеличены с одного месяца до трех и более месяцев, а некоторые новые заказы «могут быть доставлены только в декабре».

Некоторые производители, имеющие количественное преимущество в серверах с ИИ, используют ресурсы GPU, затягивая пояса. Microsoft столкнулась с дилеммой внутренней нехватки оборудования для серверов ИИ и внедрила механизм «квотного предложения». В июне в протоколе выступления удаленного генерального директора OpenAI Сэма Альтмана было упомянуто, что в Open AI также не хватает графических процессоров, а нехватка графических процессоров задержала многие краткосрочные планы клиентов.

Находясь на волне искусственного интеллекта, Nvidia, «продавец лопат», теперь почти монополизировала весь рынок серверных микросхем ИИ и стала крупнейшим победителем.Не так давно ее рыночная стоимость превысила один триллион юаней, став первой компанией-производителем чипов. в истории с рыночной стоимостью, превышающей 1 триллион долларов США.

Из-за запрета США точечные поставки Nvidia A100 в мою страну были напрямую прекращены. В Китае имеется от 40 000 до 50 000 A100, которые можно использовать для обучения больших моделей ИИ. Поставки довольно ограничены. Внутреннее использование строго запрещено. ограниченное.

Тем не менее, A800, кастрированная версия A100, которая в настоящее время находится в нормальном состоянии, начала производство только в третьем квартале прошлого года. В сочетании с ростом нового спроса он столкнулся с нехваткой предложения.В начале мая A800 подорожал до 100 000 юаней в Китае.

Вообще говоря, дорогие A800, A100 и т. д., о которых сообщают СМИ, относятся к топовой конфигурации в этой серии, то есть память GPU составляет 80G, а технология межсоединений поддерживает версию NVLink.

Друг, работающий на рынке графических процессоров, сказал нам, что цена A800 на спотовом рынке меняется каждый день, и краткосрочные изменения обменного курса также повлияют на цену. Минимальное предложение могло вырасти до 86 000».

По мере усиления дефицита и роста цен все больше участников отгружали и искали графические процессоры, и начался хаос на рынке графических процессоров: потоки запросов, рынок популярных фьючерсов и высокие депозиты, отток из каналов подержанных товаров. "яма"...

Самое прямое впечатление - это шумный спрос со всех сторон.Многие практики рынка, связанные с серверными машинами и серверными графическими процессорами, сообщают, что в последнее время из-за популярности ИИ многие люди приходят, чтобы узнать о картах и ценах, но не многие могут на самом деле сделать сделка.

Я пришел искать одиночные карты типа А800 и А100.Спрос небольшой и цена мне нравится,но спрос большой,а мне нужны сотни карт.Я сказал что помогаю клиентам и друзьям,а торговцы из Хуацянбэй отправлено Такое ощущение, что они устанавливают цены.

"Когда вы приходите так много, как вы можете это поставлять? Спросите его, обращает ли он внимание на преимущество в цене или преимущество во времени доставки, и нет никакой дополнительной информации". "У некоторых людей почти нет оплаты за товар, и они исчезают после запроса." Простая сделка покупки.

В настоящее время существует два основных канала сбыта для поставок графических процессоров корпоративного уровня, таких как Nvidia: один — это первоначальный завод-генеральный агент-дилер-рынок; другой — первоначальный завод-изготовитель OEM (производитель серверов)-дилер- рынок . Те, что обращаются на спотовом рынке, в основном предназначены для дистрибуции, серверных решений или рынков подержанных товаров.

Такие продукты уровня предприятия предназначены для последующих клиентов, таких как предприятия, школы и поставщики серверных решений. Брат Сюй, специализирующийся на серверном бизнесе, сказал, что реальный спрос со стороны Alibaba и других компаний, как правило, заключается в больших заказах.Таким крупным клиентам отдается приоритет в поиске генерального агента или OEM-производителя серверов на верхнем уровне для получения товаров. нижний уровень небольшой, трудно найти реселлеров и поставщиков серверных частей. Есть также сообщения СМИ о том, что поставщики облачных услуг говорят, что крупные компании, такие как Byte и Ali, в основном ведут переговоры напрямую с оригинальной фабрикой Nvidia о закупках, а агентам и рынкам подержанных товаров трудно удовлетворить их огромные потребности.

Отсутствие реального спроса на спотовом рынке не мешает всем искать товары.Если спотовые товары распроданы, им приходится бронировать фьючерсы.Они должны нести высокие депозиты, которые не могут быть возвращены, а дата поставки может быть далекой. прочь.

Понятно, что карты A800 все еще есть в наличии на рынке, карты A100 почти «вымерли», а модули A800 редко бывают в наличии, поэтому приходится выбирать фьючерсы. На примере 8-карточного модуля A800 продавец назвал общую цену 1,12 млн, залог 50% и срок поставки 7-8 недель, гарантии своевременной доставки нет (срок поставки было еще 6 недель несколько дней назад), а залог не возвращается. В конце апреля цена 8-карточного модуля А800 у другого продавца была еще 900 000, с залогом 30%-50% и сроком доставки 2 недели.

За более чем месяц видно, что разница в цене 8-карточного модуля A800 составляет более 200 000 юаней, срок поставки продлен, а также может увеличиться депозит.

Продавец, который утверждал, что является фабрикой-источником, сообщил нам, что 8-карточный модуль есть в наличии, и покупатели, которые хотят его, уже разместили заказ на сумму 500 миллионов юаней, и теперь им остается только ждать уведомления о прибытии.

Заплатив депозит, кажется, можно рано встать в очередь, но сосуществуют высокие риски. Взяв в качестве примера модуль A800 с 8 картами, обычно взимается депозит в размере 50%.Топовый модуль 80G NV A800 стоит более 1 миллиона, а депозит составляет не менее 500 000, и после того, как депозит оплачено, возврату не подлежит. Покупатель в Интернете сообщил, что 10 разовых карт, заказанных в марте и апреле этого года, еще не получили товар.

Срок доставки, обещанный многими продавцами, не гарантируется, базовая цена высока, а коэффициент депозита также высок, поэтому реальные деньги, которые нужно заплатить, больше. Если вы не получите товар, вам остается только ждать, ведь деньги уплачены.

**Если у вас есть партия A800 и A100 на складе, в глазах всех это не обычные видеокарты, а золотые кирпичи. **

Некоторые люди видят жару и хотят заняться ГПУ, но боятся, что товар попадет к ним в руки.Для отдельных спекулянтов, которые гонятся за прибылью, реальный спрос сомнительный.Цена завышена,выделки не стоит.

Подержанные продукты появляются бесконечно, и некоторые люди перерабатывают бывшие в употреблении чипы ИИ по высоким ценам, Не говоря уже о том, где они используются, гарантия на этот тип графического процессора является проблемой.

Срочные производственные мощности: нет недостатка в передовых производственных процессах, в чем проблема?

После того, как ChatGPT стал популярным, интернет-компании и поставщики облачных услуг стали более широко развертывать большие модели ИИ, чтобы конкурировать за большую вычислительную мощность графических процессоров Nvidia. Чего не хватает не только A100 и A800, но и более дорогих H100 и H800. Кто-то спрашивал, недостатка в мощностях по производству вафель нет, почему нельзя поставить GPU?

"Производительность графического процессора увеличивается в 1000 раз каждые 10 лет", "чем больше вы покупаете, тем больше вы экономите", закон Хуанга заменит закон Мура. Хотя передовые производственные процессы могут улучшить производительность графических процессоров, закон Мура подошел к концу, и Назначение сервера отличается от требовательных требований к пространству для чипов мобильных телефонов. Если передовое производство является первым выбором для графических процессоров, передовая упаковка — это вишенка на торте.

Недостаточно производить графические процессоры с передовыми производственными процессами, это большой шаг к повышению производительности графических процессоров в условиях текущих ограничений процесса производства чипов за счет уменьшения размера корпуса, низкого энергопотребления и меньшего количества контактов, а также реализации более тесной взаимосвязи между чипами. чипсы и упаковочные подложки. С любой из четырех волшебных технологий усовершенствованной упаковки Bump, RDL, Wafer и TSV можно осветить новые навыки упаковки.

V100, A100, A800, H100 и т. д. от Nvidia используют передовую технологию упаковки TSMC CoWoS, которая решает проблему «интеграции хранения и вычислений» чипов на фоне высокой вычислительной мощности ИИ. Тем не менее, мощность производства 7-нм пластин TSMC действительно невелика, но на этот раз нехватка все еще связана с TSMC.

** Прежде всего, базовая технология расширенной упаковки CoWoS может быть реализована только TSMC, и это невозможно сделать без TSMC. **

Усовершенствованная упаковочная пластина, которой сейчас не хватает, технология в ней является патентом TSMC, и Nvidia может найти только TSMC, чтобы сделать это.Передовой производственный процесс и усовершенствованная упаковка прочно охвачены TSMC. В 2012 году TSMC запустила уникальную усовершенствованную технологию упаковки CoWoS и с тех пор предоставляет комплексные услуги от производства пластин до упаковки терминалов. Семейство CoWoS включает CoWoS-S и CoWoS-L/R, а также другие компоненты, а среди клиентов, соответствующих приложениям для высокоскоростных вычислений, есть многие производители первого уровня, такие как NVIDIA. Кроме того, большая часть усовершенствованной серии упаковки InFO находится под упаковкой Apple.

Вы сказали аутсорсинг? Низкотехнологичный процесс — это хорошо, но без TSMC основной технологии все равно недостаточно, а другие фабрики по производству упаковки могут только есть суп.

Недавно, в ответ на временные потребности, TSMC приняла метод аутсорсинга и субподряда части ОС (на подложке), но это не аутсорсинг процесса CoWoS.TSMC по-прежнему фокусируется на наиболее ценной усовершенствованной части упаковки.

TSMC добилась универсальной упаковки от литья подложек Google TPU, Nvidia GPU и AMD MI300, которые имеют импортных производителей чипов для генеративного ИИ, предоставили TSMC большое количество заказов AIGC, стимулируя спрос на расширение CoWoS.

Во-вторых, этот тип современной упаковки также потребляет соответствующие мощности по производству упаковки, которых в настоящее время не хватает.

С одной стороны, усовершенствованная упаковка развивается в сторону предшествующей области обработки пластин, то есть упаковки на уровне пластины, которая вмещает больше контактов на меньшей площади упаковки, а с другой стороны, она расширяется в сторону области последующих модулей и развивается. система в комплекте. Недавно @手机chip达人 обнаружил, что процесс CoWoS разделен на промежуточный процесс для переднего плана пластины и многослойный кристалл для конечной упаковки.Нехватка производственных мощностей CoWoS у TSMC связана отсутствие 65нм интерпозера.

В качестве интерпозера используется технология Wafer (wafer).Например, решение TSMC CoWoS для упаковки представляет собой технологию упаковки 2.5D, которая упаковывает чип в кремниевый интерпозер (interposer) и использует пластину высокой плотности на кремниевом интерпозере. Проводка используется для соединения, а затем монтируется на подложку корпуса.

Следовательно, GPU требует дополнительных пластин в расширенном процессе упаковки, то есть мощности CoWoS. Иностранный капитал Nomura Securities ожидает, что производственные мощности CoWoS TSMC в годовом исчислении увеличатся с 70 000 до 80 000 пластин к концу 2022 года до 140 000–150 000 пластин к концу 2023 года. К концу 2024 года будет оспорено 200 000 пластин.

Заполнение пробела в упаковочных мощностях на уровне вафель стало главным приоритетом. Более того, с непрерывным развитием технологии пластин площадь пластин постепенно увеличивается.По сравнению с InFO, CoWoS для рынка high-end имеет относительно большое количество соединений и размер корпуса. По словам @手机chip达人, спрос на 65-нм промежуточный процессор в 1,4 раза выше, чем на топовый кристалл (H100).

Усовершенствованные мощности по производству упаковки CoWoS TSMC испытывают серьезный дефицит: с прошлого года спрос на CoWoS TSMC почти удвоился, и в следующем году спрос останется высоким. Усовершенствованная упаковка может производиться только на заводе TSMC в Тайване, и TSMC напрямую развертывает и расширяет производство на каждой фабрике, чтобы ускорить процесс усовершенствованной упаковки.

«Нехватка видеокарты» сгорела на сервере: настоящий пожар или ложный пожар?

Для покупателей, которым это действительно нужно, использование такой высококачественной видеокарты в основном используется для серверов ИИ, в которых отсутствует карта, модуль или полная машина. ** Но по реальным потребностям "БРИК" фактически уступает серверам. **

Графическим процессорам для ИИ не хватает роста цен, а цены на оснащенные ими серверы растут.Еще в апреле сообщалось, что Inspur повысит цены на ИИ-серверы примерно на 20%.Это после того, как Nvidia прекратила поставки его лучшие чипы A100 и H100 для решения Китая. Последующие источники подтвердили, что повышение не уточнялось.Другой источник сообщил, что поставщик серверов только повысил цену на AI-серверы Nvidia, а цены на другие серверные продукты не изменились.

Согласно данным Pacific Securities, в 2022 году на 8 лучших серверных расходных материалов на китайском рынке серверов ИИ будет приходиться 92%, а Inspur возглавит список с 37%. Раскрытие финансовой информации Inspur показывает, что Nvidia была ее основным поставщиком чипов. В 2019 году Intel и Nvidia являются двумя ведущими поставщиками чипов для Inspur.

Одна карта GPU эквивалентна компоненту сервера. Спрос на одну карту более чувствителен к цене. Сервер должен использовать несколько модулей GPU, максимум 8 карт. Даже PCle-версия сервера в настоящее время стоит около 800 000 юаней, а версия NV составляет 100 000 юаней.миллионный уровень.

В настоящее время фьючерсная цена A800 составляет более 1,2 млн юаней, а спотовая цена относительно невелика.По словам продавца известного поставщика вычислительных услуг, спотовая цена машины A800 составляет 1,68 млн юаней, а депозит составляет 50%. "На конец июля в наличии 35 шт. Заказано 25 шт." Даже для коммерческого использования цена не из дешевых. Более того, согласно новостям рынка, нормальный срок поставки машины А800 запланирован до конца октября, и даже многие продавцы прямо сообщают о 24 неделях, а срок поставки приближается к 6 месяцам.

В глазах некоторых друзей, занимающихся всем серверным бизнесом, как бы ни был популярен GPU, он не так близок к реальному спросу, как сервер, и с ним проще вести дела. Брат Сюй сказал, что сейчас он сосредоточен на серверах, и его не интересуют отдельные карты. Продажа серверов заключается в отправке конфигураций клиентам перед котировкой. Карты доставляют больше хлопот, и это зависит от совместимости интерфейса... Вкратце , сервер относительно дешевый, если честно больше транзакций и большая текучка. А по карте просто много запросов, объем транзакций маловат, много просят только крупные компании. «Те, что требуют больше, — почти все на всю машину, а те, что в малом количестве, — все карты».

В широком спектре потребностей клиентов не все серверы ИИ являются первоклассными, когда они появляются, и когда они появляются, возникает много требований. Будь то сервер A800 PCIE, сервер NVlinvk или сервер H800 HGX и т. д., предприятия выбирают конфигурации в соответствии с различными потребностями. Конечно, цена сервера будет более прозрачной, и возможностей для сравнения цен будет больше.

Графические процессоры и жесткие диски являются одним из аксессуаров серверов.Теперь, когда искусственный интеллект стал популярным на связанных серверах, высокопроизводительные графические процессоры, такие как A800, имеют высокую стоимость и являются дефицитными.Среди полных машин их ценовая чувствительность тоже на передовой.

** Одна только нехватка графических процессоров ограничивает нормальную поставку серверов ИИ, которые кажутся популярными на рынке, но к которым предъявляются более ложные требования. **

Эта волна GPU-лихорадки напоминает 2020 год, когда люди лихорадочно спекулировали на бизнесе термопистолета для лба, В то время эффект деления круга друзей привел к ложному спросу на рынке, который был бесконечно больше, чем реальный требовать. В результате предложение находится в дефиците, спотовая цена намного выше цены фьючерса, срок поставки не гарантирован, а издержки продавца по умолчанию низки.

Дни крайней нехватки чипов подошли к концу.Хотя производственные мощности высокопроизводительных графических процессоров будут недоступны в течение некоторого времени, соответствующие барьеры спроса на уровне предприятия относительно высоки, требуя официальной технической поддержки и послепродажного обслуживания в сочетании с резкое увеличение спроса, все это предлагается всем.Без долгосрочной напряженной работы и прочного фундамента трудно получить долю тренда, полагаясь только на оппортунистические средства.

Посмотреть Оригинал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить