AI戦争の「食料と草」を奪い、NvidiaのAIグラフィックスカードの価格が高騰

原文:芯世相

画像ソース: Unbounded AI によって生成

マイニングの時代から AI の時代に、GPU のコンピューティング能力が再び活躍するようになりました。国内外のクラウドベンダー間のコンピューティングパワー余力競争が本格化している...

Byte は Nvidia から A100 および H800 アクセラレータ カード 100,000 枚を購入し、その額は 10 億米ドル (70 億人民元以上) を超えており、今年の Byte の購入額だけでも、昨年 Nvidia が中国で販売した商用 GPU の総売上高に近いです。 , 別の大手企業の受注額は少なくとも10億元以上。

OpenAIはすでに約2万5000基のNvidia GPUを使用しているが、依然としてGPUが不足していると述べている。 ChatGPT はアクティブ ユーザー 1 億人ごとに 13.5 EPLOPS のコンピューティング能力を必要とし、約 69,000 台の NVIDIA DGX A100 80G サーバーによってサポートされており、現在の世界的なコンピューティング能力では毎日平均 1 億人のオンライン ユーザーしかサポートできません。

これらのハイエンド GPU のスポット流通市場では、半分の素人でも機会があれば試してみたいと考えており、その目は「金のレンガ」でいっぱいです。

**当初約74,000元だったA800は現在85,000元以上に値上がりしており、上位版は約100,000元まで値上がりしています。 ** 4月末時点で、市場に出回っている8カードA800モジュールの先物価格はまだ90万元、納期は2週間だったが、現在では価格は100万元を超え、納期も長くなっている。 7〜8週間に延長されました。 5月にはA800の価格が10万元に達したこともあった。

「副業者にとっては納期が長く、価格も高くなります。」 カードが 1 枚足りない人はモジュールを購入し、モジュールを購入できなかった人は後でサーバー全体を購入しました。

GPU シングルカードからモジュール、AI サーバーに至るまで、価格高騰は異常で、品不足は深刻で、納期はますます長くなっていますが、市場の需要は本当に高いのでしょうか?なぜ Nvidia の GPU はこんなに短いのでしょうか?さらに、新品正規品は納期保証なし、中古市場、グレーチャネル、入金後の保証金は返金されないなど、AIサーバーを巡る混乱が繰り広げられています…。

NVIDIA GPU 市場の混乱

「一度に1,000枚も3,000枚もチケットが必要なのですが、まったく供給できません。ここでの需要は本物ですか、それとも偽物ですか?」

「市場は大丈夫ですか?商品を手に入れる方法はありますが、潰れるのではないかと心配です。」

** 5 月の時点でも、Nvidia の GPU はまだ在庫切れで価格が高騰していました。 **

代理店によると、NVIDIA A100の価格は昨年12月から上昇し始め、今年4月前半時点で5カ月間の累計価格上昇率は37.5%、A800の累計価格上昇率は20.0%に達したという。同じ時期。

リードタイムは1か月から3か月以上に延びており、一部の新規注文は「12月まで納品されない可能性がある」という。

AIサーバーで量的優位性を持つメーカーの中には、力を入れながらGPUリソースを利用するメーカーもある。 Microsoftは社内でAIサーバーのハードウェア不足というジレンマに陥り、「クォータ供給」の仕組みを採用した。 6月には、削除されたOpenAI CEOのサム・アルトマン氏の講演議事録の中で、Open AIにもGPUが不足しており、GPU不足により顧客の多くの短期計画が遅れていると言及されていた。

人工知能の波に乗って、「ショベルの売り手」である Nvidia は、AI サーバー チップ市場全体をほぼ独占し、最大の勝者となりました。つい最近、その市場価値は数兆ドルを超え、歴史上初のチップ企業となりました。市場価値は1兆米ドルを超えます。

米国の禁止の影響を受け、私の国では Nvidia A100 のスポット供給が直接途絶えました。中国には AI 大型モデルのトレーニングに使用できる A100 が約 40,000 ~ 50,000 台あります。供給は非常に逼迫しています。内部使用は厳密に制限されています限定。

しかし、現在通常供給されているA100の去勢版であるA800は、昨年第3四半期に生産を開始したばかりで、新たな需要の増加と相まって供給不足に直面している。中国では10万元まで。

一般的に、メディアで報道される高価な A800 や A100 などは、このシリーズの最上位構成、つまり GPU メモリが 80G で、相互接続技術が NVLink のバージョンをサポートしているものに属します。

市場の GPU ビジネスに携わる友人は、スポット市場での A800 の価格は毎日変化しており、短期的な為替レートの変動も価格に影響を与えるだろうと語っていました。最低オファーは 86,000 まで上昇している可能性があります。」

不足と価格高騰が深刻化するにつれ、GPU を出荷したり探したりする参加者がますます増え、GPU 市場の混乱が始まりました。問い合わせの殺到、先物市場の人気と高額な預金、中古チャネルからの流出などです。 "ピット"...

最も直接的な印象は、あらゆる方向からの騒々しい需要です。サーバー マシンやサーバー GPU に関連する多くの市場関係者は、最近 AI の普及により、多くの人がカードや価格について問い合わせに来ますが、実際に作成できる人は多くない、と報告しています。お得。

A800やA100のようなシングルカードを探しに来ました。需要は少なく、価格も気に入っていますが、需要は大きく、数百枚のカードが必要です。私は顧客や友人を助けていると言いました、そして華強北のトレーダーは値段設定をしているような気がします。

「そんなにたくさんあるのに、どうやって供給すればいいのでしょう?価格の優位性を重視しているのか、納期の優位性を重視しているのか尋ねても、それ以上の情報はありません。」質問すると消えます。」購入の簡単な取引。

現在、Nvidia などのエンタープライズ レベルの GPU の供給には、主に 2 つの流通チャネルがあり、1 つは純正工場 - 一般代理店 - ディーラー - マーケット、もう 1 つは純正工場 - OEM 工場 (サーバー メーカー) - ディーラー -市場。スポット市場で流通するものは主に流通、サーバーソリューション、中古市場などです。

このようなエンタープライズ レベルの製品は、企業、学校、サーバー ソリューション プロバイダーなどの下流顧客をカバーします。サーバー事業に注力しているシュー兄弟は、アリババや他の企業からの本当の需要は通常大量注文であり、これらの大口顧客は商品を入手するために上位レベルの総代理店やサーバーOEMを見つけることが優先されると述べた。下位レベルは小規模であり、再販業者やサーバー部品のサプライヤーを見つけるのは困難です。 ByteやAliなどの大手企業は主にNVIDIAの本家工場と直接交渉して調達しており、代理店や中古市場では膨大なニーズに応えるのが難しいとクラウドベンダー側が主張しているとのメディア報道もある。

スポット市場に実需がないからといって、誰もが商品を探すことを妨げるものではありません。スポット商品が売り切れた場合、先物予約をしなければなりません。返金できない高額な手付金を負担する必要があり、納期が遠い場合もあります。あちらへ。

A800 カードはまだ市場に在庫があり、A100 カードはほぼ「消滅」しており、A800 モジュールの在庫はほとんどないため、先物を選択する必要があることが理解されています。 8 カード A800 モジュールを例に挙げると、売主は総額 112 万、手付金 50%、納期 7 ~ 8 週間を見積もりました。納期厳守の保証はありません (納期)。数日前にはまだ6週間でした)、デポジットは返金されません。 4 月末の時点で、別の販売者の 8 カード A800 モジュールの価格はまだ 900,000 で、内金は 30% ~ 50%、納期は 2 週間でした。

1 か月以上経つと、8 カード A800 モジュールの価格差は 20 万元以上となり、納期が延長され、デポジットも増加する可能性があります。

供給工場を名乗る販売者は、8枚カードモジュールを求める購入者はすでに5億元に相当する注文を行っており、現在は到着通知を待つしかない、と語った。

デポジットを支払うと早くから並ぶことができそうですが、高いリスクが共存します。 8 カード A800 モジュールを例に取ると、通常、50% のデポジットが請求されます。最上位の 80G NV A800 モジュールは 100 万以上で、デポジットは少なくとも 500,000 で、デポジットが完了すると、支払い済みの場合、返金不可です。インターネット上の購入者は、今年3月と4月に注文したシングルカード10枚がまだ商品を受け取っていないと述べた。

多くの売り手によって約束されている納期は保証されておらず、基本価格は高く、デポジット率も高いため、実際に支払わなければならない金額は高くなります。商品が届かない場合は、お金を支払った後は待つしかありません。

** A800 および A100 の在庫がある場合、誰の目にもそれらは普通のグラフィックス カードではなく、金塊に見えます。 **

熱気を見てGPU事業をやりたいと思っているが、商品が自分の手に渡ってしまうのではないかと心配している人もいるし、利益を追求する個人投機家にとっては実需は疑わしいし、価格は高すぎてロウソクの価値もない。

中古品が後を絶たず、中古のAIチップを高値でリサイクルする人もいるが、この手のGPUはどこで使うかどころか、保証も問題だ。

上流の生産能力の急務: 高度な製造プロセスは不足していませんが、問題はどこにありますか?

ChatGPT が普及してから、インターネット企業やクラウド ベンダーは、Nvidia GPU の大きなコンピューティング能力を争うために、より広範囲に大規模な AI モデルを展開していますが、A100 や A800 だけでなく、上位の H100 や H800 にも不足しているのです。ウエハーの生産能力が不足しているわけではないのに、なぜ GPU を供給できないのかと尋ねた人がいます。

「GPU の性能は 10 年ごとに 1000 倍向上する」「買えば買うほど節約できる」フアンの法則がムーアの法則に取って代わります。高度な製造プロセスにより GPU の性能は向上しますが、ムーアの法則は終わりを迎えました。サーバーの目的は、携帯電話チップの厳しいスペース要件とは異なります。高度な製造が GPU の第一の選択肢である場合、高度なパッケージングはおまけです。

高度な製造プロセスで GPU を製造するだけでは十分ではなく、パッケージの小型化、低消費電力化、ピン数の削減、チップ間のより緊密な相互接続の実現など、現在のチップ製造プロセスの制約の下で GPU のパフォーマンスを向上させる大きな一歩となります。チップとパッケージ基板。高度なパッケージングの 4 つの魔法のバンプ、RDL、ウェーハ、TSV テクノロジーのいずれかを使用すると、新しいパッケージング スキルを発揮できます。

NvidiaのV100、A100、A800、H100などはいずれもTSMCのCoWoS先進パッケージング技術を採用しており、高い演算能力AIを背景としたチップの「ストレージと計算の統合」の問題を解決している。ただし、TSMCの7nmウェハファウンドリの能力は実際には不足していませんが、今回は不足分が依然としてTSMCに植え付けられています。

**まず第一に、CoWoS アドバンスト パッケージングのコア技術は TSMC のみが行うことができ、TSMC なしでは実現できません。 **

現在不足している高度なパッケージング ウェーハ、そのテクノロジーは TSMC の特許であり、NVIDIA はそれを実現できるのは TSMC だけであり、高度な製造プロセスと高度なパッケージングは TSMC によってしっかりと把握されています。 TSMC は 2012 年に独自の CoWoS 高度なパッケージング技術を発表し、それ以来ウェハーファウンドリから端末パッケージングまでのワンストップサービスを提供しています。 CoWoS ファミリには CoWoS-S や CoWoS-L/R などのパーツが含まれており、高速コンピューティング アプリケーションに対応する顧客には NVIDIA などの一流メーカーが多数含まれています。さらに、InFO アドバンスト パッケージ シリーズのほとんどは Apple のパッケージの下にあります。

アウトソーシングって言ってたっけ?ローテクプロセスは問題ありませんが、コア技術はTSMCなしではまだ不十分であり、他の包装工場はスープを食べることしかできません。

最近、一時的なニーズに対応して、TSMCはOS(基板上)の一部をアウトソーシングおよび下請けする方法を採用していますが、これはCoWoSプロセスのアウトソーシングではなく、TSMCは依然として最も価値のある高度なパッケージング部分に焦点を当てています。

TSMCはウェーハファウンドリからのワンストップパッケージングを実現しており、生成AIチップメーカーを輸入しているGoogle TPU、Nvidia GPU、AMD MI300はTSMCにAIGCの大量注文を提供しており、CoWoS拡大の需要を促進している。

第二に、このタイプの高度なパッケージングは、現在供給不足となっている対応するパッケージング生産能力も消費します。

高度なパッケージングは、一方では上流のウエハプロセス分野、すなわちより小さな実装面積でより多くのピンを収容するウエハレベルパッケージングに向けて発展しており、他方では下流のモジュール分野に拡大して発展しています。システムインパッケージ。最近@手机chip达人は、CoWoSプロセスがフロントエンドのウェハプロセスのインターポーザと、バックエンドのパッケージングのダイツーダイ積層ダイに分割されていることを明らかにしました。TSMCのCoWoS生産能力の不足は、 65nmインターポーザーがないこと。

ここでのインターポーザー(インターポーザー)にはWafer(ウェハー)技術が採用されており、例えばTSMCのCoWoSパッケージング技術ソリューションは、チップをシリコンインターポーザー(インターポーザー)にパッケージングし、シリコンインターポーザー上の高密度ウェハーを使用する2.5Dパッケージング技術です。配線を使用して相互接続し、パッケージ基板に実装します。

したがって、GPU は高度なパッケージング プロセス、つまり CoWoS の容量で追加のウェーハを必要とします。外資系の野村證券は、TSMCのCoWoSの年間生産能力が2022年末までに7万枚から8万枚、2023年末までに14万枚から15万枚に増加すると予想している。 2024年末までに20万枚のウェーハが挑戦される予定です。

ウェーハレベルのパッケージング能力のギャップを埋めることが最優先事項となっています。また、ウェハ技術の継続的な発展に伴いウェハ面積は徐々に拡大しており、ハイエンド市場向けのCoWoSはInFOに比べて接続数やパッケージサイズが比較的大きくなっています。 @手机chip达人によると、65nmインターポーザーの需要はトップダイ(H100)の1.4倍だそうです。

TSMC の先進的な CoWoS パッケージングの生産能力は深刻な不足に陥っており、昨年以来、TSMC の CoWoS 需要はほぼ 2 倍に増加しており、来年も需要は引き続き旺盛であると予想されます。高度なパッケージングはTSMCの台湾工場でのみ行うことができ、TSMCは高度なパッケージングプロセスの進歩を加速するために各工場に直接展開および拡張しています。

「グラフィックカード不足」でサーバーが焼き付けられたのは本当の火災ですか、それとも誤った火災ですか?

本当に必要とする購入者にとって、このようなハイエンドのグラフィックス カードの使用は、カード、モジュール、または完全なマシンのいずれかが欠けている場合、基本的に AI サーバーに使用されます。 ** しかし、実際のニーズという点では、「BRICs」はサーバーに劣ります。 **

AI用GPUは値上げ不足で、それを搭載したサーバーの価格が上昇しており、NVIDIAが供給を終了したことを受けて、InspurがAIサーバーの価格を約20%値上げすると4月の時点で報じられていた。最上位の A100 および H100 チップを中国に決定。その後の関係筋は、値上げは明記されていないことを確認しており、別の関係筋は、サーバーサプライヤーが値上げしたのはNvidia AIサーバーのみで、他のサーバー製品の価格は変更していないと述べた。

パシフィック証券のデータによると、2022年には中国のAIサーバー市場ではサーバー消耗品上位8製品が92%を占め、Inspurが37%でトップになる見通しだ。 Inspur の財務情報開示は、Nvidia が同社の主要なチップサプライヤーであることを示しています。 2019 年、Intel と Nvidia が Inspur のチップサプライヤーのトップ 2 となっています。

1 枚の GPU カードはサーバーのコンポーネントに相当します。1 枚のカードの需要は価格に左右されます。サーバーは最大 8 枚のカードを備えた複数の GPU モジュールを使用する必要があります。現在、PCle バージョンのサーバーでもコストがかかります。価格は約80万元、NV版は10万元、百万台。

現在、A800の先物価格は120万元以上で、スポット価格は比較的小さいが、有名コンピューティングサービスプロバイダーの営業担当者によると、A800マシンのスポット価格は168万元、保証金は168万元だという。 「7月末時点で35台あります。25台注文済みです。」業務用としても価格は安くありません。さらに、市場ニュースによると、A800マシンの通常納期は10月末まで予定されており、多くの売り手でも24週間を直接報告しており、納期は6か月近くとなっている。

サーバー ビジネス全体に携わっている一部の友人の目には、GPU がどれほど人気があるとしても、サーバーほど実需に近くなく、ビジネスを行うのが簡単です。 Xu 兄弟は、「現在はサーバーに注力しており、単一のカードには興味がありません。サーバーを販売するということは、見積もりの前に構成を顧客に送信することです。カードの場合はさらに面倒で、インターフェースが互換性があるかどうかによって決まります。つまり、」 、サーバーは比較的安価ですが、正直なところ、トランザクション数が多く、回転率が高いです。そして、このカードは問い合わせが多いだけで、取引量は少なすぎ、大企業だけが多くを要求します。多めに必要なものはほぼ機体全体分、少ないものは全てカードです。

顧客の幅広いニーズの中で、すべての AI サーバーが登場時点で最高級であるわけではなく、登場する時点では多くの需要があります。 A800 PCIE サーバー、NVlinvk サーバー、H800 HGX サーバーなど、企業はさまざまなニーズに応じて構成を選択します。もちろん、サーバーの価格はより透明になり、価格比較の機会も増えます。

サーバーの付属品の一つであるGPUとハードディスクですが、関連サーバーにAIが普及した現在、A800などのハイエンドGPUはコストが高く、品薄状態となっており、完成機の中でも価格感度は非常に高いです。それも最前線で。

**GPU の不足だけでも、市場で人気があるように見える AI サーバーの通常の供給が制限されていますが、さらに誤った需要が混在しています。 **

この GPU ブームの波は、人々が額温度銃ビジネスに熱狂した 2020 年を彷彿とさせますが、当時は友人の輪の分裂効果により、市場に実際の需要よりも無限に大きい誤った需要が発生しました。その結果、供給が不足し、スポット価格は先物価格よりもはるかに高くなり、納期は保証されず、売り手のデフォルトコストは低くなります。

極度のチップ不足の時代は終わりました。ハイエンド GPU の生産能力はしばらく利用できませんが、それに対応するエンタープライズ レベルの需要障壁は比較的高く、正式な技術サポートとアフターサービスが必要です。長期にわたる努力と強固な基盤がなければ、日和見的な手段だけに頼ってトレンドのシェアを獲得することは困難です。

原文表示
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)