原発に賭けろ! Microsoft は大型モデルに新しい「弾薬」を供給することを決意しています。

出典丨51CTO テクノロジー スタック

執筆:ユン・チャオ

Microsoft は野心的で、Windows 11 が完全に AI 対応になった同日に、新たな動きを行ったことが明らかになりました。

Microsoftは現地時間9月25日、突然公式サイトに「原子力技術チーフプロジェクトマネージャー」の募集メッセージを掲載した。 Microsoft Cloud 以降、Nadella が大規模モデルを扱う際に強力な威力を発揮することは容易にわかります。

しかし、驚くべきことは、GPT4 への「Office Family Bucket」アクセス、クラウド リソースを提供する Azure、そして最近の包括的な AI ベースの Windows 11 に至るまで、まさに新しい Microsoft が出現しようとしているときに、なぜ Microsoft はエネルギー部門?どこから始めればよいでしょうか?

人工知能と原子力、マイクロソフトはどれも手放しません!

Microsoftが募集している「核技術担当主任プログラムマネージャー」のポジションは、MicrosoftのクラウドとAIが配置されているデータセンターに電力を供給するための世界的な小型モジュラーリアクター(SMR)とマイクロリアクターの統合の技術評価を主導する任務を負っている。 「このポジションでは、テクノロジー統合のための明確で適応可能なロードマップを維持し、テクノロジーパートナーとソリューションを慎重に選択および管理し、進捗状況と実装のビジネスへの影響を継続的に評価します。」と求人情報には記載されています。

出典: マイクロソフト

さらに、Microsoft はこのポジションに最適な候補者に対する要件も設けています。エネルギー業界での経験があり、原子力技術と規制問題について深い理解を持っている必要があります。このポジションは、他の商用化前のエネルギー技術の研究開発も担当します。

テスラの大型モデルが「なくなる」!

有名な業界専門家であるウー ジュン氏は、かつて ChatGPT トレーニングの比喩を述べました。ChatGPT の各トレーニングは、3,000 台のテスラ電気自動車が 21 年間の旅を 1 か月で完了できるのに相当し、基本的にはすべて役に立ちません。この説明は誇張ではありません。

スタンフォード人工知能研究所(HAI)が発表した「2023年人工知能指数報告書」によると、GPT3の訓練に必要な能力は、平均的なアメリカの家庭を数百年生き抜くのに十分だという。国盛証券の試算によると、GPT-3 の 1 回のトレーニング費用は 140 万ドルにもなり、一部のより大きな LLM (大規模言語モデル) の場合、トレーニング費用は 200 万ドルから 1,200 万ドルの間になります。

データソース:Luccioni et al.

「大規模モデルのトレーニングコストの60%は電力です。」ファーウェイAIのチーフサイエンティストであるTian Qi氏も、コスト削減と電力効率の向上が急務であると考え、電力問題について懸念を表明しました。大型モデルが普及し、サーバーが世界中で急速に稼動すれば、地球は燃えないのではないかと思います。

OpenAIの創設者が月曜日のイベントで、GPTにとって今の焦点はGPT-5の発売を急ぐのではなく「コストの削減と信頼性の向上」にあると述べたのも不思議ではない。

電力を節約するために、シリコンバレーの幹部たちは大きなことを考えています

まずマイクロソフトについて見てみましょう。現在、マイクロソフトは原子力エネルギーに目を向けています。ご存知ないかもしれませんが、ビル・ゲイツには別のアイデンティティもあります。それは、小型モジュール式原子炉の設計を開発および推進している原子力イノベーション企業テラパワーの会長です。しかし、テラパワーの広報担当者は「現時点では原子炉をマイクロソフトに売却する合意はない」と述べた。

米国エネルギー情報局によると、米国の既存の原子炉は現在、米国の総発電量の約 18% を発電しています。次世代の原子炉技術への期待は主に小型原子炉にかかっています。

名前が示すように、小型原子炉は従来の原子炉よりも小さく、モジュール構造で設計されており、原子炉のすべての部品をカスタムメイドする必要がないため、より安価かつ迅速に建設できます。

さらに、マイクロソフトは、核融合分野のイノベーターによる原子力の追求を公約しています。マイクロソフトは今年5月、核融合スタートアップのHelionと2028年に電力を購入する電力購入契約を締結したと発表した。偶然にも、OpenAI CEO の Sam Altman も Helion への初期の重要な投資家でした。

また、「シリコンバレーの鉄人」として有名なマスク氏もエネルギーについて考えていました。 4月にはマスク氏とベゾス氏が協力して超大型モデルを訓練する準備をしているという噂が流れた。冷凍とエネルギー消費を節約するために、二人は実際に「宇宙データセンター」計画を提案しました。これは、SpaceX によって 50,000 枚の H100 NVIDIA カードを宇宙に送り、膨大な量のソーラー パネルを搭載し、宇宙の力を利用して問題を解決することを期待していました。電気の問題 問題。しかし、一部の専門家は、このソリューションは信頼性に欠けると分析しており、現在、衛星ソーラーパネルの電力供給システムは一般的に1200Wしか出力できず、電力供給とコストの両方が地上のソリューションに及ばない。

もちろん、チップ自体のエネルギー消費を最適化するという、より信頼性の高い別の解決策もあります。この種のエネルギー消費管理のロジックは、データセンター内に複数のチップがあり、各チップには数十億、場合によっては数百億のトランジスタがあり、1 つのトランジスタが電力消費の 1 単位に相当するというものです。チップは大規模なエネルギーネットワークであると推測されます。各トランジスタのエネルギー消費を最適化できれば、最終的なエネルギー節約はデータセンター全体に波及します。

世界をリードする EDA 企業である Synopsys は、この分野をさらに研究しており、7 年前にはチップのエネルギー効率を最大化するための「エネルギー効率設計」と呼ばれるプロジェクトを立ち上げました。

Microsoft さん、エネルギー消費の問題を解決したいだけですか?

Microsoft の動きは、AI とデータセンターのパワーの源への賭けだけではなく、他の理由もあります。

海外メディアtheVergeによると、原子力は温室効果ガスを排出せず、気候変動との戦いに一定の役割を果たす可能性があるため、ビル・ゲイツは常に原子力エネルギーの忠実なファンだったという。

さらに、大型モデルのエネルギー消費の問題は想像されているほど深刻ではありません。ある上級アナリストは、市場は大型モデルのエネルギー消費についてあまり心配する必要はない、と率直に語った。 「多くの人は、大規模モデルの計算能力の需要が将来的に必然的に徐々に減少するという事実を無視しています。これは、エネルギー消費もそれに応じて減少することを意味します。」

たとえば、4 月 12 日に公開された Microsoft のオープンソース DeepSpeed-Chat はこの点を完全に示しており、トレーニング速度を 15 倍以上向上させ、コンピューティング能力のコストを大幅に削減できます。単一の GPU だけで 130 億のパラメータを持つ ChatGPT のようなモデルをサポートでき、トレーニング時間はわずか 1.25 時間です。

最後に言えることは、一度変化の歯車が動き始めると、逆転するのは難しいということです。今回のマイクロソフトのAIへの投資は業界の想像を超えている。

参考リンク:

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)