大きなモデルには実行者が必要です

原作: 呉先志・文葉豪

編集者: ワン・パン

出典: フォトンプラネット

画像ソース: Unbounded AI によって生成‌

かつて国内大型模型戦争は多くの疑惑に包まれていた。 JD.comとTencentが相次いで議席を獲得し、この複雑なゲームがより明確になりつつある。

Baidu と Ali は、中国における大規模模型プレーヤーの最初のグループとして、「有利なスタートを切り」ながら初期のトラフィックを獲得しました。対照的に、Tencent と JD.com は少し遅れてスタートしましたが、大規模なモデルトラックをより深く調査して業界への理解を深めています。

このため、比較的遅れて大型モデルを発売した一部の大手メーカーは世間の世に追随せず、汎用大型モデルの潮流に乗って投資を行った。例えば、ファーウェイの大型モデルは以前実用性について言及しましたが、JD.comは業界とサプライチェーンでの深い蓄積により、より先見の明があり、よりターゲットを絞った道を選択しました。業界向けの JD Yanxi モデルが発売されました。

現在の汎用大型モデルの時代において、JD.comが開始した延西大型モデルとその産業価値創造の道は、大型モデルのビジネス秩序を確立する優れた試みであるだけでなく、業界全体に新しい考え方と方向性をもたらします。大型モデルの実用化が停滞する中、上陸が近づいている産業用大型モデルは、今後の大型モデル競争をリードし、無視できない新勢力となる可能性が高い。

「物語」でも「おもちゃ」でもない大型模型

技術継承の波は必ず多くの堆積物を運びます。

チップ、ロボット、初期の AI に至るまで、どの波にも常に下心を持つプレイヤーが混在し、テクノロジーとマーケティングが混ざり合い、もともと明確だった軌道がさらに濁っていきます。現段階では国内の大型模型線路も同様です。

トラックの一方では、プレーヤーは大型モデルの技術的背景を見つけ出し、着地する方向を見つけようと苦労していますが、他方では、テクノロジー分野とは何の関係もない企業さえもフィールドから離れています。いわゆる「ビッグモデル」製品――現在の「すべてがビッグモデルになり得る」という状況が、2年前の「すべてがメタバースになり得る」という意味を持っていることは認めざるを得ない。

明らかに、いわゆる「ビッグ モデル」が同義語となり、実際の価値を生み出すのではなく、それ自体が「ストーリーテリング」の魅力に貢献する場合、それはメタバースの運命に向かうしかない可能性が高くなります。そしてこれは、テクノロジーを誠実に勉強するプレイヤーにも当てはまります。結局のところ、テクノロジー自体が価値を直接生み出すことは困難です。大規模モデルの目的は、一般的な大規模モデル自体をトレーニングすることではなく、テクノロジーに価値を生み出し、成熟した商用化を実現することです。

したがって、追いかけるファンの一見面白い操作は、実際には大型模型トラックへの警鐘を鳴らしました。結局のところ、AIGC を引き起こした ChatGPT は、大型モデルに対するプレイヤーの見方に微妙な影響を及ぼし、多くのプレイヤーが一般的な大型モデルに殺到し、ChatGPT のさまざまな「亜種」を起動する原因となっています。

客観的に言えば、汎用大型モデルには価値があるが、競争の側面がますます激化している現在、汎用大型モデルはスムーズではない。

一方で、一つのフィールドに次々とプレイヤーが群がり、「車輪の繰り返し製造」の状況に陥る可能性が高く、国内外のプレイヤーがひしめく戦場から抜け出すことが困難であることも考えられます。テクノロジーの巨人。

一方、汎用大型モデルは消費と支払いの分離の典型的な商品であり、気をつけないと「おもちゃ」になってしまいます。

簡単な例を挙げると、幅広い C エンド ユーザーが宇宙や空について質問したり議論したりすることがありますが、大多数の一般ユーザーは実際には生産性を要求していません。新しいテクノロジーの新鮮さをすぐに感じられますが、失われ、長期間使用できない可能性があります。

このことから、現状の汎用大規模モデルは、一部のコンテンツ業界や組織内でのコスト削減や効率化を除けば、コンテンツ制作の効率化をある程度向上させることはできても、まだ成熟したモデルとはなっていない。再現可能なビジネスモデル。一般的な大型モデルのトラックがますます混雑するにつれて、プレイヤーは商業的拡張の観点から多くの課題に直面することになることが予想されます。

結局のところ、「シンギュラリティ」が到来した今、大型モデルは技術継承のマイルストーンであるだけでなく、未来を形作る重要な原動力でもあるのです。この論理に従えば、現段階の大規模模型戦争は決して短距離レースではなく、組織的なプロジェクトであることになる。プレイヤーがサイクルを経て最後まで到達したい場合、技術レベルの単一のブレークスルーポイントだけに頼ることはできず、技術的な方向性、シーンのアプリケーション、ビジネスモデルなどの多くの側面を同時に考える必要があります。 。

産業用大型模型、「百模型戦争」の新戦線

「ディープ・ブルー」がチェスの名手ガルリ・カスパロフを破った1997年から、囲碁界に参入した「アルファ碁」、そしてビジュアルシステムAIや自動運転に至るまで、AIは過去に何度もエキサイティングな進化を経験してきました。アプリケーション爆発寸前ですが、枝いっぱいの花芽が長い間開花できませんでした。

その主な理由は、テクノロジーがまだ業界で深く応用されていないためであり、結局のところ、テクノロジーの進歩の終着点は実験室に閉じ込められるのではなく、「現実世界」への飛び込みにあるのです。

この論理に従って、今日の汎用大型モデルトラックを見ると、実際のビジネスシナリオに根付き、真の価値を生み出すまでには、まだ長い道のりがあります。

京東グループの徐蘭最高経営責任者(CEO)はJDDカンファレンスで、「大型モデル自体は目的ではなく、産業上の価値を実現するためのツールである。大型モデルの真の価値は産業用途で実現されなければならない」と述べた。

言い換えれば、大きなモデルがゴールではなく、アプリケーションがゴールなのです。

現在の大型モデルのメーカーは、モデル パラメータを大型モデルの品質のテスト基準と見なすことがよくあります。誰もが知っているように、商用実装レベルでは、パラメータが膨大であるためコストも高く、対応時間が長い、同時実行性が低いなどの問題もあります。

簡単な例を挙げると、質問に答えるのに2~3セントかかり、5~10秒待たなければならない「パラメータモンスター」もあり、どんなに正解しても大規模な商品化は難しい。また、現行の汎用大型モデルの精度率は85%程度で、一般ユーザーにとっては十分かもしれないが、本格的なビジネスシーンではこの誤差がビジネスに無視できない影響を与える可能性がある。

アプリケーションの問題に関して、JD.comのいくつかの事業分野の技術リーダーは、GPTの捏造された回答を人々は笑うだろうが、実際のアプリケーションプロセスに実装されると、逸脱は巨額の損失につながるだろうと述べた。

JD Exploration Research Institute の所長であり、JD Technology のインテリジェント サービスおよび製品部門の社長でもある He Xiaodong 博士は、かつて個人的に経験したことがありますが、これは非常に代表的なものです。 「大規模なモデルは 143 の平方根を答えます。与えられた答えは 11.5 (実際にはほぼ 11.96 に等しい) です。実際のアプリケーション シナリオで使用すると、この答えは多大な損失をもたらすことになります。」

技術分野ではモデルのパラメータや精度が重要ですが、ビジネスの世界では大規模なモデル自体が使いやすく安定していることが重要です。この点で、細分化された産業と密接に関係する産業モデルには、間違いなく当然の利点があります。

しかし、大規模な産業モデルを開発することは容易ではありません。ご存知のとおり、トレーニング データは大規模モデル学習の基礎であり、大規模モデルの汎化能力と適用シナリオも決定します。したがって、大規模な産業モデルの開発には、技術レベルでの画期的な進歩に加えて、業界からの直接のシナリオとデータも同様に重要です。

JD.com を例に挙げると、同社が業界向けに大規模モデルを投入した理由は、その強力な産業遺伝子によるところが大きい。やはり、国内大手メーカーの中でも、消費者市場とサプライチェーンの両端を結ぶ京東は、同業界とのつながりが強く、質の高いデータを大量に保有している。

Yanxi の大規模モデルがトレーニングされると、デジタル インテリジェンス サプライ チェーンの一般データの 70% と元のデータの 30% が統合されると報告されています。 JD.comが純粋にパラメータを強調するのではなく、また意図的に「ストーリー」を伝えるのではなく、「チューニング」レベルに焦点を当て、業界と高度に統合された大型モデルの作成を目指していることがわかります。

大型工業モデルは、大型モデルトラックの大規模商品化に向けた重要なステップとなる可能性があり、徐々にロジックを理解したプレイヤーが徐々に乗り始めています。

最近では、長らく足を引っ張っていたTencentが独自の大規模インダストリーモデルをリリースし、汎用大規模モデルの旗を掲げるBaiduも交通をカバーする大規模インダストリーモデルをリリースした。 、エネルギーおよびその他の分野。巨大企業の規模が拡大するにつれ、実用化に近づいた大型工業モデルが「百模型戦争」の新たな戦線となっているのは無理もない。

細い道で出会って「景色」を掴んだ者勝ち

汎用モデルであれ、産業モデルであれ、新たなビジネスオーダーの構築には「シーン」を避けて通れません。

つまり、実装においては、難解な専門用語も、まばゆいばかりの商用 PPT も空中の城であり、大型モデルの能力を真に現場に適用し、実際の価値を生み出してこそ、好循環が開かれるのです。

あらゆる分野で AIGC に対する需要が爆発している現在、大規模モデルのいわゆるアプリケーション シナリオを見つけるのは難しくありません。しかし、大型モデルの大規模着陸に適したシーンを見つけて製品化の道を駆け抜けようとすると、多くの回り道を通らなければならないかもしれません。

このロジックに従って、すでに大きなモデルを提示しているプレーヤーは、さまざまな細分化に常に挑戦し、独自の足がかりを見つけようとしています。

百度は毎年の大学入学試験のホットスポットを掴み、AIボランティアアシスタントを立ち上げ、大型モデルの能力を最大限に活用しながら、これを利用してCエンド市場への参入を図り、アリは天猫ジーニーをアンカーとして利用し、AIボランティアアシスタントを立ち上げた。家庭用電化製品分野での大型モデルの応用を検討します。

大規模な産業モデルを開発する JD.com は、「大規模モデルの価値 = アルゴリズム × 計算能力 × データ × 産業の厚さの 2 乗」という公式を提唱しており、いわゆる「産業の厚さ」は特定のシーンによって積み上げられるだけです。になる。

どのような道であっても、大型模型プレイヤーは「約束の地」にたどり着くまで、そして「紅海」を越えるまで、試行錯誤を続けるはずだ。

大型モデルの開発の難しさに直面して、一部のプレーヤーは、企業が独自の大型モデルを構築するのを支援するために「水売り」の役割を果たすことを選択します。しかし、JD.com は常に現実的なスタイルを貫いており、「3 段階」の戦略を提案しています。つまり、まず汎用の大規模モデルを構築し、次に社内でシナリオとアプリケーションを検討し、その後徐々にオープンにします。その能力を外部に発信し、自らをテストフィールドとしながらも自社開発し、試行錯誤のコストを消化し、大型モデルの製品が真の価値を生みだす。

JD.com 内では、この大規模モデルがデジタル マーケティング、業務プロセスの最適化、顧客サービスなどの一般的なアプリケーション シナリオに組み込まれているだけでなく、小売、物流、金融などの多くの垂直シナリオにも拡張されていると報告されています。 、そして健康。

物流分野を例に挙げると、この複雑なシステム エンジニアリングに直面して、JD.com は複数の探索パスを模索してきました。それは、AI 予測などの豊富なネイティブ アルゴリズムに加えて、5 年間構築されたサプライ チェーン製品の Jinghui です。オープンエコロジカルテクノロジーによるオペレーションの最適化は、異種システムのアルゴリズムやデータとうまく通信できるだけでなく、大規模モデルのサポートにより、販売予測、在庫、供給、補充計画の面でより表現力豊かになります。 AIGC の幅広い用途により、そのインタラクティブなサプライ チェーン コントロール タワーは、ユーザーがサプライ チェーンの問題を迅速に特定して解決するのに役立ちます。

資金管理シナリオでは、JD Financeの「スマートベースセレクション」商品が発売されました。従来のファンド審査は理解するのにコストがかかり、操作も面倒で、取引の成功率に直接影響します。 JD.com は大規模モデルの助けを借りて、インテント マッチング、アルゴリズム生成、インテント認識、および複数ラウンドの対話のリンクを最適化し、一般的なスクリーニング質問の正解率が 90% に達し、顧客エクスペリエンスとトランザクション効率を効果的に向上させました。この商品は将来的には金融機関向けにも本格的に提供される予定です。

京東の「三段階」戦略は初期の成果を上げ、物流や金融などの垂直産業の組織に徐々に浸透してきたことが分かる。この戦略が段階的に展開されるにつれて、JD.com も着陸シナリオと高品質のデータを蓄積し続け、それによって大規模産業モデルの商用着陸に向けてフライホイールを回転させることが予測されます。

最終的には、一見複雑に見える大規模モデル戦争は、テクノロジーが物理産業に実際の価値をどのようにもたらすことができるかという中核問題に立ち返らなければなりません。この段階では、さまざまな道を歩むプレイヤーは、この長いマラソンでの質問に対する答えを徐々に探索し、練習することしかできません。

原文表示
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)