幻惑AI: 半年前のモデル、まだ空を飛んでいる

出典:『Photon Planet』(ID:TMTweb)、著者:呉坤燕、編集:呉先志

画像ソース: Unbounded AI によって生成

大型模型の火は半年もの間、この地で燃え続けている。ファーウェイ、JD.com、シートリップの記者会見が夕方のエピソードに追いつく中、インターネットの一貫したパラダイムによれば、国産大型モデルの「新しいもの」も半年間のテストの到来を告げている。

他の企業の半年ごとの審査とはまったく異なります。新エネルギー車、携帯電話、電子商取引プラットフォームなどのビジネス形態の半年ごとの審査は、テキスト分析を容易にするのに十分な公開データ情報によってサポートされています。」ブラックボックス」状態では、明確なビジネスモデルがないため、いわゆるデータ情報などの議論は問題外です。

皮肉なことに、大型モデルは製品機能の観点から見ても、一般的な評価手法が確立されていない。 AGIという究極の目標を前にすると、国内のCエンドユーザーが大型モデルを「評価」する際に頼る古典的な「リスミカン法」など、当然さまざまな評価手法が存在します。

あるいはこのため、ほとんどの国内メーカーは OpenAI のような用途に自社の大規模モデルを公開できず、内部テストメカニズムを実装しています。

大型モデルの探索は、業界をリードするテンセントの大型モデル、ファーウェイのPangu 3.0、Jingdong LingxiなどのBサイドとGサイドにより重点を置いています。トッププレイヤーが注力する現行サーキットとして、製品化を基本目標に、可能な限り成熟した製品形態を見せることに重点を置いた大型モデル。例えば、このような大型モデルを早期に普及・事業化促進するためには、事業着地指向に加えて、現地展開力も重要な参考指標となっています。

それでも、業界関係者の目から見ると、「どんぶりを前に届ける」という大規模な産業モデルは、まだ買い手となる企業が不足しているという。これまで大規模な商業協力は行われていない。

したがって、今日の投資市場において、大型モデルに関連する投資がプライマリー市場ではなくセカンダリー市場に集中していることは、無理もないことです。たとえ王恵文レベルの巨牛が市場に参入したとしても、公的情報筋によると、同社のAラウンド資金調達額は2億3000万米ドルをはるかに上回っており、その資金調達能力は数百億ドルを受け取るOpenAIの資金調達能力と同じではないという。マイクロソフトから時々。

投資市場は適格なバロメーターです。半年に一度の試験時期に国産大型機種が提出する答案は明らかに満足のいくものではなく、「物語」を実現するには休眠と磨きの期間が必要だろう。

**ビジネスモデルのない大規模モデルですか? **

国内の大型モデルが市場の疑問に応える必要がある場合、ビジネスモデルを最優先に置く必要があります。

すでにユーザーの中でトップの座を占めていたChatGPTの人気は大幅に低下し、国内初の汎用大型モデルであるBaiduやAliも多くのプレイヤーが追随したため「沈黙」に陥った。上。その理由は、一般的な大型モデルのビジネスモデルが成り立たなかったからだ。たとえ世論の分野でユーザーの支持を得たとしても、商業的なクローズドループは決して現れませんでした。

幅広いテストを行ったBaiduの大規模モデルを例に挙げると、同社の商用アプリケーションWenxin Qianfanの支払いモデルは、通話によって生成されたトークンの数に基づいており、標準は1,000トークンあたり0.012元で、コストは0.12元です。千字原稿を出力します。

回復コストの速度に関係なく、0.012 元/千トークンの手数料は安いように見えますが、テキスト生成では、望ましい結果を得るために複数のインタラクションが必要になることが多く、複数のインタラクションにより隠れたコストが無限に増加します。行ったり来たりするスタッフのようなもの。

同様のシナリオは質疑応答コミュニティです。学者の孫権氏 (仮名) は Photon Planet に対し、モデル アプリケーションを使用する経験は質疑応答コミュニティで質の高い回答を探すのと似ていると語りました。ユーザーの考えは質問の粒度であり、お金を支払う意欲は、多くの場合、質の高い回答でのみ見られます。質の高い回答はその後に生成されます。したがって、Baidu は推論テキストの数を支払い基準として選択しましたが、それでも商用利用に伴う隠れたコストをカバーすることはできません。

B サイドが好む月々の支払いを採用した場合、コスト支出がユーザーから自分自身に移されるだけであり、これは明らかに長期的な解決策ではありません。最良の証拠は、ChatGPT が C エンド ユーザー向けの月額 20 ドル以下で手を抜いている疑いがあることです。

現状では汎用大型モデルの製品化はBサイド、Cサイドを問わず損益分岐点のバランスをとることが難しく、同時にAI倫理などのコンプライアンスリスクに直面する可能性が高いそして監督。したがって、大型モデルの工業化と垂直化は、着陸要求の下でパラダイムシフトとなっています。

大規模インダストリーモデルとは対照的に、その製品形態は着地需要から始まりますが、実際の着地で生じる問題は依然として解決する必要があります。

参考にすべき事例の 1 つは、Zhihu が製品の内部テストを実施することを以前に発表した Zhihaitu AI や、間もなくリリースされた Ctrip.com など、独自の製品エコロジーに基づいて構築された垂直 C モデルです。前。

両者が大規模モデルコースに参入する利点は同じであり、それは独自の群集生態学とそこから派生する質の高いコミュニティコンテンツにあります。業界データとしてのコンテンツは、簡単なクリーニング後に大規模モデルのトレーニング コーパスになる可能性があります。両者の微妙な違いは、Zhihu は当初からコンテンツ コミュニティであるのに対し、Ctrip は近年になってからコンテンツに注力し始めたことです。

しかし、ZhihuにしろCtripにしろ、現状の観点から見ると、その大型モデルの製品形態はユーザーの悩みのポイントに応えることができず、既存の機能を十分に改善することもできていないようだ。

Zhihaitu AI が現在発表している製品「ホットリストサマリー」は、AI を活用して質の高い質問と回答を収集し、ユーザーに提示するサマリーを磨き上げ、書き換えます。また、別のアプリケーション「検索アグリゲーション」は、自己回答からの意見を集約してユーザーの獲得情報を改善し、意思決定の効率化。

自己推薦やホットリストなどの集計機能は Zhihu の「伝統的な技術」であり、ビッグモデルのエンパワーメントのパフォーマンスはユーザーレベルでの飛沫を引き起こしていません。さらに、AIによる書き換えと磨き上げのプロセスは、人気のある回答のパーソナライズされた機能もカバーしており、ユーザーにとって、このアプリケーションの機能は情報を素早く理解することだけであり、コンテンツコミュニティが主張する差別化およびパーソナライズされたコミュニケーションに反するものです。

OTAに基づいてシートリップは、シートリップ取締役会会長の梁建章氏の見解として、OTAが観光業界にとって「信頼できる回答ライブラリ」であると求めた。製品の効果検証には時間がかかるが、ポジショニングの観点からは「基本を犠牲にして最後を追う」疑いもある。

若いユーザーにとって観光には標準的な答えはなく、「特殊部隊」「パンチング」「没入型」など多様な観光形態の出現がそれを証明している。例えば、多数のユーザーがAIを活用して移動ルート計画を立てたと仮定すると、同じルート計画でも実際にコミュニティのコミュニケーションや雰囲気に影響を与え、ユーザーの滞在時間の減少を引き起こす可能性があります。

一般に、垂直モデルの C エンドへの着地はスムーズではなく、「埋没コスト」になる可能性もあります。おそらく、大型モデル自体の「効率の向上」という神話の影響を受けて、製品のポジショニングは主に「効率」という言葉に限定されていますが、効率はユーザー エクスペリエンスの中核ではない次元にすぎません。

同じパラダイムは to B 分野でも実証されており、効率を追求する B サイドでは、業界の大型モデルのビジネス モデルと実装上の問題がより深く実証されています。

不明瞭なブラックボックス

「AI は物理学ではありません。理論的には大きな技術的進歩はほとんどありませんが、モデル構造とデータ品質の面ではより微調整と小さな最適化が行われています。多くの場合、モデルの出力はさらに良くなりますが、チームはそれができません」理由を見つけてください。」

業界関係者の意見では、業界外の大規模モデルには大きな認知バイアスがあり、その理由は大規模モデルのトレーニングとAI業界が外部の世界にとって「ブラックボックス」であり、それが難しいためであるとのこと大規模なモデルを検証する 出力を生成する推論プロセスは目に見えず、無形です。

このため、外部の世界は、ChatGPT によってもたらされた狂乱期が終わって一旦落ち着いた後、大規模モデルの「ブラック ボックス」に対して慎重な態度をとるようになりました。これは地上の大型モデルのジレンマにつながりますが、この現象はBルートに移行する過程でより顕著になります。

Tencent Cloudが立ち上げたMaaS技術ソリューションやHuawei Cloudが立ち上げたPangu大型モデルなど、Bへのルートが明確になった大手メーカーの製品を例に挙げると、クラウド展開、ローカライズされた迅速展開など。インタラクションや運用、その後の新たな業界データの追加の反復最適化にも実績があり、大規模モデルの敷居は極めて低いレベルにまで引き下げられていると言えます。

しかし、「慎重さ」がもたらす認知の壁は未だに破られておらず、ChatGPTが半年以上続いているにもかかわらず、多くの企業は大規模なモデルをインポートする方法を研究する意欲も興味もありません。

同様のロジックは、数年前のクラウド コンピューティング業界でも見られました。クラウドコンピューティングは、データの価値の認識に基づいたサービスおよび派生サービスであり、企業にとっての大規模モデルの価値に関しては、相対的にデータの価値が跳ね上がっています。企業顧客に欠けている技術力もあり、大型モデルはもちろんのこと、国内企業におけるクラウドコンピューティングの普及すら、まだまだ道半ばである。

インダストリモデルが役に立つかどうかは実際にはもはや重要ではなく、結局のところ、製品の使用価値は最終的にはユーザーによって発見される必要があります。さらに、外部の世界は、「リスマンダリンフィッシュ法」や最近着弾位置と衝撃の強さの予測エラーにより疑問視されているファーウェイ盤古など、特定のテストとパフォーマンスを通じてモデルのレベルを大まかに測定します。超大型台風「ドゥスリ」の気象モデル。

そのためか、最近発表された京東陵渓の大型モデルは自社のビジネスシナリオを優先的に実行することを選択しており、来年初めには「外部の深刻なビジネスシナリオ」にもオープンになる予定だ。

さらに特筆すべきは、「業界の潮流」のもとで、本来のビッグモデルの「普遍的」な物語に代わって、商業化志向のいわゆるインダストリーモデルが登場し、同時に多くの人々の「損失」を引き起こしていることである。 」。

いわゆるインダストリーモデルの定義は曖昧です。大規模モデル (基礎モデル) の意味はパラメーターの数ではなく、一般的なデータ トレーニングから得られる一般的な機能にあります。同じモデル アーキテクチャが採用されているにもかかわらず、データ上で単一ドメイン データが使用されている場合、一般的な機能が失われるだけでなく、新たな割引によりドメインの問題さえも解決できなくなります。

業界データが元の大規模モデルに基づく二次事前トレーニングに使用される場合、それは元のモデルを微調整することと同等であり、製品自体はまだモデル層にあり、これを業界大規模モデルと呼ぶことができます。 ; ドメイン知識が外部データベースを通じて追加される場合、それは元のモデルの機能を刺激するだけであり、製品もモデルの上のアプリケーション層に属する必要があります。これをインダストリ モデルと呼ぶのは過言です。

現在、大規模工場の大規模産業モデルのほとんどは、Tencent、Jingdong、Huawei などの前者です。後者は、少し前に激しい議論を巻き起こした大規模な法的モデルである ChatLaw など、投資の軽減とモデルのパフォーマンスの急速な向上により、オープンソース コミュニティでより多く登場するでしょう。

業界関係者は「前者に比べ、後者は製品形態が成熟しており、モデル機能の迅速な構築が容易だが、後者はドメイン知識の浸透プロセスが完了した後の上限が高くなることが多い」と述べた。

オープンソースの脅威

最近、Meta は最新のオープンソース大規模モデル Llama2 をオープン商用ライセンスの下で無料で提供し、それを Microsoft の Azure プラットフォームに導入しました。この動きはオープンソース LLM の重要なマイルストーンとして歓迎され、さらにはクローズドソースの地位を脅かし始めました大手メーカーOpenAI。

モデルの大手スポンサーである Microsoft を通じて、Meta はよりオープンな姿勢で OpenAI に挑戦します。

実は、これよりずっと前から「オープンソース派」が第三者として静かに台頭していた。 5月に誤って漏洩したGoogleの内部文書には、「私たちには堀がない。OpenAIにもない」と書かれていた。一般的な考え方としては、OpenAI と Google は、表面上は大きなモデルで互いに追いつきつつあるが、本当の勝者はこの 2 社ではない可能性があるというものであり、この判断の理由は、オープンソースのエコロジーがますます充実していることにあります。

オープンソースエコロジーはますます活発化し、モデルの能力を表すLlama2やFinetune(モデル微調整)パラダイムの代表技術であるLORAなども登場し、巨大メーカーを輩出しています。 「奇跡を目指して」努力している彼らは、明らかに寒気を感じます。

オープンソース技術の共有や人材の移転などの要因も、大規模モデルのブラックボックスをさらに「ガラス化」させており、障壁がなくなった必然の結果として、大規模工場が巨額の資金と資金を投じて投資しているコンハウは、この時代の常識は、オープンソース コミュニティによって簡単に覆されます。

国内大手メーカーの多くは「両手で握る」という対応をしています。左手は「ドアを閉めて車を作る」、小規模な社内テストの形で製品の形と機能を継続的に磨き上げ、右手は「ブレインストーミング」を行い、クラウドをベースにしたエコロジー内にオープンソース コミュニティを構築します。ただし、これにはメーカー独自のコンピューティング パワー層とモデル層、アプリケーション層までのフルスタック レイアウトが必要なだけです。 Alibaba Cloudは大規模なオープンソースコミュニティGPTを立ち上げ、Huawei Cloud、Baidu Cloud、Tencent Cloudも計画を立てている。

一般的に、産業界でもGMでも、C社でもB社でも、大型モデルの半年テストでは実現の難しさを肌で感じ、利益期待は常に後退し、リスクは増大している。より強力であり、技術的な壁とは言い難いです。では、現状を打破する方法はどこにあるのでしょうか?

今のところ、興味深い方向性が 2 つあります。 1つは「AI時代のメモリ」と呼ばれるベクトルデータベースであり、もう1つはモデル知能がもたらすインテリジェントハードウェアです。

いわゆるベクトルは、今日の LLM トレーニングで最も重要なテキスト、画像、ビデオ、サウンドなど、あらゆるものを表すことができる多次元データを指します。これらの形式のコンテンツはデータベース内で明確に表現され、意味論的な検索、つまり、男性と少年などの類似性による検索をサポートします。言い換えれば、大規模なモデルの場合、ベクトル検索は大規模なモデルの SEO になります。

前述したように、ドメイン知識は、ベクトル データベース機能、微調整、プラグインを通じてインダストリ モデルの構築と使用を向上させることができ、大規模メーカーにとっては、当然のことながら次の段階での焦点となります。 5月以降、ベクターデータ関連への資本注入が活発化しており、より確実性のあるアプリケーションレイヤー製品として、多くのVCからも注目を集めている。

スマートハードウェアの組み込みモデルに関しては、「siri」や「Xiaoai」などのこれまでのスマートアシスタントと比べて機能が飛躍的に向上しており、実際のスマートデバイス(携帯電話、コンピュータ)の拡張でもあります。オープンソース コミュニティでは、大きなパラメータのモデルを MAC に組み込む試みが行われてきましたが、大手メーカーは過去のモバイル インターネット時代にある程度のハードウェア生産能力を蓄積しており、相対的に言えば先行者利益がより顕著です。 。

PR 的な春と秋の文体の書き方がなくなって、中核要件となった大型モデルはもはや神秘的ではなくなり、ストーリーはますます希薄になりつつあります。懸命に働く。ダイバーが浮上して正面から立ち向かう前に、業界は次の「ChatGPT」の瞬間を必要としています。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)