最新の統計によると、中国では130以上の大型モデルが発売され、70以上のアルゴリズムモデルが中国サイバースペース局に登録されている。 BAT などのインターネット大手はいずれも大規模な AI モデルをリリースしており、2023 年だけでも 60 社以上のスタートアップが融資を受けており、その製品には基本レイヤー、モデルレイヤー、アプリケーションレイヤーが充実しています。新世代の生成 AI は、前世代の AI の落とし穴を振り返り、前の冬の再来を避けるために業界が自己満足するのを避ける必要があるかもしれません。この分野の実務家は、業界の複雑化と顧客の問題点を明確に認識する必要があり、大手のチキンスープに騙されないでください。
AI が人間の日常的な作業を模倣して、多数の人間の複雑な社会的行動を処理するところを想像してみてください。スタンフォード大学の論文「Generative Agents: Interactive Simulacra of Human Behavior」では、記憶し、反応し、計画する AI エージェントについての詳細な研究が提供されています。 AI Agent は、OpenAI の取り組みの次の方向性であると考えられています。 OpenAIの共同創設者は最近のイベントでも次のように述べた:「モデルのトレーニング方法と比較して、OpenAIは現在、エージェント分野の変化にもっと注意を払っています。新しいAIエージェントの論文が発表されるたびに、私たちは非常に興奮してそれについて議論します」内部的には。」
目に見えないAIと呼ばれるAIを社内で管理しています。ユーザーの前では、それがどのようなモデルであるか、どれだけのパラメーターがあるかを強調しません。私たちの AI の定義は人間の支援です。
モデルと計算能力をバイパスすると、次の機会はエージェントになる可能性があります。
現在顧客の使用に影響を与えている最大の問題は、入出力比です。クライアントとの会話が終わり、プロジェクトの予算について話したとき、それが単なるテキスト関連で、投資額が数百万、数百万の場合、クライアントはあまり満足しません。さらに、実際の問題を解決するために AI エージェントを使用して大規模なモデルが実際の運用環境に組み込まれている場合、顧客は喜んでお金を払うでしょう。
巻き毛すぎるよ! 36 ビッグモデルと AIGC に関するメモと真実
出典:アイダークホース
9月12日午後、スタートアップダークホースの北京本社は「新たなAI勢力」の波を先導した。
Huawei Cloud、APUS、Tors、SenseTime、Kuaishou、360 Group、Qingbo Intelligence、Dark Horse Tianqi、MiniMax、Sinovation Ventures、Qiji Chuangtan、中国情報通信技術学院...上場企業、リーディングカンパニー、ユニコーン動物がいます企業だけでなく、AI 分野の大手投資機関や科学研究機関も含まれます。
会議に出席したゲストたちはさっそく本題に入った——
「大型モデルの業界の現状は? 企業はどのようにしてより効果的に商品化できるか? 注目に値する新しいトレンドや機会は何ですか?」
この非公開の AI 会議に参加できることを光栄に思います。38 のメモと真実を皆さんと共有します。
**01. この業界には何冊ありますか? **
最新の統計によると、中国では130以上の大型モデルが発売され、70以上のアルゴリズムモデルが中国サイバースペース局に登録されている。 BAT などのインターネット大手はいずれも大規模な AI モデルをリリースしており、2023 年だけでも 60 社以上のスタートアップが融資を受けており、その製品には基本レイヤー、モデルレイヤー、アプリケーションレイヤーが充実しています。新世代の生成 AI は、前世代の AI の落とし穴を振り返り、前の冬の再来を避けるために業界が自己満足するのを避ける必要があるかもしれません。この分野の実務家は、業界の複雑化と顧客の問題点を明確に認識する必要があり、大手のチキンスープに騙されないでください。
今、ある顧客が私たちに来て、シーンが 20 あり、各シーンの費用が X00 万元だと言いました。それから私は一軒一軒訪問して価格を尋ねました。ファーウェイなら対応してくれるでしょうか?アリババはやってくれるのか?百度はやりますか?このままでは結局儲からなくなります。
皆さんから集まった資金の 80% ~ 90% がコンピューティングパワーに使われている、これが現状です。ご存知のとおり、これはただのトレーニングです。トレーニングのコストは制御可能ですが、推論のコストは制御できません。
当社は 30,000 個の GPU と 6,000p の計算能力を持っていますが、年末までに 12,000p 以上の計算能力を持つように努めます。データに関しては、毎月 2 兆のトークンがクリーニングされ、注釈が付けられ、年末までに 10 兆のトークンが存在することになります。
現時点では、業界には破壊的なキラーアプリケーションがまだ不足しており、商業化の実現は困難です。
コストと効果のバランスをどう取るか、これが難しいポイントです。いずれも大型モデルを使用しており、コストが高すぎます。
しばらくすると、誰もがインフラストラクチャを最適化する能力を競うことになります。たとえば、ネットワーク最適化機能に関しては、他の人が失敗しても継続すると、他の人よりも多くの回数トレーニングできるようになります。
コンピューティング能力が不足している場合に備えて、私たちはいくつかの将来を見据えた技術的な試みを行っています。私たちの大規模なモデル会社では、モデリングよりもインフラストラクチャを担当する学生の方が多いとは思わなかったかもしれません。彼らの価格は一般に非常に高価であり、採用するのは困難です。
大型モデルは現在、恥ずかしい状況にあります。高価格で販売することができません。最終的には、クラウド、カード、コンピューティング能力を販売する企業だけが儲かります。
最初はこのモデルは非常に価値のあるものだと思っていましたが、今では再び衰退してしまいました。少し前にお客様にお会いしたのですが、BAT などがその言葉を引用してくれました。最初の見積もりは1000万以上とかなり高額でした。最終的な単価がいくらになったか知っている人はいますか?巻き毛が多すぎる。
数百億のパラメータを持つ大規模モデルは、一部の特別な顧客によって無料とみなされます。
02、現場の声
人工知能分野の企業は、毛主席の「実践から実践へ」という言葉を常に覚えておくべきだ。ローブとマンダリンジャケットを脱いで畑に歩いていくことによってのみ、顧客の隣にいるときに最も本物のフィードバックを得ることができます。今、AI分野には専門家もどきが多すぎるので、もっと現場の声を聞いたほうがいいです。
私たちは約 150 人の顧客と話をしました。大型モデル自体の要件は主に 2 つのカテゴリに分類されます。 1 つは大規模モデル自体のテキスト要件であり、大規模言語モデルに対する顧客の要件は 100% 正確です。もう 1 つは AI エージェントで、これには関数呼び出し、コード表示、サードパーティ ツールの呼び出しが含まれます。
私たちが協力している間に紛争が生じた。顧客は、社内での導入を決定する前に、データを提供できないと感じるでしょう。しかし、このデータがなければ、顧客のニーズに合ったモデルをどのようにトレーニングできるのでしょうか?
私たちがこのプロジェクトに取り組んでいたとき、ユーザーは大規模なモデルにお金を払いたがらないにもかかわらず、アプリケーションにはお金を払っていることがわかりました。顧客の中には、大規模モデルに関して、以前のインテリジェント ミドル プラットフォームやナレッジ グラフの一部はもう必要ないのではないかと直接質問する人もいます。結局のところ、シーンが核であることがわかりました。
セクシーなシーンをいくつか見つける必要があります。いくつかの基準があります。まずは小さな切開です。 2 番目に、大規模モデルの利点を一致させます。第三に、支払いを決定するユーザーに強い認識を持たせることです。たとえば、以前はデータ、結論、サービスを取得するには別のプロセスが必要でしたが、現在では大規模なモデルを通じて、意思決定者はモバイル デバイス上でそれらを迅速に取得して完了できるようになりました。
大規模なモデルで成功するには、次の 3 つのことが必要です。 1) コンピューティング パワーを購入するのに十分な資金を確保できるかどうか。 2) 十分なデータを取得できますか? 3) 人材密度は十分に高いですか? 重要なのは量ではなく、質の高い科学者が十分にいるかどうかです。
今、私たちは 3 つのタイプの顧客に遭遇します。 1 つのタイプは、競合他社がやっているからやりたいが、自分たちのニーズがわからない金融顧客など、不安を抱えている顧客です。一つはコストを削減したい顧客であり、顧客の経営陣は主にコスト削減と支出削減の問題であると考えていますが、そのモデルがどの程度の削減を達成したかについて具体的な価値を判断することは困難です。最後のカテゴリは、オープンソース モデルを導入して収益を上げたいと考えている顧客です。彼らはこのモデルに依存して収入を生み出しています。これらの顧客にとって、支払うのが最も便利です。
**03、ToC または ToB? **
GPT-4の1回のトレーニング費用は約6,300万ドルで、1兆8,000億もの膨大なパラメータが必要であることがわかっています。現在中国でリリースされている一部の大型モデルでは、ToC 方向は依然としてインターネットの無料モデルです。しかし、大規模なモデルの開発と運用には多大なコストがかかり、ToB のビジネス モデルがスムーズに運用されやすくなることは実務者なら誰でも知っています。商業化の検討という点では、ToB または ToC は常に業界の関心事です。非公開の会議では、1) 遺伝子、2) 罪という 2 つのキーワードが繰り返し聞かれました。 「あなたは、あなたではないものになることはできません。」
tobバーティカルモデルにはまだまだチャンスが眠っていると考えており、核となるのはデータとシナリオそのものです。
私たち自身も、人工知能をインターネットやデジタル化などとどのように組み合わせて、元のシーンをよりインテリジェントにする方法についても考えています。
ToC または ToB、率直に言って、これはすべての人の遺伝子に関連しています。私たちにできないからといって、他の人にもできないというわけではありません。たとえば、一部の ToC アプリケーションは、2000 年または 10 年生まれの子供たちによってプレイされますが、これは私たちの年齢を超えています。
Toc と Tob は依然として大きく異なります。 ToC は比較的高い耐障害性を持っています。 TOBはその逆です。たとえば、知的な質疑応答を考えてみましょう。精度を確保するにはどうすればよいですか?政府と同様に、赤線も存在する。モデルの錯覚を回避する方法は現在、それに応じて検討されています。
逆に、ToC のほうが稼ぎやすいと考えています。 ToB には問題があり、プロジェクトのプロセスは比較的長いです。クライアントの予算承認からプロジェクトの成立、実行までのマネーサイクルは非常に長いです。
今はチャンスが多すぎると思います。適格でない場所にリソースを割り当てないでください。戦略的な選択をすることが非常に重要です。
04、ToBとToGも非常に難しい
B 側の最大のバグは、最終的に高度な人間のアウトソーシングになってしまったということです。
すべてのプロジェクトにはサイクルがあり、すべての支払いはサイクルのノードに基づいています。制限なしでモデルのトレーニングと最適化を支援することは私には不可能です。
AIGC の作品はより寛容であり、いくつかの間違いがある可能性があります。しかし、一部の企業による生産および製造に関しては、精度に対する要件が非常に高くなります。多くの場合、モデルからより良いケースを 1 つまたは 2 つ選択するのは簡単ですが、悪いケースを排除して高いレベルに維持することは依然として非常に困難です。
経済的に発展した州でスマート デジタル ガバメント プロジェクトに取り組んでいたとき、5 つ以上のシナリオを推進し、最終的に顧客は 3 つのシナリオを承認しました。次に、セキュリティ、データ、および最下位レイヤーについて本質的に説明します。そこでお聞きしますが、他の大型モデルとの違いやメリットは何ですか?最後に、関係者全員が腰を据えて評価システムを考え出す必要があります。評価制度を通過した後も、パフォーマンスを評価する必要があります。
05. プロジェクトを使用して製品とソリューションを育成する
プロジェクトを使用して製品をインキュベートする いくつかのプロジェクトを完了した後、対応する技術ソリューションを抽出します。この一連のソリューションはモデルではなく、大規模モデル + 小規模モデル、そして最終的には複数のモデルによって形成される包括的なソリューションである可能性が高くなります。
過去 1 ~ 2 年はイノベーションと製品生産のプロセスであり、キャッシュの回復サイクルは比較的長くなるでしょう。
06、エージェント
AI が人間の日常的な作業を模倣して、多数の人間の複雑な社会的行動を処理するところを想像してみてください。スタンフォード大学の論文「Generative Agents: Interactive Simulacra of Human Behavior」では、記憶し、反応し、計画する AI エージェントについての詳細な研究が提供されています。 AI Agent は、OpenAI の取り組みの次の方向性であると考えられています。 OpenAIの共同創設者は最近のイベントでも次のように述べた:「モデルのトレーニング方法と比較して、OpenAIは現在、エージェント分野の変化にもっと注意を払っています。新しいAIエージェントの論文が発表されるたびに、私たちは非常に興奮してそれについて議論します」内部的には。」
私たちは常に、大きなモデルが全能であり、さまざまな問題を解決できると想像していますか?これは事実でしょうか?大きなモデルはあくまで大きなモデルです。
目に見えないAIと呼ばれるAIを社内で管理しています。ユーザーの前では、それがどのようなモデルであるか、どれだけのパラメーターがあるかを強調しません。私たちの AI の定義は人間の支援です。
モデルと計算能力をバイパスすると、次の機会はエージェントになる可能性があります。
現在顧客の使用に影響を与えている最大の問題は、入出力比です。クライアントとの会話が終わり、プロジェクトの予算について話したとき、それが単なるテキスト関連で、投資額が数百万、数百万の場合、クライアントはあまり満足しません。さらに、実際の問題を解決するために AI エージェントを使用して大規模なモデルが実際の運用環境に組み込まれている場合、顧客は喜んでお金を払うでしょう。
大規模モデルに基づいて、AI エージェントはメモリ、計画、実行などの強化された機能を備えています。今回私たちは60社以上のスタートアッププロジェクトに投資しており、そのうち20社以上がエージェントです。
TOC商品、支払いフォーム、商品形態は中国と外国では大きく異なります。最近ではエージェント会社への出資も行っています。
しかし、現段階では、AI エージェントは新たな実験段階にあるだけであり、一般的な知能との間には依然として一定のギャップがあります。将来的には、単一の AI エージェントの包括的な機能に加えて、複数の AI エージェント間のコラボレーションと感情機能におけるブレークスルーも解決する必要があります。
大物モデルのプレーヤーは、後半に新しいものが現れるのを見る機会を得ることができるように、ポーカー テーブルに留まるようにしなければなりません。