大規模モデルは、今年 AI の世界で最もホットなトピックです。基盤となる汎用大規模モデルを最初に発表したBaidu、Ali、その他の巨人と比較して、TencentはWAICが開催される前の6月19日、Tencent CloudがMaaS(Model as a Service)を正式に発表し、業界に直接注目しました。 10 の主要産業は、文化観光、金融、メディア、教育、政府問題など、さまざまなシナリオをカバーする 50 以上のソリューションを輸出してきました。
**メディア:**多くの CEO が、このビッグモデルはコンピューティング業界にとって大きな変革をもたらすものであると述べています。大手メーカーがこぞって大型モデルを投入している今、この判断は受け入れられないのだろうか。それほど多くの汎用大型モデルが必要なのでしょうか、それともすでに冗長になっているのでしょうか?
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Tencent Cloud Wu Yunsheng: 一般モデルと業界モデルは相反するものではない
「100 件の顧客の問題のうち 70% ~ 80% を解決するよりも、顧客の問題を 100% 解決したいと考えています。」
7月7日、2023年世界人工知能会議(WAIC)テンセントフォーラムで、なぜ業界向けの大規模モデルを先に立ち上げたのかという質問に対し、テンセントクラウド副社長兼テンセントクラウドインテリジェンス責任者の呉雲生氏はこう答えた。 。
大規模モデルは、今年 AI の世界で最もホットなトピックです。基盤となる汎用大規模モデルを最初に発表したBaidu、Ali、その他の巨人と比較して、TencentはWAICが開催される前の6月19日、Tencent CloudがMaaS(Model as a Service)を正式に発表し、業界に直接注目しました。 10 の主要産業は、文化観光、金融、メディア、教育、政府問題など、さまざまなシナリオをカバーする 50 以上のソリューションを輸出してきました。
当然のことながら、シナリオの適用と着陸が WAIC テンセント フォーラム全体のテーマになりました。
「汎用大型モデルだけがモデル用途の方向性ではない。垂直産業向けモデルが大型モデルの価値の転換点になるだろう。」テンセント副社長兼政府・企業ビジネス担当社長のリー・チャン氏は、次のように予測した。フォーラム。
Wu Yunsheng 氏は、OTA (オンライン旅行代理店) のスマート カスタマー サービスを例に挙げ、ユーザーは実際のコミュニケーション プロセスにおいて複数の意図が混在していることが多いと説明しました。コミュニケーションの過程において、意図はいつでも切り替わる可能性もあります。
「(ユーザーが)10日にホテルを予約してほしいと頼んだところ、機械が答えようとしていたところ、突然『11日にホテルを見せてください』と言いました。」 顧客サービスの現場で非常に複雑なプロセスに直面している一般人は、大規模なモデルは完全には不可能であるため、タスクを完了するには、特定のシナリオと組み合わせていくつかの複雑なモデルを再構築する必要があります。
しかし、現在の汎用大型モデルはまだ研究開発の初期段階にあり、産業用途では高コストという問題に直面するだろう、と呉雲生氏は述べた。スケールモデルではニーズを100%満たすことはできないが、「ソリューションコストのレベルを判断すると、あまり意味がありません。」さまざまな業界やシナリオに応じたソリューションは大きく異なりますが、一般に企業の効率を 30% 以上改善することに問題はありません。
フォーラムでは、Tencent Cloud は大型モデルに関する最近の重要なアップグレードも紹介しました。その 2 つの主要な技術基盤である Xingmai Network と Vector Database はすべて容量アップグレードを受けています。アップグレードされた Xingmai 高性能コンピューティング ネットワークにより、GPU 使用率が 40% 増加し、モデルのトレーニング コストが 30% ~ 60% 節約され、AI 大型モデルの通信パフォーマンスが 10 倍近く向上します。
そしてちょうど7月4日、Tencent CloudはAIネイティブベクターデータベースを正式にリリースし、従来の方法と比較して、大規模なモデルの事前トレーニングデータの分類、重複排除、クリーニングに使用され、データベースは10倍のパフォーマンスを達成できます。効率の向上。これをモデル推論用の外部知識ベースとして使用すると、コストを 2 ~ 4 桁削減できます。
今年のWAICでは、30以上の汎用モデルや産業用大型モデルが会場で発表され、いずれも大型モデルを作るとのことで、興味深い現象も見られた。同質化の問題はすぐに議論の焦点になりました。AI 分野における起業家精神は依然として意味があるのでしょうか?大きな工場にはそれぞれ独自の大きなモデルがあります。全員がそれを所有したとしても、その大きなモデルは依然としてゲームチェンジャーでしょうか?
Wu Yunsheng 氏は、大型モデルの開発の初期段階では、これらの問題について急いで判断する必要はないと考えています。ウー・ユンシェン氏は、「産業が開花する時期に、テクノロジーと産業の組み合わせを通じて、さまざまな可能性を探求し、産業と産業の効率を向上させたいと考えています」と述べた。
この判断は、AI 大型モデルの商業的可能性についての彼の楽観的な見方からも来ています。単一点のブレークスルーを伴う AI の最後の波では、多くの AI 企業がプロジェクトと民営化の実施と実装のジレンマに陥り、収益性を達成できませんでした。
「大型モデルの時代には、状況は以前とは異なる可能性があります。」 ウー・ユンシェン氏は、基盤となるコンピューティング能力や GPU チップの開発を含むテクノロジーの発展により、過去には数千億ドルもかかっていたモデルのパラメーターが大幅に減少すると考えています。テンセント 訓練強化や推論強化もかなり進んでおり、コストも急速に下がっている。一方で、大型モデルの応用可能性は常に拡大しており、その価値は常に上昇しています。
現在、テンセントは AI 大型モデルを中心にテクノロジーとアプリケーション エコロジーを拡大しており、業界との連携も強化しています。 7月6日、国連工業開発機関とファーウェイおよびその他のパートナーは共同で、WAICにおいて「世界産業製造人工知能同盟」の設立を発表した。
呉雲生氏はまた、技術基盤のアップグレードは「内部の強さを実践する」ことであると強調し、「汎用大型モデルであろうと、産業用大型モデルであろうと、基礎的なサポート能力が必要です」と述べた。 、膨大なコンピューティング能力、データなどを含みます。」
「大規模モデルの時代では、オープン性が非常に重要であり、誰もがオープンであるべきです。基盤となるテクノロジーの変化は非常に速く、拡張機能は非常に幅広いです。特定の業界と組み合わせると、多くの研究が行われ、呉雲生氏は、開放を通じてのみ、より多くの産業を実現できると述べ、専門家やさまざまな人材が参加する場合にのみ、より健全なエコシステムを構築し、より多くの可能性を生み出すことができると述べた。
以下は、36 クリプトン社が編集したメディアと呉雲生のインタビュー記録です。
**メディア:**Tencent Cloudは当初、汎用的な大規模モデルではなく、業界向けの大規模モデルを立ち上げましたが、収益を考慮したのでしょうか?
Wu Yunsheng: これはコストや投資とは何の関係もありません。私たちは常にお客様の課題を解決したいということを重視しており、100 人のお客様の課題を 70% ~ 80% 解決するよりも、1 人のお客様の課題を 100% 解決したいと考えています。問題を軽減することはできますが、この問題は解決しなければなりません。
メディア: 一般モデルと業界モデルは相反するように思えますが、両者の将来の関係はどのようにお考えですか?
呉雲生: まず最初に、私が個人的にこの 2 つに反対したわけではないことを明確にしたいと思います。ベース モックアップは、特別なカスタマイズを行わずにニーズを解決する台座のようなものです。生産性を効果的に向上させ、公共にサービスを提供するには、インダストリ モデルは一般モデルに基づく必要があります。業界に深く踏み込むことによってのみ、特に重要な問題を解決することができます。
Wensheng マップ機能には、非常に詳細で特定の業界ポイントも含まれます。たとえば、パッケージの広告マップの生成や、特別な認証などの特別なニーズを持つ顧客もいます。実際的な問題に直面した場合は、別のアプローチが必要になります。
**メディア:**テンセントは今年どの分野に注力し、どのような開発目標を掲げていますか?最近のアップグレードとイテレーションは何ですか?
**Wu Yunsheng:**私たちの大きな戦略は、問題の 70% ~ 80% を解決するために 100 個の製品を見つけるのではなく、実際的な問題の実装に焦点を当て、特定のシナリオごとに顧客の問題を 100% 解決することを期待することです。そのため、私たちは特定の業界に焦点を当て、お客様と協力して業界の課題を解決していきます。
たとえば、文化旅行業界では、OTA (オンライン旅行代理店) 分野の顧客が独自のビジネス シナリオを組み合わせ、ビジネス プロセスで大規模モデル テクノロジーを使用し、データ関連リソースを使用して大規模なシナリオを微調整します。モデル。技術開発の面では、当社のモデルとコンピューティングパワーネットワークは反復およびアップグレードされており、今後も関連テクノロジーを反復していきます。
**メディア: **インダストリ モデルの前回のリリース以降、モデルにアクセスする企業の数に大きな変化はありましたか?
Wu Yunsheng: 私たちは企業と多くのコンタクトを持っており、顧客の実際のシナリオと現在のビジネス ニーズを満たす方法を誠実に研究します。 「アクセス」には特に定義はありませんが、探査プロセスにはさまざまなニーズがあります。おそらく、普段 AIGC を目にする機会が多いかもしれません。
少し違うことを言います。私たちには、エンタープライズレベルのソフトウェアを扱う企業クライアントがいて、スマートフォームを作成する必要があります。たとえば、管理会議で新しいフォームが追加され、フォームの下の一部の項目は必須、一部は必須ではなく、一部のドロップダウンでは 4 つまたは 5 つのオプションしか選択できません。オプションが完了したら、それをプロセスにする必要があり、A、B、C によって承認されますが、各人の承認は異なります。
独自のツールと言語コードを使用してシステム内でフォームを設計し、プロセス全体をコンパイルして、内部組織を呼び出してプロセスを実現するのが本来の方法です。しかし、現状では写真を撮ってシステムに入れ、それをシステムコード(独自のスクリプト言語)で記述するだけで、個人にとって必要なのはどれが必要でどれが必要でないかといった簡単な自然言語コミュニケーションとコミュニケーションだけです。最初のステップ どこに行くか、2 番目のステップではどこに行くか、独自のシステム言語を使用してドッキング プロセスを設計します。
この例は、一般的なモデルでは完全に対処できない、非常に特殊な要件です。そのため、どのようなフィールドのテーブルなのか、スクリプト言語は何なのかなど、企業と綿密なやりとりを行っていきます。一般的なテクノロジーで問題の 60% ~ 70% を直接解決できる場合もありますが、顧客が問題を 100% 解決したい場合は、より綿密なコミュニケーションが必要になります。
**メディア: **大規模なインダストリ モデルの導入により、企業はどれくらいのコストを節約できますか?汎用の大型モデルと比べて、産業用大型モデルはどのような分野で優位性を持つのでしょうか?
**Wu Yunsheng: **実際に節約されるコストは、企業やシナリオによって大きく異なります。たとえば、顧客サービスのシナリオでは、企業内の顧客サービス自体の規模と予算がどれだけあるかに大きな違いがあります。体感的には30%以上の効率アップは問題ないと思います。
一般的な大型モデルが特定の業界に直面した場合、その業界が直面する問題を完全に解決できない可能性があります。たとえば、顧客サービスに必要なのは、単純な質疑応答のチャットではなく、人間の意図を理解し、データベースを検索して必要な情報を抽出し、人間が理解できる返信用のテキストに結合できるロボットや大型モデルです。
最も重要なことは、ユーザーの実際のコミュニケーションプロセスには複数の意図が混在していることが多いということです。1 つの記述の中に多くの要件があり、コミュニケーションプロセス中に意図がいつでも切り替わる可能性があります。これは非常に難しく、プロセスは非常に複雑です。特に顧客のシステムと対話する場合、複雑なモデル。このプロセスは一般的な大規模モデルでは解決できず、特定のシナリオと組み合わせる必要があります。
**メディア:**テンセントは企業の大規模モデルのコストをどの程度の範囲で制御できますか?
Wu Yunsheng: このテクノロジーを通じて、企業がコストを削減し、効率を高め、生産効率を向上できることを強調しますが、コストをどのレベルで管理するかについては決して言いません。当社の製品はリリースされてから 1 か月も経っていないため、初期段階ではある程度の協力は得られていますが、全体的なデータを提供することはできません。
**36 クリプトン:**AI の最後の波では、CV (画像認識) を筆頭とするテクノロジー アプリケーションは、API 請求の呼び出しなど、より単一ポイントのアプリケーションでしたが、その後、企業がプロジェクトに取り組み始め、民営化により、利益を上げるのが難しい。 AI のビッグモデルも将来同じようなことを経験するのでしょうか?
呉雲生: 私はまだ楽観的ですが、現時点で判断すると、比較的大きな課題があるでしょう。しかし、半年先を見据えても、半年先を予測しても、基盤となるコンピューティング能力や GPU チップを含め、テクノロジーの発展は非常に速いです。かつての大規模モデルは数千億のパラメータを持つモデルでしたが、テクノロジーの発展に伴い、モデルのパラメータはますます小さくなり、その機能は依然として非常に強力なレベルに維持されています。同時に訓練強化や推理強化も大幅に進み、コストは急速に下がっています。
一方で、アプリケーションに関しては、さらなる可能性が見えてきており、アプリケーションや生み出される価値の傾向は常に高まっています。
**メディア: **基礎的な能力構築とシナリオ実施の間のバランスについてはどう思いますか?
ウー・ユンシェン氏: 私たちは大型モデルを単一の視点から見たいと思ったことはありません。汎用大規模モデル、大規模インダストリモデルを問わず、膨大な計算能力やデータなどの裏付けとなるサポート能力が必要となり、それが内部力の次元となります。シーンは別の次元です。実際の問題を解決するには、内部強度の 50% を使用し、残りの 30% を外部強度に使用し、さらに 20% を追加します。大規模モデルのエコロジーでは、問題をさまざまな観点から検討します。しかし、内面の強さだけを言えば決して問題はありません。
**メディア:**多くの CEO が、このビッグモデルはコンピューティング業界にとって大きな変革をもたらすものであると述べています。大手メーカーがこぞって大型モデルを投入している今、この判断は受け入れられないのだろうか。それほど多くの汎用大型モデルが必要なのでしょうか、それともすでに冗長になっているのでしょうか?
Wu Yunsheng: ゲームチェンジャーを定義する方法をご覧ください。現段階では大型模型業界は比較的初期段階にあり、多くの可能性が生まれています。同時に、大型モデルは技術革新をもたらし、大きな可能性を秘めていることもわかりました。
私の個人的な意見としては、今すぐ結論を出す必要はなく、業界に百花が咲いた段階で、技術と産業の融合により、さまざまな可能性が生まれることを期待したいと思っています。産業や産業の効率を向上させるために研究されています。
**メディア: **モデルと業界の結合は初期段階にありますが、この段階ではどのような問題が存在しますか?汎用の大規模モデルと比較すると、大規模インダストリモデルのコストは最適化されていないどころか高くなるのではないかという見方もありますが、この点についてはどうお考えですか。
**Wu Yunsheng: **大型モデル技術は登場してから短期間ですが、急速に発展しています。ビッグ モデルに対する業界の理解はまだ初期段階にあります。ビッグ モデルで何ができるのか、業界とどの程度深く組み合わせることができるのかはわかりません。確かに、コストの問題だけでなく、インダストリ モデルと基本モデルの関係にも変化が生じています。
確かに、大型モデルですべての問題を解決できればコストが安くなるという見方もあるし、業界によっては大型モデルは必要なく、小型モデルで済むという考え方もある。
この問題は単一の側面から判断することはできず、客観的かつ完全に見なければなりません。私は、業界と緊密に統合されていない一般的な問題は、一般的な大型モデルで解決できることを強調してきました。しかし、さらに深く掘り下げたい場合は、シーンのさらに奥まで進む必要があります。多くの問題は同じように見えますが、さらに深く掘り下げると、同じ問題を解決できない場合があります。この場合、ソリューションのコストを判断することはあまり意味がありません。
**メディア:**業界の観点から、クラウド コンピューティング市場全体に対する大規模な技術変化によってもたらされる市場の増加と増加シナリオをどのように判断すればよいでしょうか?
Wu Yunsheng: 大規模モデル時代の到来後、コンピューティング パワー、特に AI 関連のコンピューティング パワーに対する需要が大幅に促進されたことがわかります。ただし、クラウドコンピューティングを具体的に数値化することについては、数値化することが難しく、現在も継続的な発展の途上にあります。
シーンに関しては、各界で大きなモデルが組み合わされるようになり、一般シーンから産業シーンまで含めて非常に豊富なシーンとなっています。一般的なシナリオには、スマート カンファレンスのアップグレードが含まれます。テンセントの Qidian カスタマー サービスと 619 にリリースされた Qidian 分析もスマートに機能しています。また、クラウド上でいくつかのコード アシスタントも実行しています。汎用性と効率の向上という点でも、多くのアプリケーションがあります。また、それぞれの業界にはさまざまな用途があり、需要も多くなります。
メディア: 大型模型の上陸シーンに加えて、テンセントは他の大型模型企業にもサービスを提供しますか?火山エンジンは大型モデルのユーザーの70%が火山にいると言っていますが、テンセントのデータは何ですか?
**Wu Yunsheng:**当社は、ユニコーン企業やその他の大規模モデル ソリューション向けに、一連のクラウド サポートや機能を提供しています。高性能コンピュータHCC、ベクトルデータベース、高速化機能をリリースし、メーカーへ提供可能です。
基盤となる機能に加えて、TI プラットフォームの大規模モデルに基づく統合された微調整ソリューションや、一連のツール、プロセス、サービス サポートも備えています。
**メディア:**多くの SaaS サービス プロバイダーが長年にわたって蓄積してきましたが、当社の MaaS (Model as a Service) は彼らのためのものですか、それとも業界トップの顧客のためのものですか?
呉雲生: これらは私たちの顧客です。
**メディア: ** と業界を組み合わせることが、テンセントの現在のアプローチです。昨日、ファーウェイがアライアンスを設立しましたが、巨人同士の競争が形成されやすくなるということでしょうか?
ウー・ユンシェン: 私はこの問題をそのようには見ていません。大型モデルの時代にはオープン性が非常に重要であり、誰もがオープンであるべきだと思います。基盤となるテクノロジーの変化が速すぎ、そのテクノロジーの拡張機能は非常に幅広く、それを特定の業界に統合するには多額の費用がかかります。この場合、最大の価値を引き出すことができるのはオープン性だけであり、より多くの業界専門家やさまざまな役割の人材がオープンで参加できるようにすることによってのみ、エコシステム全体がより健全になり、より多くの可能性を生み出すことができます。
メディア: 各企業への入り口は同じですか?
呉雲生氏: 私が述べた開放性とは、能力開発と生態学的開放を指します。たとえば、大規模な財務モデルを構築する場合、1 人ですべての大規模な財務モデルを要約する必要はなく、さまざまな分野で深い経験を持っている人がおり、一緒に構築することは一種のオープンさです。業界の顧客に直接オープンすることも一種のオープンです。
さらに、大規模モデルが提供する機能に基づいて、パートナーは効率化ツールや業界ソリューションのアプリケーションをアップグレードし、さまざまな形式のアプリケーションを組み合わせます。大型モデルの内部強度を強化するという点では、パートナーが開花しており、誰もが異なるアプリケーションを提示しており、これも一種のオープンさです。