大型モデルは巨人のペットではありません

記事のソース: タイガースニフ

著者: クリーク

画像ソース: Unbounded AIによって生成

100モデルをめぐる争いが激化していますが、多くの実務家は大きなモデルについてますます疑問を抱いています。

基本的な大型モデルの分野では、テンセント、アリババ、バイドゥなどのインターネット大手が流入し、アリババ、バイドゥ、iFLYTEKなどの大手メーカーが先月、大型モデル製品の最新バージョンを次々とリリースし、技術力も大幅に向上しました。 スタートアップは同時に新しいバージョンを繰り返すだけでなく、「クレイジーな」資金調達も行い、Zhipu AIは最近、今年合計25億元の資金調達を受けたことを発表しました、ほぼ半年前に設立されたBaichuan Intelligenceは3億5000万米ドルの資金調達を受けており、これらのスタートアップの投資家の中には、Tencent、Alibaba、Meituan、その他のインターネット大手もあります。

中国は本当にそんなに多くの基本モデルを必要としているのでしょうか? 基本的な大規模モデルメーカーは、技術的なパラメータを「ローリング」することに夢中になっていますが、市場はどのような大型モデルを必要としているのでしょうか? 活発で混沌とした戦闘状況の中で、これらの質問はますます多くの人々によって提起されています。

この疑問に答えるには、まず、基本的な大型モデルが中国市場でどのように収益を上げているかを理解する必要があります。 大規模モデルといえばチャットボットというイメージが圧倒的に多く、情報検索や書類整理の際に利用するユーザーも多いものの、関連企業が経営幹部向け製品で儲けることは難しく、ユーザー規模が大きくなればなるほど、企業は赤字を被るケースも増えます。 **現在、基本的な大型モデルの商業化の最も実用的な方向性は、小売、金融、製造などの分野の企業にコスト削減と効率の向上を提供し、安定した商業収入を得るためのBサイドです。 **

基本的な大規模モデルのニーズには、次の 3 つのタイプしかありません。 ** 大規模なモデル API を直接呼び出して、関連する大規模なモデル機能を取得します。 大規模モデルに基づいて、実際のビジネスに沿って二次開発が実行されます。 大規模なモデルに基づいて AI アプリケーションを開発します。 **これらの要件は、基本的な大規模モデル プラットフォームの技術的能力をテストし、そのエンタープライズ サービス機能もテストします。

サービス力という観点では、大規模モデルスタートアップやインターネットの巨人はゼロから始めなければならず、誰も先天的な優位性を持っていません。 顧客のニーズをより迅速に把握し、安定した信頼性の高いサービスを提供できるプラットフォームが際立っています。

大きなモデルは「吹き飛ばされない」

ChatGPTの人気を分界点とし、国内の大型モデルの開発は2日間を経験した。

ChatGPTが普及する前は、大規模モデルの技術やサービス能力が市場に広く受け入れられておらず、これらの企業は主に技術の研究開発とサービス能力の蓄積に注力しているため、基本的な大規模モデルの研究開発に取り組んでいる国内企業はごくわずかでした。 ChatGPTが普及すると、多くの投資家や実務家が殺到し、大型モデルが新しい出口になりました。

ホットな市場は、テクノロジーを掘り下げるのではなく、テクノロジーやサービス能力に関係なく、ストーリーを語り、コンセプトを誇大宣伝し、最初に空にストーリーを語り、このようにして資本市場と顧客の認識を得る投機家を生み出しやすいです。 ある大手模型関係者がTiger Sniffに冗談交じりに語ったところによると、中国の多くの大手模型企業は、自社とGPT-4の差はわずか数カ月だと主張しているが、これはオープンソースのGPT-2をベースにしたトレーニングを行い、ストーリーを語っているからだという。

実際、大規模モデルの技術的能力の進化は、複雑なシステムであり、大規模であることが非常に重要であり、一定の規模がなければ、より知的な進化を生み出すことは不可能であるため、数か月のトレーニングでは達成できません。 ただし、大規模なモデルのトレーニング スケールを増やすには、多くの時間とデバッグの繰り返しが必要です。 大規模モデルのトレーニングパラメータをデバッグした技術者は、何をすべきかを誰も教えてくれず、自分で解決しなければならず、その過程であらゆる種類の予期しない状況が発生し、解決に時間がかかるというこの難しさを理解しています。

中国では、ChatGPTが普及する前に、本当に技術力に自信のある基本的な大規模モデルが訓練されていました、当時、大規模モデルは一般にはあまり知られておらず、多くの人が大規模モデルについて理解しておらず、楽観的ではなく、大規模モデルへの投資に固執する企業は新しい技術に非常に自信を持っていました。

例えば、2020年、KLCIIは初の超大規模事前学習済みモデル研究プロジェクト「Wudao」を立ち上げ、そのバージョン2.0は世界最大の1兆レベルのモデルとなりました。 今年のバージョンアップ後、「Wudao」は言語、視覚、マルチモダリティなどの基本的な大規模モデルをカバーし、完全なオープンソースの段階に入りました。

Zhipu AIは、2020年にGLM事前学習アーキテクチャも開発し、数百億のパラメータを持つモデルGLM-10Bも学習しました。 10月27日、Zhipu AIは第3世代の自社開発対話モデルChatGLM3をリリースし、前世代と比較して性能、推論能力、コンテキスト容量が大幅に向上しました。 ChatGLM2と比較して、ChatGLM3は中国の44の中国語と英語の公開データセットの中で1位にランクされました。 そのうち、MMLUは36%、Cは33%、GSM8Kは179%、BBHは126%増加しました。

また、機能面では、Zhipu AIがリリースしている国産の大規模モデル(ChatGLM、CodeGeeX、WebGLM、CogVLMなど)の数々は、中国で最も完成度の高いベンチマークOpenAIシリーズの大規模モデルでもあり、生成AIアシスタント「Zhipu Qingyan」に適用できます。

大規模なモデルを最初に作成するこれらの企業は、コンセプトを推測して風を追いかける企業とは根本的に異なります。 大規模模型技術がまだ爆発的に普及しておらず、市場がそれほど不安定でなかったとき、彼らは基本的な大規模模型の技術的価値とビジネスロジックを理解したからこそ、それに関わっているのです。 この違いは、大規模モデルの人気、多くの企業がトラフィックと話題性のためにCエンド製品に関与する一方で、Zhipu AIなどの初期の企業はエンタープライズサービスの分野に重点を置き、すべての研究開発能力とサービス能力もこのアイデアに基づいて配置され、地に足の着いた方法で蓄積され、顧客のために価値を創造する方向に発展しています。

**大規模モデルの複雑さにより、テクノロジーとサービス機能を長期間蓄積してきた企業の方が優位に立つことができます。 大規模モデルの複雑さと大規模モデルの進化に要する時間を認識する人が増えれば、ストーリーテリングに頼ってコンセプトを炒めていく大企業は生き残る余地がどんどん少なくなり、技術やサービス力を本格的に蓄積した企業は、競争の第一波の試練に耐えられるようになる。

豊かな生態系の大きなモデルはなく、未来もない

**大型モデルの製品化の過程で、社会の硬直的なニーズを持つアプリケーションシナリオに着地できた人が、自己造血の好循環を最初に形成します。 **

一般的な大規模モデルは、より広い範囲のアプリケーションを持っていますが、垂直ドメインの特定の問題を解くには十分専門化されていません。 縦型大規模モデルは、ドメイン固有の問題を解決する能力が強いが、サービス範囲が非常に限られているため、多くの縦型大規模モデルではコストとビジネス上のメリットのバランスをとることが難しく、開発スペースも限られている。

大規模モデルの適用の最後のポイントは、生活と生産で使用され、仕事と生活の実際的な問題を解決し、作業効率と生産性を向上させることです。 現在の一般モデルと垂直モデルの長所と短所を踏まえて、現在のモデル化プロセスにおいて、小売、金融、製造などの分野に技術やサービスの機能をオープンソース化し、一般モデルと関連分野の企業が連携してアプリケーションシナリオを構築するというのが、より適切な考え方です。 **

データ、コンピューティング能力、シナリオなどの制限を条件として、オープンソースで実際に実行できる大規模なモデルはそれほど多くありません。 同時に、基本技術基盤として、大規模モデルの役割はPCや携帯電話のオペレーティングシステムと非常によく似ており、「大きな木の下で、1インチの草ではない」という競争パターン、つまり、1つまたは2つの技術基盤が業界で支配的な地位を占め、すべてのアプリケーション開発者はこれら2つの技術基盤に基づいて開発する必要があります。 ペデスタルモデルが繁栄する生態系を形成できなければ、持続可能な開発能力はありません。

PCや携帯電話のOSの開発経緯から判断すると、先行者利益は非常に重要です。 WindowsがPC市場を席巻し、携帯電話分野ではiOSとAndroidが2つの世界に分かれていると、他のOSが立て直す余地は難しくなります。

同じ傾向は、大規模モデルの分野でも見られます。 大規模なモデルは、豊かな AI アプリケーション エコシステムを開き、個人および企業のデータ、機能、またはアプリケーションがすぐに AI プラグインになり、大規模なモデルの機能を強化し、大規模なモデルをより実用的で使いやすいものにします。

現在、Baidu、iFLYTEKなどの巨大企業は、金融、教育、製造、エネルギー、政府業務、運輸、その他の産業の400以上のシナリオをカバーし、約10,000のBaiduインテリジェントクラウドQianfan大規模モデルプラットフォーム2.0月間アクティブ企業に取り組んでおり、iFLYTEKのSpark大規模モデルプラットフォーム開発者規模は700,000を超えています。

大型模型の分野で長い年月を積み上げてきたスタートアップの中には、カニをいち早く食べるところもあります。 現在、Zhipu AIは1,000社以上の顧客と100社以上のパートナーを擁し、メディア、SaaS、教育、オフィスなどの複数のシナリオをカバーするエコシステムを構築しています。 たとえば、プレゼンテーションコンテンツのインテリジェントなドキュメント生成とプレスリリースの作成機能の背後には、サポートとしてのZhipu AIの技術的能力があります。

さまざまな大規模モデルプラットフォームの生態学的競争において、プラットフォームの最も重要なテストは、プラットフォームがパートナーにもたらす価値と、パートナーとともに成長する能力です。 オフィスシナリオに関する限り、プレゼンテーションのコンテンツ生成、記事コンテンツの記述、およびスタイルの書き換えは、大規模モデルプラットフォームの精度と推論能力に対する要求が非常に高く、特定の技術レベルに達した大規模モデルのみがこれらのアプリケーションをサポートでき、大規模モデルプラットフォームも実際のアプリケーションでのユーザーのフィードバックに応じてエラーと反復を修正する必要があります。

**巨大企業であろうとスタートアップ企業であろうと、どんなに資本力やリソース力が強くても、ゼロから一歩一歩積み上げ、反復していく必要があります。 したがって、大規模モデルプラットフォームのエコシステムを構築するプロセスでは、時間的な優位性が非常に重要です。 これは、先行者利益を持つスタートアップと、より強力な資金力を持つインターネットの巨人が対等に競争できる理由でもあります。

**100モデル戦争、中国市場に適しているのは誰ですか? **

100モデル戦争の戦況は活気に満ちて混沌としているが、その背後にある競争の方向性は非常に明確であり、技術力とサービス力、そしてエコシステムを構築する大規模モデルプラットフォームの能力が競争の方向性を直接決定する。

これらの能力の構築には時間がかかり、一朝一夕に達成することは困難ですが、時間をかけて積み重ねるだけでは不十分です。 先行者利益は、早期行動によってもたらされる時間差に加えて、市場の需要を正確に認識する能力、つまり、正しい戦略に沿ってしっかりと迅速に行動する能力も備えており、戦略的なスイングと迂回は、早期行動によって蓄積されたすべての時間的優位性を簡単に消費する可能性があります。

ますます多くの大型モデルプラットフォームがエコロジカルな建設に焦点を移すと、プラットフォームの戦略的決定と実行がエコロジカル競争においてますます重要になります。 **いくつかのプラットフォームがスーパープラットフォームへの質的変更を完了すると、競争環境は基本的に決定されます。

大規模で複雑な国内市場では、Bエンドサービス企業は戦略的な振れ目や回り道をしがちです。 一方では、国内市場の企業の地域や事業規模が異なり、エンタープライズインテリジェンスに対する大規模モデルの価値の認識が大きく異なり、投資するリソースとコストも異なるため、標準化されたソリューションを見つけることは困難です。 一方、分野が異なれば、大規模モデル機能に対するニーズも異なり、同じ分野の企業でも大規模モデルに対するニーズは異なります。

このような環境下では、OpenAIの商用化計画と比較して、国内の大規模モデルプラットフォームの商用化には、より細部へのこだわりが求められます。 このような傾向は、一部のプラットフォームの商品化アイデアにも見られます。

たとえば、Zhipu AI は、共通のオープン プラットフォーム API サービスに加えて、クラウドの民営化とローカルの民営化の 2 つのソリューションも提供します。 **クラウド民営化は、企業がより強力なセキュリティを備えたプライベートデータに基づいて独自の大規模モデルを構築するのに役立ちますが、ローカル民営化は中国市場で独自のソリューションであり、より強力なモデルを提供するだけでなく、さまざまなシナリオとニーズを満たす完全なモデルマトリックスも提供します。 **

記事の生成、インテリジェントな顧客サービス、データ注釈などのさまざまな顧客ニーズ、および大企業、中規模、中小企業の規模に対応して、Zhipu AI はさまざまなソリューションを提供し、顧客は自分のニーズに応じて自由に組み合わせることができます。 このより詳細で柔軟なサービスモデルは、中国市場に対する長期的かつ正確な洞察にも基づいています。

外部環境の不確実性に直面して、Zhipu AIは国内のチップ適応計画も開始し、国内のハードウェアメーカーやチップメーカーと協力して、さまざまなタイプのユーザーとさまざまなタイプのチップにさまざまなレベルの認証とテストを提供し、大規模なモデルサービスをより安全で信頼性の高いものにしています。 現在、ChatGLMシリーズは、Ascend、Shenwei Supercomputer、Haiguang DCU、Haifeike、Muxi Xiyun、Computing Technology、Tiantian Zhixin、Cambrian、Moore Threads、Baidu Kunlun Core、Lingxi Technology、Great Wall Chaoyunなど、10種類以上の国内ハードウェアエコシステムをサポートしており、同時にリリースされた携帯電話展開可能なエンドテストモデルChatGLM3-1.5Bおよび3Bは、Xiaomi、vivo、Samsung、その他の携帯電話および車両プラットフォームをサポートしています。

100モデル戦争の戦いが激しければ激しいほど、これらの一見目立たない詳細が外部パートナーの認識の程度を決定し、さまざまなシナリオでの大型モデルの着陸速度にも影響するため、これらの一見目立たない詳細がより重要になります。 単純に大規模モデルをリリースする敷居は市場が想像するほど高くはありませんが、反復を続けて競争障壁を形成するために高品質のデータシナリオを持つことは可能であり、高品質のデータシナリオの鍵は外部パートナーにあり、より多くのパートナーが喜んで選択するプラットフォームは、このビジネスサイクルをスムーズに実行しやすくなります。

このコンペティションでは、多くの実務家は、勝者はより強力なリソースと財務能力を持つ巨大企業でなければならないと考えていますが、そうではありません。 スタートアップ企業も巨人企業も、トリックを踏んで細部の真相を突き止める必要があり、近道はありません。 資金調達に関しては、コアコンピタンスを持つスタートアップは資金不足にならないため、決戦の根源ではありません-Zhipu AIが大規模モデルスタートアップから最高額の資金を受け取ったとしても、ゲームに参入したい新しい投資家が増えます。

別の角度から考えてみれば、実際、資本市場は、中国企業の台座モデルに誰がより適しているかについて、すでにその足で投票しています。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)