大型モデルの流行: 最も甘いケーキと最も難しいケーキ

2023-08-11 08:43:43

著者丨白佳佳

アメリカの編集者丨漁師

出典: シリコンベースの研究所

編集者注:

一方では熱狂的、もう一方では冷酷、これが中国大型模型業界の現状であり、この業界には「混沌時代」という呼称が最も相応しいかもしれない。この半年で、技術と人、技術と産業、人類文明と技術文明は新たな復興段階に入った。この変化の背景にはテクノロジーの進歩だけでなく、キーマンやキー企業の昇進もある。

インテリジェント時代の最前線観察者として、テクノロジーに関わるあらゆる話題に注目する「シリコンベース研究所」は、本日より大型模型の解体から始まる「大型模型のカオス時代」の計画をスタートさせます。スケールモデルを作成し、これらの波の最前線にレンズを向けると、企業や人々が独自の洞察を共有し、読者に解釈します。

この記事は、このシリーズ「大規模モデルのアプリケーションの流行: 最も甘いケーキと最も難しいパス」の 2 番目の記事です。第 1 部: 大規模モデルの混沌の時代: 矛盾、差別化、そして未来

画像の出典: Unbounded AI ツールによって生成

「私はあなたたち人間が決して信じられないものを見てきました。オリオン座の縁で軍艦が燃えるのを見ました。タンホイザーの門の近くの暗闇でC線がちらつくのを見ました。これらすべての瞬間は、時間の経過とともに過ぎていきます、まるで海に消えていく涙のように。雨。"

これは映画『ブレードランナー』でレプリカントのロイ・バティが発した最後のモノローグです。

このセリフは後にイギリスの『オブザーバー』誌によって映画史上の古典的瞬間トップ10の6番目に選ばれ、SF作品の代表としてよく引用される。

ある意味、この経過は現実になりつつあります。今、世界中を熱狂させたこの大型模型は、想像を絶するスピードで世界の知識を吸収しており、その背後にある人、物、物の奔流は、『スターヒープ・ウォーズ』ほど地味なものではないかもしれない。

そして、これらすべてを作った学者、技術者、実業家は今も待っています、おそらく彼らは、より洗練された技術探査を何を待ちたいのかわかりませんか？より効率的な生産ツール?もっとお金がもらえるスーパーアプリ?

あるいはロイ・バティのようなレプリカントが、銀河を見上げる人類の絶望的な孤独を和らげてくれる。

来ますか

それは何をもたらしますか

それはどのようにして生まれたのでしょうか？

最初に発芽したのはどこですか？

中国と外国の違いは何ですか？

……

大型モデルが後を絶たない今日、心配したり楽しみにしたりしても手遅れですが、これからも長く付き合っていくパートナーにとって、それを見つめることが最高の歓迎の儀式です。

C サイドが B サイドに転がり、オープンソースがクローズドソースに影響を与える

ChatGPT の登場は、人工知能があなたのドアをノックするようなものです。

ChatGPT は、2022 年 11 月 30 日に一般公開されました。わずか 2 か月で、ChatGPT は月間アクティブユーザー数 1 億人を突破し、史上最も急速に成長しているコンシューマーアプリケーションになりました。

Codeway Dijital は、3 月初めに ChatGPT API をベースにした Chat with Ask AI を開発し、その強力な質疑応答機能により、上半期の収益は 1,600 万米ドル (約 1 億 1,200 万人民元) を超えました。ダウンロード数と収益が最も高い AI+チャットボットトラックとなるアプリケーションです。

**ChatGPT の成功は、C エンドユーザー向けの AI アプリケーションのビジネスロジックが確立され、ユーザーに製品を引き渡し、AI がもたらす無限の可能性を探求することを示しているようです。その過程で、素晴らしい収入曲線も生まれます。その後、出現します。 **

残念ながら、物事はそれほど単純ではありません。

7月4日、Web分析会社Similarwebは、6月のChatGPTの全世界訪問者数が前月比9.7％減、ユニークビジター数が前月比5.7％減というデータを発表した。

ChatCPT に加えて、Character.AI の訪問数も 6 月に急激に減少し、前月比 32% 減少しました。

Character.AI は、芸能人、歴史上の人物、架空の人物の性格を模倣して会話することができ、同様の AI ツールの中で 2 位にランクされています。

この点に関して、Similarwebのアナリスト、デイビッド・カー氏は、「これからはチャットボットがその価値を証明しなければならず、すべてを当然のことと考えてはいけない」と述べた。

ChatGPT と Character.AI へのアクセス数の減少は、C エンドユーザー向けの AI アプリケーションが徐々に上限に達していることをある程度象徴しており、これは次のことを示しています。

**ユーザーは、AI の可能性を独自に探ることにはあまり興味がありませんが、AI をアプリケーションシナリオに深く統合し、「ハンマーを打ち込む」ことが、大型モデルのランディングに必要な条件となります。 **

マイクロソフトは「ハンマーポーター」になる先駆者となった。

ChatGPT の親会社である OpenAI のテクノロジーを使用して、Microsoft は Microsoft 365 Copilot を発表し、7 月 18 日の年次 Inspire カンファレンスで、商用顧客向けに月額 30 ドルの価格を提示しました。

レポートによると、Microsoft 365 Copilot は、朝礼、電子メール、チャット記録から最新情報を生成してチームに送信すること、ユーザーが先週のプロジェクトの進捗状況を理解すること、または社内からの情報を含む、あらゆるビジネスデータについて企業が推論するのに役立ちます。ファイルとネットワークデータから SWOT 分析を作成します。

**マイクロソフトは、独自のシナリオと組み合わせることで、より強固な収益化の道に乗り出しました。これは、今日水 AI をテストしている多くの大企業のモデルでもあります。プロセス全体が閉ループであり、データとモデルは巨大企業間でのみ流れます。。 **

まるで『ブレードランナー』の最先端のロボット製造技術がテイラー社によってしっかりと管理されているかのようだ。

しかし、実際の展開は映画よりもドラマチックであることがよくあります。最近、同じくインターネット大手の Meta がオープンソースの Llama2 基本モデルを発表しました。これは Microsoft Cloud によって配布され、企業による無料の商業利用が可能であり、「」の第一弾を発射しました。反テクノロジー独占」。

評価結果から判断すると、Llama2 は GPT-4 とはまだ一定の差があり、GPT-3.5 とは一長一短ありますが、現在市場で最高のオープンソースモデルです。

しかし、これは正確には何を意味するのでしょうか?

ファーウェイの大型モデルレベルの分割を例にとると、基本大型モデル（言語や視覚などの人間の機能をシミュレート）、業界大型モデル（業界部門に応じて、複数の基本大型モデルの機能が調整される場合がある）に分けることができます。およびシナリオモデル (販売店アシスタント、サプライチェーンロジスティクス、低分子の最適化など、業界の特定のシナリオに対応)。

Meta のオープンソース Llama2 は、基本的な大規模モデルの大規模言語モデルであり、モデルのトレーニングに大量のデータは必要なく、大規模なコーパスのみが必要です。大規模モデルの起業家は、微調整を通じて、対応する業界やシナリオに適した AI アプリケーションを開発できます。

Android システムが Apple 以外の携帯電話のモバイルインターネットエコシステムをサポートしているのと同じように、Llama2 は企業向けの大規模モデルの開発コストを最小限に抑え、企業が独自の産業シナリオにより集中できるようにします。

最近中国で突然爆発的に普及した「Miaoya Camera」は、オープンソースの恩恵を受けている。

Stable Diffusion (SD) は、現在最も注目されている AI ペイントツールの 1 つで、誰でも無料で導入して使用できる無料のオープンソースプロジェクトです。市場予測によると、「Miaoya Camera」の原理は、LoRAモデルプラグインを介して出力されるSD画像のランダム性の問題を解決することです。

LoRA は実際には、無料で公開されているモデル微調整テクノロジーです。 7 月 25 日、Alibaba Cloud は、LoRA の微調整を含む、中国における Llama2 の全バージョンのトレーニングと導入計画を開始しました。

C エンドの消費者に直接直面する ChatGPT から、Microsoft が大規模モデルと独自のシナリオを組み合わせて消費者や企業にプッシュし、さらに企業向けに基本的な大規模モデルと微調整サービスを提供するメタオープンソース Llama2 に至るまで、**大規模モデルを推進するための複数の道筋モデルの上陸の背後には、ビジネスのクローズドループをできるだけ早く開放しようとしている大規模モデルプレーヤーがおり、技術の反復をサポートするための資金撤退の検討も長期的であるAI 産業エコロジーの構築と発言権をめぐる競争への投資。 **

なお、本稿では Microsoft、OpenAI、Meta を例として挙げていますが、これらが該当するパスに限定されるわけではなく、実際、大手企業はテクノロジーと資金の支援を受けて、複数のソリューションを導入できる強みを持っています。これも戦況をさらに不安にさせた。

たとえば、The Informationが7月24日に掲載した記事によると、OpenAIが開発中のオープンソースの大規模言語モデルは現在コードネーム「G3PO」で、リリーススケジュールは社内でまだ決まっていないという。

興味深いことに、フロントフットのザッカーバーグ氏はFacebookで「オープンソースは、より多くの開発者が新しいテクノロジーを使用できるようになるため、イノベーションを促進します...エコシステムがよりオープンになれば、より多くの進歩がリリースされると信じています」と述べましたが、電話会議で数日後、同氏はサービスの再販による収益の一部をマイクロソフト、アマゾン、グーグルなどの大手クラウドコンピューティング企業に請求することを提案した。

データは中国企業にとって最強の堀となる可能性がある

ZhenFund のマネージングパートナーである Dai Yusen 氏は、この大規模モデル起業家精神について独創的なたとえ話をしています。GPT-3 の出現は新大陸の発見に相当し、ChatGPT-4 は新大陸で金を発見することに似ています。

中国企業の追い上げの旅は、新世界と金の在処を知り、OpenAIが船で行くことを知り、船の全体的な外観を知っているが、詳細な地図を持たないようなものである。

したがって、中国の大型モデルプレーヤーにとって、この長い航海中に陸上の物資を見つけることは死活問題です。

ドッキングとは、大きなモデルの着地点を見出し、持続可能なビジネスモデルを形成することです。

国内の人工知能チップと世界水準との間には依然として一定の隔たりがあることは否定できず、チップ制裁の制約もあり、中国企業がコンピューティング能力の規模を拡大するのは難しい。

また、自然言語処理、コンピュータビジョン、オーディオ、マルチモダリティなどのさまざまな大きなモデルを含むアルゴリズム面では、中国が一定の優位性を持っているものの、アルゴリズム自体と計算能力が相互に補完し合うため、一時的には中国も劣勢に立たされている。 OpenAI や他の業界リーダーと同じ立場にあり、一定の距離を置いています。

このような現状において、国内企業はAIの波に乗り遅れたくないなら、データの活用に力を入れなければなりません。

**言い換えれば、このラウンドの競争における中国の大型模型プレーヤーにとっての中心的な障壁の 1 つは、中国市場で形成されたデータに基づいています。 **

大規模なモデル開発のプロセスではデータが決定的な要素であり、データの品質と規模は開発コストとモデルの最終的なプレゼンテーション効果に直接影響します。

しかし、高品質なデータには多くの企業秘密が含まれることが多く、大規模なモデル開発のために他社に提出することはおろか、外部ネットワークにアップロードすることさえ許可されません。

今年3月、韓国メディア「エコノミスト」は、サムスン社内でChatGPTの悪用・悪用に関わる事件が3件発生し、その結果、半導体装置の測定データや製品歩留まりなどのコンテンツがChatGPT学習データベースに保存され、大規模な被害が発生したと報じた。会社への損失。

情報漏洩のリスクや企業間の信頼コストが高いからこそ、海外の大規模モデル企業は大規模モデルの規模を拡大し、産業エコロジーを確立してから申請をフォローするケースが多い。

マイクロソフト、オープンAI、アマゾンなどの企業がホワイトハウスで最近署名した「自発的コミットメントレター」は、ある意味、AIの急速な発展によって引き起こされる社会的懸念への対応であるだけでなく、市場へのシグナルでもある、より多くの社会機関とビジネスの信頼を得ることを望んでいます。

** 話を中国に戻すと、国家権力の指導の下、国有企業や地方政府は大規模モデルに対して比較的オープンであり、アプリケーション、エコロジー、モデル構築が同時に発展しています。 **

例えば、ファーウェイの盤古大型モデルは、山東省最大の埋蔵量と最長の鉱山耐用年数を誇る現代の大規模横坑「立楼炭鉱」に着陸した。

2022年10月、ファーウェイは、鉱山、人工知能、ICTインフラ、スマートパーク、人材育成、スマートウェアラブル、採掘端末、業界シナリオ向けのICTソリューションを本格的に立ち上げるため、山能集団の子会社である雲鼎科技と協力枠組みを締結した。協力。

それ以来、双方の専門家が鉱山の最前線に深く入り込み、大型モデルの適用に深く参加し、実際の生産では、採炭、掘削、主要輸送、補助輸送、輸送など9分野21の専門分野が実施されました。吊り上げ、安全監視、洗掘防止、洗浄、コーキングなどのアプリケーションシナリオが発掘され、モデルを継続的にアップグレードし、今年7月18日に鉱山分野初のAI大型モデルを正式にリリースしました。

Pangu 大型モデルの機能の 1 つは、洗掘防止および圧力解放プロジェクトの標準検証において洗掘防止部門を支援することであると理解されており、これにより手動レビューの作業負荷が 82% 削減され、100 の安全性が達成されます。洗掘防止プロジェクトの受け入れ率 %。

同様の話は、Baidu や HKUST Xunfei などの企業にも起こりました。

今年6月27日、北京市は大規模産業モデルの典型的な適用事例10件の第一弾を発表したが、そのほとんどは都市統治、スマートファイナンス、ヘルスケア、産業近代化などの「ハードコア」分野である。

これらには、BaiduとState Gridスマートグリッド研究ユニットが共同開発した「電力産業NLP大型モデルを搭載した設備運転検査ナレッジアシスタント」が含まれており、電力専門家の単語分割と電力マーケティングに敏感なエンティティ認識のF1指標を9.27までに向上させることができます。 %と13.28%、92.376%と94.947%に達しました。

iFLYTEKと中関村科学研究都市City Brainが共同開発した「Urban Brain Large Model」は、都市ガバナンスデータリソースのアクセスとアプリケーションの制限、都市ガバナンスサービスモデルの一般化能力の弱さ、人工知能時代の情報セキュリティなどの問題を解決する。

**このように中国企業は、産業用大型モデルから一般大型モデルへ移行し、アプリケーションの大規模実装にはどのような大型モデル技術が必要かを検討するという独自の道を歩み始めている。 **

**そして、このプロセスは、高品質なデータ生成に関する業界の一般的なコンセンサスとも一致しています。つまり、AI の普及によって敷居を下げ、同時に業界に AI を導入し、より多くの高品質なデータを蓄積して収集します。そして最後にモデルを前進させます素早く反復します。 **

国内の大規模モデルの適用シナリオが海外と異なる理由は、計算能力やアルゴリズムが優勢ではないことを背景に、国と企業が連携して「データ・モデル・データ」の開発を加速していることにある。「フライホイール。

**そして、このドッキングラウンドで将来の方向性を本当に決定するのは、実際には、高品質、流動性、セキュリティを備えたデータ市場を中国に構築できるかどうかです。 **

先日、中国通信標準協会と中国情報通信技術院は「データベース発展研究報告書（2023年）」を発表し、2022年の世界のデータベース市場規模は833億ドルになると指摘した。中国のデータベース市場規模は59億7000万米ドル（約403億6000万米ドル）億元）となり、世界の7.2％を占める。

2027 年までに、中国のデータベース市場の総規模は 1,286 億 8,000 万元に達し、市場の年平均成長率 (CAGR) は 26.1% になると推定されています。

一番甘いケーキはどこですか?

まとめると、大型モデルトラック全体には 2 つの傾向があります。

** 1 つは、大手企業が C サイドのアプリケーションから B サイドのアプリケーションに移行しつつあることです。一部のプレーヤーは自社のリソースを統合し、データベースから産業アプリケーションに至るフルチェーンのサービスシステムを確立することを選択しています。もう 1 つは大規模なサービスを構築することを選択しています。 -中小企業と統合するためのスケールモデルプラットフォーム有力企業を攻撃するための共同部隊を形成します。 **

**第二に、海外企業は独自のシナリオで大規模モデルを最初に実装し、国内企業は実際の産業と深く統合されてデータフライホイールを形成しています。 **

潮の満ち引きの合間に、AI産業チェーンのアプリケーション層における「最も甘いお菓子」が徐々に浮上してきた。

** 現状から判断すると、言語大規模モデルとビジュアル大規模モデルは、最も明確な商業化の道筋であり、市場で最も集中している大規模モデルです。 **ChatGPT や Miaoya Camera などの消費者向けアプリケーションに加えて、コラボレーションオフィス、画像編集、インテリジェントな顧客サービスなどの分野でも着実に進歩しています。

しかし、こうしたアプリケーションの同質性は比較的高く、OpenAIほどの先進的な技術でなければ効果は大きく変わりませんし、OpenAIであっても顧客を維持するためには継続的に新機能を導入する必要があります。

7 月 20 日と 7 月 21 日、ChatGPT は GPT-4 経由で送信できるメッセージの数を増やし、カスタムコマンド機能を開始しました。

対照的に、マルチプレイヤーオンラインゲーム (MMO) には、やはりグラフィック生成機能に基づいて、業界の障壁が高くなります。 AI のディープラーニング機能は、ゲームの多面的な特性に適合し、現在のゲーム技術開発プロセスで主導的な役割を果たし、プレーヤーに、よりインテリジェントで豊かでパーソナライズされたゲーム体験をもたらします。

ゲームのバージョン番号の安定した配布を背景に、ゲーム業界は短期的には大規模モデルのアプリケーションにとって最も甘いものになることが予想されます。

**長期的には、大型モデルは本質的に業界の品質と効率を向上させるためのツールであり、サービスや製品を購入する顧客の意欲は、大型モデルが活用できるメリットに直接関係しています。したがって、将来的に最も想像力豊かなアプリケーションシナリオを見つけるために、調査する必要がある重要な指標は、業界自体の規模と堀の高さです。 **

「シリコンベース研究室」は、新エネルギー車は将来の大型モデルにとって最も想像力豊かな分野であると考えています。

開発見通しの観点から見ると、新エネルギー車は世界的な「低炭素で環境に優しい」消費傾向に適合しており、石油化学エネルギー消費量の削減に貢献します。

たとえば、2022 年 6 月に EU 27 か国の環境大臣は新たな気候保護法で合意に達し、EU では 2035 年から二酸化炭素排出量がゼロの自動車のみの走行を許可します。

CO2 排出量削減という観点だけを考えれば、大型モデルが活躍できる可能性があります。

運転に加えて、自動車産業チェーン全体自体も主要な炭素排出源であり、金属原料の製錬、国境を越えた輸送、製造、その他のリンクが炭素排出削減の焦点となっています。しかし、複雑な産業チェーン、些細なデータ、幅広い応用シナリオのため、自動車会社が自動車のライフサイクル全体の二酸化炭素排出量を収集して評価することは困難です。

自動車産業チェーンのインテリジェント化に伴い、さまざまなデータがクラウドに送信され、明確な二酸化炭素削減の道筋が徐々に見えてきます。その過程で、大型モデルの「データ」フライホイールが「自動車の 5 番目の「車輪」。リンク間のデータ障壁を打ち破り、産業チェーン内にインテリジェントな経路を形成します。

** 一方で、大型モデルと新エネルギー車の組み合わせは、実はWin-Winの道でもあります。 **

大規模モデルの推論コストが高いことが、多くの企業が推論を躊躇する理由です。テクノロジーの発展に伴い、大きなモデルがクラウドから製品にリリースされ、車自体も搭載チップに基づいてある程度の推論タスクを実行し、その結果をクラウドにフィードバックすることもできるようになりました。車の所有者にとって、これは、新エネルギー車がインターネットに接続されていなくてもある程度の「スマートさ」を維持できることを意味し、これはユーザーエクスペリエンスのボーナスアイテムです。

**ただし、大型モデルが新エネルギー車業界に真のパワーを与えるには、克服すべきいくつかの困難がまだあります。 **

たとえば、データストレージの問題です。

2017 年にはすでに中国で産業ビッグデータブームの波が到来しており、その典型的なシナリオは主要機器の早期警告とメンテナンスでした。平たく言えば、センサーからフィードバックされるデータから機器の停止時期を予測し、どのような機器を交換するかを促すものです。

しかし、実際に導入してみると、完全なデータモデルを形成するには少なくとも 2 ～ 3 サイクルのデータが必要で、ストレージコストだけでも数千万ドルにもなり、企業にとってはリスクが大きすぎることがわかりました。

そして、これは今日でも当てはまります。大型モデルの研究開発とその後の反復には、サポートとして大量のデータも必要となるため、今日の自動車会社は、最初にプラットフォームを構築し、データとビジネスを結び付けてから、大型モデルを使用していくつかのモデルを作成する傾向があります。フィットします。

**第二に、生成大規模モデルと比較して、産業分野では安定性がより重視されます。 **

簡単な例を挙げると、私たちは ChatGPT を使用して詩を書くのですが、それが創造的であることを期待しており、それぞれの作品は異なりますが、産業分野では、それぞれの命令が異なると大きな問題が発生します。

したがって、大規模なモデルと生産ラインの徹底的な統合は、産業用命令を生成したり、特定のリンクの最適化ソリューションを提案したりするためのコードを記述することに似たものでなければならず、実際に生産に介入することは不可能です。

幸は不幸、不幸は福の諺にもあるように、新エネルギー車業界への大型モデル参入の二つの難関は、実は今後この分野で実績をあげる企業にとっての外堀でもある。ストレージ技術の継続的な開発、「ブラックライトファクトリー」などの新しいデジタルファクトリーの出現により、大型モデルを新エネルギー産業に接続することへの抵抗も減少しています。

いくつかの最先端の分野では、両者は化学反応を起こし始めています。

現在、新エネルギー車分野における大型モデルの導入は基本的に自動運転に焦点が当てられており、百度、テスラ、ファーウェイ、グーグルなどが導入している道路上の実証エリア。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。