7 か月が経過しましたが、中国の AI モデルは ChatGPT から学習できません

2023-07-05 06:54:34

出典: チタンメディア

著者: 林志佳

画像ソース: Unbounded AI によって生成

ここ数週間の人工知能 (AI) 関連のカンファレンスと同様に、2023 年グローバルデジタルエコノミーカンファレンス人工知能サミットフォーラムでは、起業家や学者が大規模モデルや生成 AI テクノロジーが社会や産業に与える影響について議論しました。

「ここ数カ月間、OpenAIと中国がいつ独自の大規模モデルを作れるようになるかについて誰もが議論してきた。この数カ月で、大規模モデルが次々と登場している。多くの投資家が始めているのがわかる」 360の周宏毅会長はフォーラムでの講演で、大規模モデルの本当のチャンスは中国、特に政府や都市を含むエンタープライズレベルの市場、そして中国の大規模市場にあると述べた。スケールモデルは産業用インターネット開発の機会を捉えるべきです。

Megvii Technology の共同創設者である Tang Wenbin 氏、Zhipu AI の CEO である Zhang Peng 氏、Lianyuan Technology の創設者で清華大学の Huiyan 教授である Zhou Bowen 氏、および他のゲストもこの意見に同意しました。 ChatGPTのような数千億のパラメータを持つ一般的な大規模モデルには多額の資金が費やされているが、代わりにTo B業界に深く踏み込んだ10億レベルの産業を持つ大規模なインダストリモデルを構築する必要があるソリューションを提供し、垂直分野の実際的な問題を解決します。

実際、ChatGPT が中国の AI 大型モデルへの投資と産業開発の盛り上がりを引き起こす中、企業は ChatGPT に倣い、「中国版 OpenAI」になろうと努力しており、現在 80 を超える大型モデルが公開テストされています。

**しかし、問題は、多くの投資家や起業家が、7 か月の「ローリング」の後、大規模モデルの技術的敷居が高くないと気づいたことです。商用ソリューション、一方、ChatGPT の「月額 20 ドル」の Plus メンバーシップサービスは、「無料」にしかならない」と中国では考えられており、OpenAI への継続的な AI 技術投資は中国では実現不可能です。 **

**最終的に、「大きなモデル」の代金を支払えるのは、政府、金融、医療などの複数の垂直分野の顧客だけであることが判明しました。 **

Titanium Media Appは国内AI大規模モデルデータの最新情報を編集・統計

企業はもはや AI 大規模モデル技術と競合せず、商用化に戻る

過去 6 か月ほどにわたって、ChatGPT や GPT-4 に代表される大規模モデルテクノロジーが、世界的な AI イノベーションの新たなラウンドをリードしてきました。国内外の大規模モデル研究は高速で繰り返され、さまざまなモデルが無限に生まれ、モデルの性能は向上し続けています。

中国では、Baidu Wenxin Yiyan、Ali Tongyi Qianwen、Huawei Pangu の大型モデルから、360 スマートブレイン、Zhipu AI ChatGLM などに至るまで、あらゆる分野が大型モデルを構築しています。北京市経済情報化局の江広志局長によると、これまで中国では80以上の大型モデルが発売されており、そのうち北京が約半数（40以上）を占めている。

「私たちは長い間山に登ってきたようですが、ついに新しい峰と新しい夜明けを見ました。」と蒋光志氏はスピーチの中で、過去20年間に私たちはインターネット、スマートフォン、クラウドコンピューティング、ビッグデータ、モノのインターネット、IT テクノロジーにおける一連の大きな変化は、私たちの生産と生活のあらゆる側面を大きく変え、現在、一般的な AI の新時代を迎えています。

ただし、ChatGPTなどの消費者レベルのプラットフォームの支払いモデルと比較して、中国のAI大型モデルは一般に内部テストが無料であり、ユーザーはプラットフォームで内部テストを申請する限り使用ライセンスを取得できます。それだけでなく、「百モデル戦争」では、誰もが大きなモデルを作るため、企業自体や業界との間に壁を形成することが困難であることに加え、AIの計算能力のコストが高く、大きなモデルの商用化は困難です。想像するほど簡単ではありません。

簡単に言えば、国内のAIモデルはOpenAIのビジネスモデルや技術コストとは程遠い。 OpenAIは計算力トレーニングのコストに数億ドルを投資することができるが、これは国内の中小規模のAI企業では達成できず、特にそのほとんどがアプリケーション側に集中している。

「パラメータの量は、実際には弁証法的な問題です。数千億、数兆のパラメータは単にあなたの最高の能力を表していますが、パラメータが高いということは、思考能力と高い計算能力に対する要求がより高いことを意味し、顧客のシナリオは必ずしもそのような高い計算能力要件を必要とするわけではありません」 4Paradigmの創設者兼最高経営責任者（CEO）であるDai Wenyuan氏は今年5月にTitanium Media Appに対し、さまざまな制約と利益を求める企業の下で、To B顧客はコストを選択し始めたと語った。 -効果的な制御された垂直 AI モックアップ。

**2023年グローバルデジタルエコノミーカンファレンスの人工知能サミットフォーラムでは、周宏毅、張鵬、周ボーウェンらゲストが大型モデルの「産業化」と「垂直化」について全般的に言及し、政務、金融などの業界に深く踏み込んだ。、文化創造、医療の拡張、モデルのセキュリティ、信頼性、制御可能性に関する議論。 **

周宏儀氏は、大型モデルの本当のチャンスはエンタープライズレベルの市場にあり、中国は大型モデルに関して産業発展の機会を掴むべきであると考えている。しかし、現在の公開されている大規模モデルが政府、都市、業界などのエンタープライズレベルのシナリオで使用される場合、業界の深さの欠如、データセキュリティの隠れた危険、信頼できるコンテンツを保証できない、高度なトレーニングなどの 4 つの欠点があります。そして導入コスト。

「パブリック大規模モデルには多くのデータセキュリティリスクがあります。各企業独自の内部ノウハウが中核資産であり、パブリックドメイン大規模モデルは間違いなくトレーニングされていません。パブリック大規模モデルの使用はデータ漏洩を引き起こし、良い記事を書くためには、たくさんのアイデアや計画を伝えなければなりません; 公開されている大型モデルは生成 AI であり、独自のアルゴリズムの特徴は、ナンセンスを話すことができることであり、真剣で自信に満ちたナンセンスです. この機能は小説やスクリプトの作成に使用され、チャットロボットとしての効果は非常に優れていますが、企業レベルのシナリオでは非常に問題があります。医療モデルによって処方された処方箋を本当に使用する場合、あなたはあえてそうしますか?信じるか受け入れるか; 公開されている大型モデルではコストを実感できない大型モデルの高コストも誇張されているため制御可能である 1 回のトレーニングに 1,000 万ドルかかるどれくらいの計算能力と何枚のグラフィックスカードが必要か企業内で垂直的な大規模なモデルを作成するのに、包括的な知識や包括的な能力を追求する必要はありません。数百億のモデルで十分かもしれませんが、1000 億から 100 億のパラメータは 10 分の 1 に小さく見えるため、トレーニングと展開のコストが 10 倍以上節約されます。」

周宏毅氏は、エンタープライズレベルの市場が将来本当に必要とする大規模モデルは、工業化、企業化、垂直化、小型化、専有化の特性に適合する必要があると率直に述べた。それだけではなく、エンタープライズレベルの大規模モデルの構築では、次の 3 つの原則に従う必要があると彼の意見では述べています。

セキュリティ: まずセキュリティの原則ですが、大規模モデルにはネットワークセキュリティ、データセキュリティ、アルゴリズムセキュリティなどのリスクがあり、特にコンテンツセキュリティの観点からは、AIGC を使用して詐欺目的でさまざまな偽コンテンツを生成する人もいます。検索エンジンはさらに複雑です。したがって、人工知能のセキュリティの問題は今後検討される必要があります。

信頼性: 2 つ目は信頼性の原則であり、大規模モデルの「錯覚」問題と、企業知識ベースと検索の修正を通じて知識が時間内に更新できないという問題を解決できます。「正確な出力コンテンツの問題を解決するにはどうすればよいでしょうか? ベクトルデータベース、エンタープライズサーチ、外部ナレッジベースによって修正できるようになりました。」

制御可能性: 最後は制御可能性の原則で、大規模モデルがまだ少し信頼できない場合、企業と政府は最初に小さな一歩を踏み出して、大規模モデルを使用することができると示唆しています。 API やプラグインをオープンしていないため、関数パターンは依然としてヘルパーであり、最後の人が意思決定の「ループ」にいることを主張する必要があります。同氏はPPTの中で、「大型の横型をケージに閉じ込める」ために監視と監査の方法を採用する必要があると述べた。

企業が大規模モデルをどのように使用するかについて、周宏儀氏は、企業の大規模モデルはまず一般的な機能をうまく活用し、大規模モデルの最高かつ最も成熟した機能を最大限に活用する必要があり、企業の問題点や厳格なニーズ、小さな削減に焦点を当てる必要があると強調しました。、情報分析や意思決定などの深さ、エンタープライズナレッジの検索と管理、オフィスコラボレーション、インテリジェントな顧客サービスなどのオフィスシナリオが最適なエントリポイントです。

同時に、Zhou Honyi 氏は、大規模モデルを既存のビジネスシステムから比較的独立させ、分離を維持できるように、企業が大規模モデルを使用する場合は、まず「アシスタント」モードと「副操縦士」モードをオンにする必要があると提案しました。これは企業にとってもより安全で、より制御しやすいものです。さらに、AI が包括的であるように、大企業モデルはリーダーと従業員の両方によって使用される必要があります。

「大規模なモデルが単独でジョブを完了するのは常に困難であり、多くの従業員は大規模なモデルに抵抗があります。大規模なモデルが単独でジョブを完了するのは依然として困難です。よりポジショニングするのは人間です。優れたツールとナレッジアシスタントです。したがって、大型モデルの開発は人間中心であるべきです。」周宏儀氏は、使いやすさが大型モデル開発の第一原則であると述べました。

周宏毅氏は、デジタルヒューマンが企業レベルの大型モデルの重要な入り口および運搬形態になると判断した。 360 Smart Brainがリリースした「魂」のデジタルアシスタントは、大型モデルの使いやすさの問題を解決します。現場では、周宏毅氏はカスタマイズされた「北京顧客サービスは尋ねられない」と「北京市商人」も披露した。これは、政府や企業の分野におけるいくつかの中核的なニーズを解決するために北京向けに訓練された2人の大規模なデジタルヒューマンである。

周宏儀氏だけでなく、Zhipu AI CEO の張鵬氏も、商用実装の観点から、Zhipu AI は MaaS (Model As A Service) 大型モデルサービスのコンセプトを提案し、数千億の高精度大型モデルを更新できるようにしたいと述べました。複数の個人や企業が AI のエンパワーメントを享受できます。

「当社には 3 つのバージョンがあります。1 つはエンドツーエンドのモデルトレーニングサービスで、これはすでに自作のコンピューティングパワープラットフォームでモデル移行トレーニングを完了するのに役立ちます。2 つ目はモデル構築サービスとライセンスを提供するもので、3 つ目は「クラウドコンピューティングメーカーと協力する。誰もが強力なインフラストラクチャ機能を迅速に構築できるよう、API 呼び出しとモデルインスタンスサービスを提案する」と Zhang Peng 氏は述べています。

Titanium Media App は、Zhipu AI がパラメータ数を削減しながらデータ品質を向上させる新しい ChatGLM2 大規模モデル製品を開発していることを知り、能力が大幅に向上しました。複数の評価において、ChatGLM2 は GPT-4 および ChatGPT よりも高いスコアを獲得しています。

Lianyuan Technologyの創設者で清華大学のHuiyan教授であるZhou Bowen氏は、Alがビジネスと完全に統合できるかどうかが、Alが経済的価値を実現できるかどうかを決定する重要な要素であると述べた。ビジネス指向の AI 戦略設計、健全なサポート構造、十分な AI 人材、健全な社内トレーニングメカニズムがあって初めて、AI をビジネス開発のニーズと完全に統合し、経済的利益を最大化することができます。

Kunlun Wanwei CEO の Fang Han 氏は、現在、大規模モデルは B 側でコストを削減し、C 側で効率を向上させている状態にあると考えています。

同氏は、中国のBエンドサービス企業は、どの企業もBエンドサービス全体を独占するのは難しいことを理解していると考えている。大規模モデルには業界データが必要であるため、どの大規模モデル企業も 1 つまたは 2 つの業界で先行者として成功することは避けられませんが、すべての業界で成功することはできず、どの企業もデータを入手することは困難です。中国市場の決済習慣は海外とは大きく異なるため、中国ユーザーの自由な習慣は非常に明白です Cエンドユーザーにサービスを提供するすべての企業フリーモードがメインモードであり、VIP モードが補足されます。

「大きな潮流は上昇し、着陸が重要です。私たちは、この起業家精神と一般的な人工知能への投資の波が以前の波とは異なり、より速く着陸してユーザーと収入を生み出すことができることを願っています。」ファン・ハン氏の理論は今でも変わりません。偏った大型モデルの商品化。同氏は、崑崙万偉が開発したAI生成音楽製品がすでに文化・観光分野に進出しており、今年4月に北京東城区と協定を締結したと述べた。

中国電信グループビッグデータ・AIセンター副総経理の張新氏は、同氏が開発したコードの出力とスピーチの作成をサポートするTeleChat大型モデルをその場で発表した。 Zhang Xin氏は、中国電信デジタル技術有限公司の研究開発目標は、10,000レベルのAIアルゴリズムキャビンを構築し、100億レベルのAIサービスプロバイダーになることであると述べ、製品はAIアルゴリズム、プラットフォーム、アプリケーションをカバーしていると述べた。、ハードウェア、および大型モデル。

中国電信が大型モデル製品を発表するのは今回が初めて。 Zhang Xin氏はまた、他の大型モデルと比較して、TeleChat製品のほとんどは中国国内のビッグデータを使用しており、その90％は主に国内のものであり、チャイナテレコムのTianyi Cloudとクラウドネットワーク融合ベースに基づいて、TeleChatはモデルトレーニングパラメータに使用されていると述べた。その時点で、容量は 47% に達する可能性があり、モデルトレーニングの効率とモデルアルゴリズム機能は依然として向上しています。

アプリケーションシナリオでは、人材不足と一部の音声オペレーターのカバレッジ不足の問題を解決するために、チャイナテレコムのテレチャットモデルがメーカーによってインテリジェント化され始めています。 AI テクノロジーの向上により、社会ガバナンス機能の最新化が実現され、コスト消費が削減されます。

Unisound イノベーション部門副社長の Guo Fan 氏は、かつて Unisound と北京友誼病院が共同開発した山と海の大型モデルに基づく外来医療記録生成システムのスマート医療分野での実証応用について言及しました。 Unisound の 700 億パラメータ規模の自動「山と海」大規模モデルを研究し、フロントエンドの音声信号処理、声紋認識、音声認識、音声合成、その他のフルスタックのインテリジェントな音声対話技術と組み合わせることで、改善が期待されています。医師の電子医療記録入力の効率が 400% 以上向上し、1 人の患者の診察時間が 40% 以上節約され、医師の外来サービスの効率が 66% 以上向上しました。

実際、大規模なモデルは通常、勝者総取りの領域になります。より多くの資金、より多くのコンピューティング能力、そしてより優れた人材が必要です。なぜなら、より良いコンピューティング能力はより多くの人がそれを使用することを意味し、より多くの人がそれを使用することはより多くのデータを意味し、より多くのデータはより良いコンピューティング能力の結果を意味するからです。ビッグモデルは、お金と技術、そして何よりもデータを持っている巨人にとっての戦場に違いない。

しかし、新興企業はプロジェクトが多すぎて資金が分散しすぎており、特にエンタープライズ側では、定量化されたエンタープライズ開発プロセスがないまま、Nvidia A100 カードやクラウドサービスを購入するために資金を消費してしまうことになります。特にAI企業やSaaS企業は一般的に利益を上げて血を流すことが難しい中、スタートアップ企業は大型モデルで事業化して利益を上げる必要がある。

したがって、現在の国内AI大規模モデルは、Momoを含むAli、Tencent、Baidu、Huawei、SenseTimeなどの大企業によって設立された汎用の大規模モデルベースとコンピューティングパワーセンターをベースに形を整えつつあります。 Zhixing、Tianyancha、Yunzhisheng、中国 Kewenge や Megvii などの企業によって確立された大規模な垂直または業界ドメインモデルは、中核的な問題を解決するために 1 つまたは 2 つの領域にのみ焦点を当てています。

政府は大規模モデルシーンの上陸を支援

このフォーラムで、北京経済情報局は北京総合人工知能産業イノベーションパートナーシッププログラムの第2期メンバーを改めて発表し、63社が選出された。

6月30日現在、北京国内外の大型モデル研究開発・応用企業計416社が「パートナーシッププログラム」第2陣への参加を申請していることがわかった。最終的に、北京百度網通科技有限公司、中国電力データサービス有限公司、北京時志未来人工知能産業革新基地有限公司など63社が選ばれ、発表された。その中には、コンピューティングパワーパートナー 10 社、データパートナー 10 社、モデルパートナー 10 社、アプリケーションパートナー 24 社、投資パートナー 9 社が含まれます。さらに、30 人のモデル観察者が評価されました。

Titanium Media App の推計によると、現時点で 80 を超える企業や機関が北京総合人工知能産業イノベーションパートナーシッププログラムに選ばれています。

**現在、北京はAIの大規模モデルと産業レイアウトの構築を急速に推進している。 **

5月21日、北京市人民政府は「世界的に影響力のある人工知能イノベーションソースの構築を加速する北京の実施計画（2023～2025年）」に関する通知を発表し、2025年までに北京の人工知能技術革新と産業発展は、新しい時代に入り、発展段階では、基礎理論研究が画期的な進歩を遂げ、独自のイノベーション成果の影響力が増大し続け、人工知能産業の規模が拡大し続け、国際競争力を備えた産業クラスターを形成し、技術的優位性。

5月23日、北京市人民政府総弁公室は「北京における汎用人工知能のイノベーションと開発を促進するためのいくつかの措置」を通知し、政府の指導的役割とイノベーションの触媒的役割を十分に発揮することを求めた。プラットフォーム、イノベーションリソースの統合、要素の割り当ての強化、イノベーションエコロジーの作成、リスク予防を重視し、北京の汎用人工知能を促進してイノベーションのリーダーシップと合理的で健全な発展を達成します。

Titanium Media Appは、政府業務分野でのAI大規模モデルの導入に関する事例や企業の参加が増えていることに現場で気づき、Ali、Huawei、Autohome、Shibui Technologyなどの企業がすべて参加しています。

北京市行政サービス局の担当者はライブ演説の中で、プラットフォーム「Jingce」の構築を支援するために、政府はシナリオ分野で一般的な大規模モデル技術を実装する必要があると述べた。ポリシー管理と正確なサービス機能を向上させます。「市民の訴えに関する膨大なデータの徹底的なマイニングと分析は、指導者の意思決定、草の根のガバナンス、都市のガバナンスに対する強力なサポートを提供します。」

前出の担当者は、シーンの進化に関しては、初期段階ではオープンなスモールインターフェースモデルを採用し、その後民営化された詳細なアプリケーションを実施すると述べた。長期的には、データのセキュリティと制御性を条件に、デジタル保護メカニズムと技術評価を確立することで、高品質で信頼できる政府データセットを公開することになります。

Zhongke Wenge Delivery Center の所長である Wang Zhangsheng 氏は、Titanium Media App とのやりとりの中で、政府機関の顧客は大規模な AI モデルに対する高い要求を持っており、この分野では大規模モデルの適用におけるデータセキュリティとデータガバナンスも必要であると述べました。 - この分野での実際の応用問題をより良く解決するための、質の高いデータトレーニング。

Midu CTO Liu Yidong 氏は Titanium Media App に対し、同社は昨年、政府関係、メディア、その他の分野でのビジネスを開始するために Huawei クラウドインフラストラクチャ製品の使用を開始し、現在、同社は次のような分野に焦点を当てた垂直産業向けの大規模モデル製品をリリースしようとしていると語った。ネット世論。

「政府は『ビッグモデル』に費用を払い始めた。一方で、それは政策誘導であり、実用化シナリオへの要求である。他方では、企業自身がコスト問題や商業化問題を大規模モデルを通じて解決する必要がある。」業界関係者はチタニウム・メディア・アプリに対し、国内の大型模型産業は、AI企業と政府が一体となって商品化し、政府の補助金を受け取る時代に戻りつつあると分析した。

江広志氏は、現在、北京は世界的に影響力のある人工知能イノベーションの源泉を築くため、国家新世代人工知能イノベーション開発実験区と国家人工知能イノベーション応用試験区の建設を加速しており、その具体策としては以下が挙げられると述べた。 3つのポイント:

1 つは、政策の革新と標準的なガイダンスを強化することです。データ量が比較的少ない、品質保証が難しい、収集とラベル付けにかかるコストが高い、コンプライアンスに準拠した使用などの問題を解決します。着陸アプリケーションシナリオに基づいて中小企業をサポートし、多様で低コストで高品質のコンピューティングパワーを取得し、この都市の人工知能企業と関連業界組織をサポートする「コンピューティングパワーバウチャー」政策を計画および導入します。人工知能の国家標準、業界標準、地域標準の策定主導的な役割を果たし、モデルのパフォーマンス、データセキュリティ、プライバシー保護の観点から技術標準の策定に参加します。 2 つ目は、シナリオの公開範囲を増やし、ベンチマークアプリケーションの実装を率先して行うことです。市の政府機関、公共機関、国有企業、その他の公務管理機能を有する組織が、安全で信頼できる大型模型関連製品やサービスを積極的に購入・利用するよう促進し、政府サービスへのアプリケーションの導入を率先して行う。、スマートシティおよびその他の分野、および都市ガバナンス能力の近代化レベルを向上させます。第三は、パートナーシップ計画の深化と強固化を促進することです。現在のパートナーシッププログラムでは、10 社以上のコンピューティングパワーパートナーが、北京の中小規模の人工知能企業が大規模なモデルのトレーニングと推論を実行するために、4000 P 以上の低コストで高品質なコンピューティングパワーを提供する予定です。 10 社のデータパートナーが、大規模な企業トレーニング向けに 500T 近い 18 個の高品質データセットをリリースしました。同時に、大規模モデル産業アプリケーションの促進を加速し、市場指向のドッキングおよび協力プラットフォームであるパートナーシッププログラムの役割を最大限に発揮し、イノベーション、協力、アプリケーションのための良好なエコロジーを構築します。北京の大型模型の展示。

江広志氏は、北京経済情報局が引き続き高品質のリソース要素の割り当てを強化し、革新的なリソースを効果的に統合し、革新的なエコロジーを積極的に構築し、人工知能産業の発展のための強固な基盤を築くと強調した。

「大規模なモデルは 1 つの企業で作成することはできません。全員がコンピューティング能力、モデル、データのレベルでいくつかの大規模なエコシステムを形成することが最善です。特に政府部門の指導の下で、企業はエコシステム内でパートナーシップを形成できます。「誰もが競争よりも協力を重視しています。将来的には、この大型モデルはエコロジー、パートナー、そして双方にとって有利な協力関係を築く可能性があります。」とレジェンドキャピタルのエグゼクティブディレクター、ジ・ハイクアン氏は語った。

原文表示

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

報酬
いいね
コメント
共有

0/400

コメントなし

トピック
Dr.Han Joins Gate Square
21k 人気度
Gate VIP New Upgrade
22k 人気度
Nonfarm Payrolls Update
18k 人気度
4BTC
30327k 人気度
5contentstar
10720k 人気度
6NADA
11186k 人気度
7BOME
11564k 人気度
8BTC
30327k 人気度
9SMILE
9062k 人気度
10比特币
13381k 人気度

ピン

サイトマップ