「私たちは長い間山に登ってきたようですが、ついに新しい峰と新しい夜明けを見ました。」と蒋光志氏はスピーチの中で、過去20年間に私たちはインターネット、スマートフォン、クラウドコンピューティング、ビッグデータ、モノのインターネット、IT テクノロジーにおける一連の大きな変化は、私たちの生産と生活のあらゆる側面を大きく変え、現在、一般的な AI の新時代を迎えています。
「パラメータの量は、実際には弁証法的な問題です。数千億、数兆のパラメータは単にあなたの最高の能力を表していますが、パラメータが高いということは、思考能力と高い計算能力に対する要求がより高いことを意味し、顧客のシナリオは必ずしもそのような高い計算能力要件を必要とするわけではありません」 4Paradigmの創設者兼最高経営責任者(CEO)であるDai Wenyuan氏は今年5月にTitanium Media Appに対し、さまざまな制約と利益を求める企業の下で、To B顧客はコストを選択し始めたと語った。 -効果的な制御された垂直 AI モックアップ。
制御可能性: 最後は制御可能性の原則で、大規模モデルがまだ少し信頼できない場合、企業と政府は最初に小さな一歩を踏み出して、大規模モデルを使用することができると示唆しています。 API やプラグインをオープンしていないため、関数パターンは依然としてヘルパーであり、最後の人が意思決定の「ループ」にいることを主張する必要があります。同氏はPPTの中で、「大型の横型をケージに閉じ込める」ために監視と監査の方法を採用する必要があると述べた。
周宏儀氏だけでなく、Zhipu AI CEO の張鵬氏も、商用実装の観点から、Zhipu AI は MaaS (Model As A Service) 大型モデル サービスのコンセプトを提案し、数千億の高精度大型モデルを更新できるようにしたいと述べました。複数の個人や企業が AI のエンパワーメントを享受できます。
Titanium Media App は、Zhipu AI がパラメータ数を削減しながらデータ品質を向上させる新しい ChatGLM2 大規模モデル製品を開発していることを知り、能力が大幅に向上しました。複数の評価において、ChatGLM2 は GPT-4 および ChatGPT よりも高いスコアを獲得しています。
Lianyuan Technologyの創設者で清華大学のHuiyan教授であるZhou Bowen氏は、Alがビジネスと完全に統合できるかどうかが、Alが経済的価値を実現できるかどうかを決定する重要な要素であると述べた。ビジネス指向の AI 戦略設計、健全なサポート構造、十分な AI 人材、健全な社内トレーニング メカニズムがあって初めて、AI をビジネス開発のニーズと完全に統合し、経済的利益を最大化することができます。
Kunlun Wanwei CEO の Fang Han 氏は、現在、大規模モデルは B 側でコストを削減し、C 側で効率を向上させている状態にあると考えています。
Zhongke Wenge Delivery Center の所長である Wang Zhangsheng 氏は、Titanium Media App とのやりとりの中で、政府機関の顧客は大規模な AI モデルに対する高い要求を持っており、この分野では大規模モデルの適用におけるデータ セキュリティとデータ ガバナンスも必要であると述べました。 - この分野での実際の応用問題をより良く解決するための、質の高いデータトレーニング。
Midu CTO Liu Yidong 氏は Titanium Media App に対し、同社は昨年、政府関係、メディア、その他の分野でのビジネスを開始するために Huawei クラウドインフラストラクチャ製品の使用を開始し、現在、同社は次のような分野に焦点を当てた垂直産業向けの大規模モデル製品をリリースしようとしていると語った。ネット世論。
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
7 か月が経過しましたが、中国の AI モデルは ChatGPT から学習できません
出典: チタンメディア
著者: 林志佳
ここ数週間の人工知能 (AI) 関連のカンファレンスと同様に、2023 年グローバル デジタル エコノミー カンファレンス人工知能サミット フォーラムでは、起業家や学者が大規模モデルや生成 AI テクノロジーが社会や産業に与える影響について議論しました。
「ここ数カ月間、OpenAIと中国がいつ独自の大規模モデルを作れるようになるかについて誰もが議論してきた。この数カ月で、大規模モデルが次々と登場している。多くの投資家が始めているのがわかる」 360の周宏毅会長はフォーラムでの講演で、大規模モデルの本当のチャンスは中国、特に政府や都市を含むエンタープライズレベルの市場、そして中国の大規模市場にあると述べた。スケールモデルは産業用インターネット開発の機会を捉えるべきです。
Megvii Technology の共同創設者である Tang Wenbin 氏、Zhipu AI の CEO である Zhang Peng 氏、Lianyuan Technology の創設者で清華大学の Huiyan 教授である Zhou Bowen 氏、および他のゲストもこの意見に同意しました。 ChatGPTのような数千億のパラメータを持つ一般的な大規模モデルには多額の資金が費やされているが、代わりにTo B業界に深く踏み込んだ10億レベルの産業を持つ大規模なインダストリモデルを構築する必要があるソリューションを提供し、垂直分野の実際的な問題を解決します。
実際、ChatGPT が中国の AI 大型モデルへの投資と産業開発の盛り上がりを引き起こす中、企業は ChatGPT に倣い、「中国版 OpenAI」になろうと努力しており、現在 80 を超える大型モデルが公開テストされています。
**しかし、問題は、多くの投資家や起業家が、7 か月の「ローリング」の後、大規模モデルの技術的敷居が高くないと気づいたことです。商用ソリューション、一方、ChatGPT の「月額 20 ドル」の Plus メンバーシップ サービスは、「無料」にしかならない」と中国では考えられており、OpenAI への継続的な AI 技術投資は中国では実現不可能です。 **
**最終的に、「大きなモデル」の代金を支払えるのは、政府、金融、医療などの複数の垂直分野の顧客だけであることが判明しました。 **
企業はもはや AI 大規模モデル技術と競合せず、商用化に戻る
過去 6 か月ほどにわたって、ChatGPT や GPT-4 に代表される大規模モデル テクノロジーが、世界的な AI イノベーションの新たなラウンドをリードしてきました。国内外の大規模モデル研究は高速で繰り返され、さまざまなモデルが無限に生まれ、モデルの性能は向上し続けています。
中国では、Baidu Wenxin Yiyan、Ali Tongyi Qianwen、Huawei Pangu の大型モデルから、360 スマート ブレイン、Zhipu AI ChatGLM などに至るまで、あらゆる分野が大型モデルを構築しています。北京市経済情報化局の江広志局長によると、これまで中国では80以上の大型モデルが発売されており、そのうち北京が約半数(40以上)を占めている。
「私たちは長い間山に登ってきたようですが、ついに新しい峰と新しい夜明けを見ました。」と蒋光志氏はスピーチの中で、過去20年間に私たちはインターネット、スマートフォン、クラウドコンピューティング、ビッグデータ、モノのインターネット、IT テクノロジーにおける一連の大きな変化は、私たちの生産と生活のあらゆる側面を大きく変え、現在、一般的な AI の新時代を迎えています。
ただし、ChatGPTなどの消費者レベルのプラットフォームの支払いモデルと比較して、中国のAI大型モデルは一般に内部テストが無料であり、ユーザーはプラットフォームで内部テストを申請する限り使用ライセンスを取得できます。それだけでなく、「百モデル戦争」では、誰もが大きなモデルを作るため、企業自体や業界との間に壁を形成することが困難であることに加え、AIの計算能力のコストが高く、大きなモデルの商用化は困難です。想像するほど簡単ではありません。
簡単に言えば、国内のAIモデルはOpenAIのビジネスモデルや技術コストとは程遠い。 OpenAIは計算力トレーニングのコストに数億ドルを投資することができるが、これは国内の中小規模のAI企業では達成できず、特にそのほとんどがアプリケーション側に集中している。
「パラメータの量は、実際には弁証法的な問題です。数千億、数兆のパラメータは単にあなたの最高の能力を表していますが、パラメータが高いということは、思考能力と高い計算能力に対する要求がより高いことを意味し、顧客のシナリオは必ずしもそのような高い計算能力要件を必要とするわけではありません」 4Paradigmの創設者兼最高経営責任者(CEO)であるDai Wenyuan氏は今年5月にTitanium Media Appに対し、さまざまな制約と利益を求める企業の下で、To B顧客はコストを選択し始めたと語った。 -効果的な制御された垂直 AI モックアップ。
**2023年グローバルデジタルエコノミーカンファレンスの人工知能サミットフォーラムでは、周宏毅、張鵬、周ボーウェンらゲストが大型モデルの「産業化」と「垂直化」について全般的に言及し、政務、金融などの業界に深く踏み込んだ。 、文化創造、医療の拡張、モデルのセキュリティ、信頼性、制御可能性に関する議論。 **
周宏毅氏は、エンタープライズレベルの市場が将来本当に必要とする大規模モデルは、工業化、企業化、垂直化、小型化、専有化の特性に適合する必要があると率直に述べた。それだけではなく、エンタープライズ レベルの大規模モデルの構築では、次の 3 つの原則に従う必要があると彼の意見では述べています。
同時に、Zhou Honyi 氏は、大規模モデルを既存のビジネス システムから比較的独立させ、分離を維持できるように、企業が大規模モデルを使用する場合は、まず「アシスタント」モードと「副操縦士」モードをオンにする必要があると提案しました。これは企業にとってもより安全で、より制御しやすいものです。さらに、AI が包括的であるように、大企業モデルはリーダーと従業員の両方によって使用される必要があります。
「大規模なモデルが単独でジョブを完了するのは常に困難であり、多くの従業員は大規模なモデルに抵抗があります。大規模なモデルが単独でジョブを完了するのは依然として困難です。よりポジショニングするのは人間です。優れたツールとナレッジ アシスタントです。したがって、大型モデルの開発は人間中心であるべきです。」周 宏儀氏は、使いやすさが大型モデル開発の第一原則であると述べました。
周宏毅氏は、デジタルヒューマンが企業レベルの大型モデルの重要な入り口および運搬形態になると判断した。 360 Smart Brainがリリースした「魂」のデジタルアシスタントは、大型モデルの使いやすさの問題を解決します。現場では、周宏毅氏はカスタマイズされた「北京顧客サービスは尋ねられない」と「北京市商人」も披露した。これは、政府や企業の分野におけるいくつかの中核的なニーズを解決するために北京向けに訓練された2人の大規模なデジタルヒューマンである。
「当社には 3 つのバージョンがあります。1 つはエンドツーエンドのモデル トレーニング サービスで、これはすでに自作のコンピューティング パワー プラットフォームでモデル移行トレーニングを完了するのに役立ちます。2 つ目はモデル構築サービスとライセンスを提供するもので、3 つ目は「クラウド コンピューティング メーカーと協力する。誰もが強力なインフラストラクチャ機能を迅速に構築できるよう、API 呼び出しとモデル インスタンス サービスを提案する」と Zhang Peng 氏は述べています。
Titanium Media App は、Zhipu AI がパラメータ数を削減しながらデータ品質を向上させる新しい ChatGLM2 大規模モデル製品を開発していることを知り、能力が大幅に向上しました。複数の評価において、ChatGLM2 は GPT-4 および ChatGPT よりも高いスコアを獲得しています。
Lianyuan Technologyの創設者で清華大学のHuiyan教授であるZhou Bowen氏は、Alがビジネスと完全に統合できるかどうかが、Alが経済的価値を実現できるかどうかを決定する重要な要素であると述べた。ビジネス指向の AI 戦略設計、健全なサポート構造、十分な AI 人材、健全な社内トレーニング メカニズムがあって初めて、AI をビジネス開発のニーズと完全に統合し、経済的利益を最大化することができます。
Kunlun Wanwei CEO の Fang Han 氏は、現在、大規模モデルは B 側でコストを削減し、C 側で効率を向上させている状態にあると考えています。
同氏は、中国のBエンドサービス企業は、どの企業もBエンドサービス全体を独占するのは難しいことを理解していると考えている。大規模モデルには業界データが必要であるため、どの大規模モデル企業も 1 つまたは 2 つの業界で先行者として成功することは避けられませんが、すべての業界で成功することはできず、どの企業もデータを入手することは困難です。中国市場の決済習慣は海外とは大きく異なるため、中国ユーザーの自由な習慣は非常に明白です Cエンドユーザーにサービスを提供するすべての企業フリー モードがメイン モードであり、VIP モードが補足されます。
「大きな潮流は上昇し、着陸が重要です。私たちは、この起業家精神と一般的な人工知能への投資の波が以前の波とは異なり、より速く着陸してユーザーと収入を生み出すことができることを願っています。」 ファン・ハン氏の理論は今でも変わりません。偏った大型モデルの商品化。同氏は、崑崙万偉が開発したAI生成音楽製品がすでに文化・観光分野に進出しており、今年4月に北京東城区と協定を締結したと述べた。
中国電信が大型モデル製品を発表するのは今回が初めて。 Zhang Xin氏はまた、他の大型モデルと比較して、TeleChat製品のほとんどは中国国内のビッグデータを使用しており、その90%は主に国内のものであり、チャイナテレコムのTianyi Cloudとクラウドネットワーク融合ベースに基づいて、TeleChatはモデルトレーニングパラメータに使用されていると述べた。その時点で、容量は 47% に達する可能性があり、モデル トレーニングの効率とモデル アルゴリズム機能は依然として向上しています。
アプリケーションシナリオでは、人材不足と一部の音声オペレーターのカバレッジ不足の問題を解決するために、チャイナテレコムのテレチャットモデルがメーカーによってインテリジェント化され始めています。 AI テクノロジーの向上により、社会ガバナンス機能の最新化が実現され、コスト消費が削減されます。
Unisound イノベーション部門副社長の Guo Fan 氏は、かつて Unisound と北京友誼病院が共同開発した山と海の大型モデルに基づく外来医療記録生成システムのスマート医療分野での実証応用について言及しました。 Unisound の 700 億パラメータ規模の自動「山と海」大規模モデルを研究し、フロントエンドの音声信号処理、声紋認識、音声認識、音声合成、その他のフルスタックのインテリジェントな音声対話技術と組み合わせることで、改善が期待されています。医師の電子医療記録入力の効率が 400% 以上向上し、1 人の患者の診察時間が 40% 以上節約され、医師の外来サービスの効率が 66% 以上向上しました。
実際、大規模なモデルは通常、勝者総取りの領域になります。より多くの資金、より多くのコンピューティング能力、そしてより優れた人材が必要です。なぜなら、より良いコンピューティング能力はより多くの人がそれを使用することを意味し、より多くの人がそれを使用することはより多くのデータを意味し、より多くのデータはより良いコンピューティング能力の結果を意味するからです。ビッグモデルは、お金と技術、そして何よりもデータを持っている巨人にとっての戦場に違いない。
しかし、新興企業はプロジェクトが多すぎて資金が分散しすぎており、特にエンタープライズ側では、定量化されたエンタープライズ開発プロセスがないまま、Nvidia A100 カードやクラウド サービスを購入するために資金を消費してしまうことになります。特にAI企業やSaaS企業は一般的に利益を上げて血を流すことが難しい中、スタートアップ企業は大型モデルで事業化して利益を上げる必要がある。
したがって、現在の国内AI大規模モデルは、Momoを含むAli、Tencent、Baidu、Huawei、SenseTimeなどの大企業によって設立された汎用の大規模モデルベースとコンピューティングパワーセンターをベースに形を整えつつあります。 Zhixing、Tianyancha、Yunzhisheng、中国 Kewenge や Megvii などの企業によって確立された大規模な垂直または業界ドメイン モデルは、中核的な問題を解決するために 1 つまたは 2 つの領域にのみ焦点を当てています。
政府は大規模モデルシーンの上陸を支援
このフォーラムで、北京経済情報局は北京総合人工知能産業イノベーションパートナーシッププログラムの第2期メンバーを改めて発表し、63社が選出された。
6月30日現在、北京国内外の大型モデル研究開発・応用企業計416社が「パートナーシッププログラム」第2陣への参加を申請していることがわかった。最終的に、北京百度網通科技有限公司、中国電力データサービス有限公司、北京時志未来人工知能産業革新基地有限公司など63社が選ばれ、発表された。その中には、コンピューティング パワー パートナー 10 社、データ パートナー 10 社、モデル パートナー 10 社、アプリケーション パートナー 24 社、投資パートナー 9 社が含まれます。さらに、30 人のモデル観察者が評価されました。
Titanium Media App の推計によると、現時点で 80 を超える企業や機関が北京総合人工知能産業イノベーション パートナーシップ プログラムに選ばれています。
**現在、北京はAIの大規模モデルと産業レイアウトの構築を急速に推進している。 **
5月21日、北京市人民政府は「世界的に影響力のある人工知能イノベーションソースの構築を加速する北京の実施計画(2023~2025年)」に関する通知を発表し、2025年までに北京の人工知能技術革新と産業発展は、新しい時代に入り、発展段階では、基礎理論研究が画期的な進歩を遂げ、独自のイノベーション成果の影響力が増大し続け、人工知能産業の規模が拡大し続け、国際競争力を備えた産業クラスターを形成し、技術的優位性。
5月23日、北京市人民政府総弁公室は「北京における汎用人工知能のイノベーションと開発を促進するためのいくつかの措置」を通知し、政府の指導的役割とイノベーションの触媒的役割を十分に発揮することを求めた。プラットフォーム、イノベーションリソースの統合、要素の割り当ての強化、イノベーションエコロジーの作成、リスク予防を重視し、北京の汎用人工知能を促進してイノベーションのリーダーシップと合理的で健全な発展を達成します。
北京市行政サービス局の担当者はライブ演説の中で、プラットフォーム「Jingce」の構築を支援するために、政府はシナリオ分野で一般的な大規模モデル技術を実装する必要があると述べた。ポリシー管理と正確なサービス機能を向上させます。 「市民の訴えに関する膨大なデータの徹底的なマイニングと分析は、指導者の意思決定、草の根のガバナンス、都市のガバナンスに対する強力なサポートを提供します。」
前出の担当者は、シーンの進化に関しては、初期段階ではオープンなスモールインターフェースモデルを採用し、その後民営化された詳細なアプリケーションを実施すると述べた。長期的には、データのセキュリティと制御性を条件に、デジタル保護メカニズムと技術評価を確立することで、高品質で信頼できる政府データセットを公開することになります。
Zhongke Wenge Delivery Center の所長である Wang Zhangsheng 氏は、Titanium Media App とのやりとりの中で、政府機関の顧客は大規模な AI モデルに対する高い要求を持っており、この分野では大規模モデルの適用におけるデータ セキュリティとデータ ガバナンスも必要であると述べました。 - この分野での実際の応用問題をより良く解決するための、質の高いデータトレーニング。
Midu CTO Liu Yidong 氏は Titanium Media App に対し、同社は昨年、政府関係、メディア、その他の分野でのビジネスを開始するために Huawei クラウドインフラストラクチャ製品の使用を開始し、現在、同社は次のような分野に焦点を当てた垂直産業向けの大規模モデル製品をリリースしようとしていると語った。ネット世論。
「政府は『ビッグモデル』に費用を払い始めた。一方で、それは政策誘導であり、実用化シナリオへの要求である。他方では、企業自身がコスト問題や商業化問題を大規模モデルを通じて解決する必要がある。」業界関係者はチタニウム・メディア・アプリに対し、国内の大型模型産業は、AI企業と政府が一体となって商品化し、政府の補助金を受け取る時代に戻りつつあると分析した。
江広志氏は、現在、北京は世界的に影響力のある人工知能イノベーションの源泉を築くため、国家新世代人工知能イノベーション開発実験区と国家人工知能イノベーション応用試験区の建設を加速しており、その具体策としては以下が挙げられると述べた。 3つのポイント:
江広志氏は、北京経済情報局が引き続き高品質のリソース要素の割り当てを強化し、革新的なリソースを効果的に統合し、革新的なエコロジーを積極的に構築し、人工知能産業の発展のための強固な基盤を築くと強調した。
「大規模なモデルは 1 つの企業で作成することはできません。全員がコンピューティング能力、モデル、データのレベルでいくつかの大規模なエコシステムを形成することが最善です。特に政府部門の指導の下で、企業はエコシステム内でパートナーシップを形成できます。 「誰もが競争よりも協力を重視しています。将来的には、この大型モデルはエコロジー、パートナー、そして双方にとって有利な協力関係を築く可能性があります。」とレジェンドキャピタルのエグゼクティブディレクター、ジ・ハイクアン氏は語った。