前世代の AI テクノロジーと組み合わせることに加えて、大規模モデルのトレーニング プロセスと高品質の業界データを組み合わせるのも重要な部分です。
たとえば、Tianyun Data は AI PaaS プラットフォームにサービスを提供するハイブリッド データベースとして 10 年以上を経て、現在は大規模モデルと組み合わせる段階に達しています。
Tianyun Data の副社長である Li Congwu 氏は、データ自体と大規模モデルの組み合わせは 2 つの側面から検討されると述べました。1 つは、プライベート ドメイン データと大規模モデルをどのように組み合わせるかということです。たとえば、Tianyun Data は、中国証券監督管理委員会向けの同様の政策解釈プロジェクトを完了しており、規制、判例、解釈などのさまざまなデータを組み合わせることで、裁判所の罰則プロセスと同様の違反の解釈を生成しています。違反の原因。
次に、Tianyun Data はハイブリッド データベースを開発しており、中国で最も早くから開発されている企業の 1 つです。 Tianyun Data は 2018 年頃から AI ネイティブ データベースの概念を提案しており、これは実際には今日の大規模モデルをサポートするベクトル データベースに似ており、Tianyun Data は自社開発のベクトル データベースをリリースし、それを独自のモデルに適用しました。
Xianfeng の副社長である Li Kang 氏は、かつてインタビューで「Jiazi Guangnian」に喩えましたが、それは今日でも当てはまります。「国内の起業家が抱える多くの問題を説明するために OpenAI の成功を利用するのは不公平です。 「それは二人でトランプをするようなものだ。違うんだ、相手が突然ビッグハンドを出してストレートフラッシュになったんだ、相手は上手にプレーしたと言うだけだ、私は慎重すぎたのに、どうして私が勝ったときに言わなかったの?」
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
大型モデルはここ半年で高騰、リアルマネーを支払った投資家は少数
著者|劉陽南
出典|Jiazi光年
「中国版OpenAIになる」と叫んでから136日目、Wang Huiwen氏はLight Years Awayを美団に売却した。
2023 年 6 月 29 日、美団は香港証券取引所で、2023 年 6 月 29 日に「Light Years Beyond」の株式の 100% を完全取得すると発表しました。 買収総額には、現金 2 億 3,367 万 3,000 ドル + のコミットメントが含まれます。負債3億6,692万4,000人民元+1元、合計約20億6,500万元。
中国の偉い人が設立した初の大規模模範的新興企業がこのような結末を迎えるとは想像しがたく、この結末は市場に無数の疑問と憶測を残した。
ビジネス全体の観点から見ると、何光年も離れた場所からの Meituan の買収は、企業間でよくある買収にすぎません。しかし、国内のAI業界にとって今回の買収は、わずか半年で盛り上がったAI大規模起業の波が冷めつつあることを示しているようだ。
資本市場は業界の水温をより直感的に認識します。 6月26日以来、HKUST Xunfei、Kunlun Wanwei、360などのAIコンセプト株が一斉に急落した。
中国に限らず、かつて群がっていたChatGPTに人々が追い求めなくなりました。
ウェブサイトデータ分析ツールSimilarWebのデータによると、初期段階におけるChatGPTの訪問者数の伸び率は驚くべきもので、前月比伸び率は1月が131.6%、2月が62.5%、3月が55.8%でした。 4 月には前月比伸び率が 12.6% と大幅に減速し、5 月にはこの数字はわずか 2.8% にとどまりました。
大型モデルの人気が去ったとき、人々は「大型モデルはビジネスを始める良い機会なのか?」という疑問を思い浮かべがちです。
明らかに、この質問に対する標準的な答えはなく、偉い人の意見ですらかなり異なります。つい数日前、チーターモバイルの会長兼最高経営責任者(CEO)の傅勝氏とGSRベンチャーキャピタルファンドのマネージングディレクターである朱暁胡氏が、この件について友人の輪の中で「議論」した。
6月16日に開催されたチャイナ・フィルム・キャピタルの2023年年次会議では、チャイナ・フィルム・キャピタルの投資家と、投資先のハードテクノロジー企業およびコンシューマーテクノロジー企業の間で、業界が大型モデルとAIGCをどのように受け入れるかについて白熱した議論が行われた。
「Jiazi Guangnian」の観点から見ると、大型模型市場は合理的な声を緊急に必要としており、革新のペースを止めることはできず、多くの問題はまだ解明されていません-大型模型を鋳造できるかどうか?キャスト方法は?大きなモデルに参入する際の問題点は何ですか?今後の大型モデルの商用化は、以前のAI業界の失敗を繰り返すことになるのだろうか?
人々がどれほど心配していても、業界が大きなモデルを採用するのはほぼ当然のことですが、問題はどのような形で採用されるかです。
1. 賢明な投資家
Baichuan Intelligent、Lianyuan Technology、Lingxin Intelligent、Xihu Xinchen、MiniMax... 2023 年の初めから現在まで、国内の大型スタートアップ企業が次々と誕生しており、各起業家のバックグラウンドは十分に明るく、各企業の強みが高度に資本化されており、側も承認しています。
当時は、あるスター起業家が会社を辞めて起業し、巨額の資金を獲得するために大型モデルに参入することも珍しくありませんでした。
例えば、6 月 1 日、国内の大型モデルの新興企業である MiniMax が 2 億 5,000 万米ドルを超える資金調達ラウンドを完了しようとしており、同社の評価額は 12 億米ドルを超えたと報じられた。
当時、美団に買収されたばかりの光年遠方の資金調達のニュースはさらに混乱を招き、王恵文氏は同社がソースコード、テンセント、五源、蘇華から2億3000万米ドルの資金提供を受けていたことを一度否定した。しかし、この融資は最終的に拒否され、美団による買収発表により承認されました。
起業家を求める投資家のこの波により、このビッグモデルが国内のAIベンチャーキャピタル界全体を活性化させるのではないかと人々は考えたが、実際はそうではない。実際、独自の後光を持つスターチームを除いて、投資家は大規模な起業家精神を様子見して検討する可能性が高く、実際にお金を使う人は少数です。
当時、AI 分野では「ChatGPT は人工知能の世界で iPhone の瞬間となるのか?」という熱い議論がありました。この点に関して、Xianfeng 氏が出した答えは、結論を急ぐべきではないということです。 Xianfengの副社長、Li Kang氏は「この影響がどれほど大きいかはまだ分からないが、(大きなモデルが)間違いなく何かを変えるだろうと考えている」と述べた。
しかし、一部の投資機関はこの大規模モデルに懸念を表明している。あるプライマリーマーケット投資家は「Jiazi Guangnian」に対し、中国の過剰反応を非常に懸念していると語った。 ChatGPTの発生後、国内のAIコンセプト株が爆発した。 「私たちの発行市場と流通市場は、注入された関連投資が相応の利益を生み出すことができるかどうかを考慮する必要があります。それが短期的な利益のためであれば、この種の投資は最終的には簡単に無駄になります。なぜなら、テクノロジーの開発を実際に促進していないからです」 、しかしそれは概念的な投資です。」
同氏の見解では、投資家は人類の将来に影響を与える、より基礎的な科学の探究に注力すべきであり、これこそが潜在的な市場価値を秘めた真の技術力であるという。 「市場のダイナミクス、市場価値、実際の将来の社会の進歩と統合する必要がある。盲目的に従ってはいけない。何が未来を変える可能性があるのかを明確に理解する必要がある。それは波の中のバブルであってはいけない。」
しかし、FA実務家は「最近、投資家が徐々に大規模なモデルプロジェクトに投資し始めているが、金額は大きくない」と『佳子光年』に語った。
華英資本のマネージングパートナー、張高南氏は、投資家の慎重な姿勢について「本質的な問題はまだ認識が不十分だ」と独自の理解を示した。同氏はさらに、「大規模モデルを明確に定義できる人はほとんどいない。議論する前に大規模モデルの境界を定義する必要がある。あなたが言及した大規模モデルと私が言及した大規模モデルはおそらく同じものではない。」と述べた。
一部の人々の見方では、投資家の慎重さは大規模な起業家精神にとってマイナスのシグナルである可能性があり、それが大規模モデルに冷水を浴びせている。しかし、客観的な観点から見ると、慎重さは拒絶を意味するものではなく、深く考えた後の合理的な抱擁の方が貴重です。
投資家、起業家、または大規模モデルを活用して自社のビジネスを変革しアップグレードしたいと考えている従来の企業であっても、実際に大規模モデル市場に参入する前に、2 つの問題を明確にする必要があります。それは、大規模モデルの機能の境界は何か、そして大規模なモデルを導入する必要があるかどうか?
2. 大きなモデルを採用する前に、2 つの質問を明確にしてください
新しいテクノロジーが登場したとき、ビジネスの世界で最も重要な疑問は、「このテクノロジーをどこでどのように使用できるのか?」ということです。
これは大型モデルにとって特に重要であり、大型モデルに本格的に参入していない企業にとっては慎重に検討すべき問題でもあります。
この質問に答えるには、まず大規模モデルの機能境界を明確にする必要があります。
大規模モデルの特徴は、モデル内部のアルゴリズムが巨大なブラックボックスであり、その生成プロセスが説明不能かつ予測不可能であるため、その機能境界を定義することが困難であるという点です。しかし確かなことは、汎用大型モデルが万能薬ではないということだ。
Zhiyuan Research Institute の副社長兼チーフエンジニアである Lin Yonghua 氏は、かつてシェアリングの中で、産業実装の観点から、「ビッグモデル + 迅速な学習」がすべてを置き換えることはできないと述べました。
彼女はさらに、多くの特定のタスクや新しいタスクでは、ヒント学習により、大規模なモデルが複数回のヒントを通じて必要な結果を出力できる可能性があるが、大規模なモデルはこのプロセスを「記憶することができず」、開発者がヒント全体を追加した場合に、それぞれの呼び出しは、一方ではそれがますます長くなり、大規模なモデルのコンテキスト能力を超える可能性がありますが、他方では、必然的に各推論のコストの増加につながり、その効果は困難になりますコントロールすること。この不安定性は、リアルマネーを投資した製品の着陸段階ではさらに致命的です。
国家音声イノベーションセンターの首席専門家である張一天氏も、2023年の華英資本の年次総会で次のように述べた。「大きなモデルは生成ロジックであり、それが与えるのは最適な語彙クラスタリングだけであり、原因や語彙のクラスタリングはありません。得られるのは「結果」であり、それを特定する必要がある「答え」ではないため、大規模モデルが教育、医療、医療などの深刻な分野に直接適用できるかどうかは重要です。 「正義が問題になるかもしれない。しかし、意思決定を支援するという意味では意味がある。直接的に結果を生み出すという意味では、事業化して製品化するには、まだまだ道は遠いと思う。」
したがって、将来的には各業界が独自の垂直モデルを持ち、一般モデルの機能と自社の業界データをどのように統合するかが重要なポイントとなるという業界のコンセンサスがあります。
しかし、大規模モデル プロジェクトの実施を実際に検討する前に、起業家は、より重要だが見落とされがちな問題、つまり大規模モデルは企業にとって「必要なもの」なのか?を検討する必要があります。
これに関して、国内のマルチモーダル大規模モデルチームはかつて「Jiazi Guangnian」に対し、大規模モデルが企業にとって「ちょうど必要」であるかどうかを多角的に理解する必要があると語った。一部の企業にとって、大規模モデルを導入しないことは市場競争で大きく優位性を失うことと同等であり、顧客の支持を得るために大規模モデルを使用する必要がある、これも「必要性」です。
しかし、これはある程度、新興テクノロジーの初期の市場センチメントに近いものです。長期的には、新興テクノロジーの産業化は基本的にビジネス ニーズによって推進されることになります。現時点では、企業に大規模なモデルが必要かどうかは、複数の要素を考慮する必要があります。
特定のプロジェクトの実装の問題に加えて、企業はデータ セキュリティの問題や大規模モデルが元の市場構造に与える影響も考慮する必要があります。
この 2 つの問題は、情報化・デジタル化の時代に頻繁に現れ、根絶することはできませんが、インテリジェント化の時代では、これらの問題はより微妙な形で現れる可能性があります。
「多くの消費者企業やプラットフォームベースの企業が、遠慮なくビッグモデルを採用すると、ビッグモデルは業界から反発する強力な力を持っています。それは、業界が容易に業界から引き継がれることを意味するからです。参入閾値と認識キー」と張儀天さんは語った。
デジタル変革の文脈では、ほとんどの業界がビッグデータやクラウドコンピューティングなどのテクノロジーを通じてデジタル変革とアップグレードを実現しています。しかしその一方で、従来型企業は大量の業界データをデジタル技術メーカーに引き渡し、デジタル技術プロバイダーは業界において無視できない主体となり、本来の市場構造が変化してきました。
しかし、工業や建設などの業界ではデータ量が少なく、事業分野間でデータを接続することが難しいため、従来の企業は依然として高い競争障壁を維持しています。
張一天氏は、「現在、建設業界はデジタル化の観点から最も保護されている業界だ。今や建設業界の情報化には、予算を立てることができるグロドンを除いて、いかなる巨大企業も介入できない。なぜだろう?建築には設計図面、建設図面、保守図面、計画図面、ファイリング図面、その他の 8 つの図面がありますが、すべての図面は相互に接続されておらず、政府部門は相互に認識していません。 「建物全体の高さが十分に高いため、建設業界はこの種の競争の多様化を維持してきました。私たちは通常、競争の多様化が産業発展の活力と力の源であると考えています。」
したがって、大規模モデルの波の中で、業界標準や競争優位性が完全ではない企業にとって、無条件に大規模モデルを採用するかどうかは、各企業が慎重に検討する必要がある問題です。
3. 大規模モデルのエンジニアリング実装には標準的な答えはありません
大規模モデル市場にリアルマネーを投資した参入者にとって、次にやるべきことは、実際のプロジェクト実装の問題を解決することです。
この点で、業界では、将来、大型モデルと小型モデルが産業実装の過程で相互に補完し合うようになるというコンセンサスが徐々に形成されてきました。
Lin Yonghua 氏はかつて、高精度と低い一般化機能を必要とする狭い領域のシナリオの方が、「小規模モデル + 転移学習」パラダイムに適していると述べました。工業用検査、工業用品質検査、医療画像解析など
さらに、Huayuan Computingの創設者であるXuan Xiaohua氏は、将来のAI企業のビジネスモデルは、ビッグデータを活用した一般的なビッグモデルと、垂直産業向けの知識を活用したスモールデータモデルを統合し、次の2つを達成することであると述べた。車輪駆動。
Zhang Gaonan氏はまた、「Jiazi Guangnian」に次のように語った。「企業が独自のモデルを最適化したり、垂直モデルをトレーニングしたりする場合、大規模なモデルと組み合わせることができます。大規模なモデルのような高次元のデータは必要なく、完全に適用する必要もありません」 「しかし、大規模モデルのテクノロジーを他のテクノロジーと組み合わせて、低いコンピューティング能力要件で業界の垂直モデルを形成できることは有益であり、それは決して大規模モデルの単純な応用ではありません。」
例えば、繰り返し批判されている大規模モデルの「錯覚」問題については、短期的に解決するには前世代のAI技術を組み合わせる必要があるかもしれない。
「幻覚には多くの理由がありますが、特定の領域でデータが比較的まばらで不十分であることが考えられます。この場合、トレーニングのためにモデルにさらに多くのデータを提供する必要があります。また、ユーザーが質問するときは、より多くのデータを明確に提供する必要があります」背景情報は、幻覚を軽減したり、「温度」を下げる方法でもあります。場合によっては、質問が十分ではなく、背景や前提が不足しているために幻覚が発生することがあります。したがって、質問も非常に重要であり、エンジニアリングが鍵となります。さらに、ユーザーが本当に正確な問題を 100% 解決したい場合は、依然としてナレッジ グラフを使用する必要があるかもしれません。ナレッジ グラフは、論理的推論の正確性を保証するだけでなく、責任者のヤン・レクン氏が提案した「ワールド モデル」を含む新しいテクノロジーも保証できます。 」と、Jinyou.com の CTO、Wu Xuening 氏は述べています。
前世代の AI テクノロジーと組み合わせることに加えて、大規模モデルのトレーニング プロセスと高品質の業界データを組み合わせるのも重要な部分です。
たとえば、Tianyun Data は AI PaaS プラットフォームにサービスを提供するハイブリッド データベースとして 10 年以上を経て、現在は大規模モデルと組み合わせる段階に達しています。
Tianyun Data の副社長である Li Congwu 氏は、データ自体と大規模モデルの組み合わせは 2 つの側面から検討されると述べました。1 つは、プライベート ドメイン データと大規模モデルをどのように組み合わせるかということです。たとえば、Tianyun Data は、中国証券監督管理委員会向けの同様の政策解釈プロジェクトを完了しており、規制、判例、解釈などのさまざまなデータを組み合わせることで、裁判所の罰則プロセスと同様の違反の解釈を生成しています。違反の原因。
次に、Tianyun Data はハイブリッド データベースを開発しており、中国で最も早くから開発されている企業の 1 つです。 Tianyun Data は 2018 年頃から AI ネイティブ データベースの概念を提案しており、これは実際には今日の大規模モデルをサポートするベクトル データベースに似ており、Tianyun Data は自社開発のベクトル データベースをリリースし、それを独自のモデルに適用しました。
一般に、大規模モデルのエンジニアリング実装に対する標準的な答えはありません。
人工知能の道において、中国は間違いなく他国とは異なる道を切り開くだろう。 2 つのパスの長所と短所を区別することは困難であり、これらは異なる国家条件の下での現実的な選択に基づいています。
Xianfeng の副社長である Li Kang 氏は、かつてインタビューで「Jiazi Guangnian」に喩えましたが、それは今日でも当てはまります。「国内の起業家が抱える多くの問題を説明するために OpenAI の成功を利用するのは不公平です。 「それは二人でトランプをするようなものだ。違うんだ、相手が突然ビッグハンドを出してストレートフラッシュになったんだ、相手は上手にプレーしたと言うだけだ、私は慎重すぎたのに、どうして私が勝ったときに言わなかったの?」
張一天氏は、中央政府の観点から、人工知能問題を含む大規模モデルは世界的な競争で主導権を握るための重要な戦略ツールであり、我が国の科学技術の飛躍的な発展を促進する重要な戦略であると共有した。工業化の最適化とアップグレード、そして生産性リソースの全体的な飛躍。
「中国共産党第20回党大会の報告書が産業問題について語ったとき、人工知能を新世代の情報技術とは切り離して提案した。したがって、政策の観点から、人工知能と大規模な「スケールモデルは技術的な問題や産業的な問題であるだけでなく、国民経済の中核的な競争でもあります。より深い観点から見ると、権力の問題は政治的な問題であり、誰もがこの問題をより高い観点から理解する必要があります。」
もし私たちが中国を飛び出して技術開発のタイムラインを延長した場合、ChatGPTによって引き起こされた騒動は人工知能技術開発の歴史の中では単なる点にすぎず、すべての判断が時期尚早である可能性があります。
結局のところ、長年人工知能研究の最前線に身を投じてきた技術者ですら、人工知能の将来について未だに合意に達しておらず、深い不安を抱えているのです。
最近人気のある本「なぜ偉大さは計画できないのか」の中で、著者のケネス・スタンレーとジョエル・リーマンは次のように書いています。「AI の目標を追求する上で、経験則が信頼できるガイドになり得るかどうかを判断できないという不快な事実に私たちは直面しなければなりません」 。」
つい最近閉幕した2023年の北京知源会議でも、知源研究所所長の黄鉄軍氏も同様の不安を抱いていた。彼は閉会式のスピーチのタイトルとして「閉ざすことができない」という4つの言葉をそのまま使った。彼は、「我々は不確実な状態にある。このNear AGIは我々よりも強いのだろうか?我々よりも賢いのだろうか?それともいつ我々を超えるのだろうか?分からない。我々は完全にアウトな状態にある」と語った。コントロールの。」
閉会の挨拶の最後は、「大型モデルに投資するのと同じくらいの熱意を持ってリスクに対処できれば、少なくとも未来を掴むことは可能だ。しかし、人間にそれができると思いますか?」と締めくくった。それ? 分かりません。」
あらゆる技術や業界を見ても、第一線の基幹技術者の「制御喪失感」は他の分野ではあまり見られないものです。今ではほとんどの人が石を感じながら川を渡っています。今日市場に参入するすべての企業は、技術未開の地のパイオニアとなる可能性を秘めています。
そして時間はすべてを証明する最良の証拠です。