Baidu の創設者である Robin Li 氏は、長い間公に次のように述べてきました。「新興企業が ChatGPT を再作成することはあまり意味がありません。この大きな言語モデルに基づいてアプリケーションを開発する素晴らしい機会があると思います。車輪を再発明する必要はありません。車輪を手に入れたら、車を作ることができます。」、飛行機、その価値は車輪よりもはるかに大きいかもしれません。
Cheetah Mobile の会長兼 CEO である Fu Sheng 氏は、大型モデルには 2 つの道があると考えています。 Getting Better と呼ばれる大きなモデルは、「Building an Einstein」です。しかし、多くの仕事は「アインシュタイン」を必要とせず、大卒者でも可能です。これは別の方法です。 「民間の大型模型」を作っている人はきっとたくさんいるはずだと思います。
アプリケーションの面では、Baiduは最近AIGC分野でLenovoと提携に達し、Lenovoのプライベートカスタマイズ事業はBaidu Wenxin Yigeを全面的に導入し、消費者は公式WebサイトでAIGCをテーマにしたペイント活動を通じてラップトップの外観をカスタマイズできる。 Huawei Cloud Pangu Large ModelとMeitu Visual Large Model MiracleVisionは共同で、衣料品の電子商取引効率を効果的に向上できるAIモデルフィッティング機能を開始しました。
ゴールド ラッシュ時代の比喩をもう一度見てみましょう。「この時代は、ゴールド ラッシュの時代と非常によく似ています。当時、金を採りにカリフォルニアに行ったら、多くの人が死ぬでしょう。しかし、スプーンやシャベルを売る人は死ぬかもしれません。」これもまた真実で、Qiji Chuangtan の創設者兼 CEO である Lu Qi 氏は、最近起業家たちとこう語った。 Lu Qi は、中国の起業家がこの歴史的な転換点を認識し、今日の時代の座標を特定し、自らの立場を見つけるのを支援したいと考えています。
ビッグモデルバトルが本格化? 「小型モデル」が解決策かもしれない
テキスト: Qingcheng Finance、著者: Qing Mu 編集者: Liu Zi
OpenAIは7月26日、ChatGPTのAndroid版をリリースし、現在は米国、インド、バングラデシュ、ブラジルでのみ利用可能だが、来週より多くの国でAndroid版ChatGPTの提供を推進するとも発表した。これにより、最近あまり人気がなくなっていた ChatGPT が再び世間の注目を集めるようになりました。
ChatGPTのローンチ当初、わずか2カ月でユーザー数1億人を突破する史上最速のアプリケーションとなった 長い間沈黙していた世界のテクノロジー市場が再び沸騰しつつある 国内の投資家や起業家がシリコンに飛んでいるバレーは尋ねた。
このAIの激動の波に直面して、中国の起業家や投資家は迅速に行動を起こしました。それから数カ月が経ち、中国テクノロジー産業は「百モデル戦争」の壮絶な態勢を見せている。 2023年上半期に中国では80以上の大型モデル製品が登場しており、最新データによると、すでに130社が国内市場で大型モデルを製造している。世界規模で見ると、今年上半期には400以上の大型モデルが新発売された。
中国の大型模型プレーヤーは商業的利益とテクノロジーの未来を追い求めている一方で、中国版OpenAIとなるための国民感情とも呼ばれている。
7月24日のニュースによると、Android版ChatGPTの公開に先立ち、IDCは大規模モデルの技術力評価レポートを発表し、Baidu Wenxin大規模モデル3.5が12指標中7点を獲得し、総合スコアで1位となったという。 Baidu 副社長の Wu Tian 氏は、Wenxin Yiyan 3.5 の新バージョンの機能は ChatGPT 3.5 の機能を上回り、我が国の関連技術開発における重要なマイルストーンであると述べました。
HKUST Xunfeiは以前、10月24日にXinghuo大型モデルの3回目の反復を実施し、ChatGPTを完全にベンチマークし、中国語能力はGPT3.5を超え、英語能力はGPT3.5と同等であると発表した。
01 シーン、シーン
実際、元 Google の科学者で Mobvoy の創設者兼 CEO である Li Zhifei 氏が述べたように、中国には OpenAI のような組織は存在しないかもしれません。
ChatGPTなどの汎用大規模モデルと比較して、国産大規模モデル製品は、垂直型大規模モデル、産業用大規模モデル、産業用大規模モデルといったアプリケーションやシナリオを重視しています。この点に関しては、テクノロジーベンチャーキャピタル界の大物たちの意見もほぼ同じ意味を表していた。
Baidu の創設者である Robin Li 氏は、長い間公に次のように述べてきました。「新興企業が ChatGPT を再作成することはあまり意味がありません。この大きな言語モデルに基づいてアプリケーションを開発する素晴らしい機会があると思います。車輪を再発明する必要はありません。車輪を手に入れたら、車を作ることができます。」、飛行機、その価値は車輪よりもはるかに大きいかもしれません。
GSRベンチャーキャピタルのマネージングディレクターであるZhu Xiaohu氏はモーメンツで次のように書いている:「来年GPT-3.5はコモディティ(一般的なインフラストラクチャ)になり、3年後にはGPT-4もコモディティになるだろうから、一般的なモデルについて迷信を持たないでください」ほとんどの起業家にとって、シナリオが第一、データが王様です。」
Cheetah Mobile の会長兼 CEO である Fu Sheng 氏は、大型モデルには 2 つの道があると考えています。 Getting Better と呼ばれる大きなモデルは、「Building an Einstein」です。しかし、多くの仕事は「アインシュタイン」を必要とせず、大卒者でも可能です。これは別の方法です。 「民間の大型模型」を作っている人はきっとたくさんいるはずだと思います。
ファーウェイクラウドの張平安最高経営責任者(CEO)は盤古大型モデル3.0の記者会見で、「盤古大型モデルには詩を書いたりおしゃべりしたりする時間がない。パラメータがどれほど多く、対話能力がどれほど優れていても、それができるなら」と語った。実際の問題を解決しないと、あまり役に立ちません。」
最近中国で発売された大型モデルは、JDが発売したYanxi大型モデルやDaoが発売した教育分野の縦型大型モデル「Ziyue」など、垂直産業向けのモデルが多い。
京東延西大型モデルは、京東が小売、物流、健康、金融などの業界で長年蓄積した知識を蓄積しており、一般データの70%と京東オリジナルのサプライチェーンデータの30%をトレーニング用に統合し、製品の推奨事項や財務政策をもたらします。 , 財務管理ルールや物流経験などの分野での能力。京東クラウド事業部の曹鵬社長は、単一の大規模モデル技術自体が直接価値を生み出すことはできず、技術は現場に投入されて初めて実際の価値を生み出すことができると考えている。
Ctripの旅行モデルは、200億の非構造化観光データをスクリーニングし、Ctripの既存の構造的リアルタイムデータと、Ctripの歴史的に訓練されたロボットと検索アルゴリズムを組み合わせて、自社開発の垂直モデルトレーニングを実施し、多大な人的資源を投資して一般的な応答を生成および検証することを要求します。旅行の内容。シートリップの創業者で取締役会会長の梁建章氏は、シートリップは大型モデルへの投資を惜しまず、投資額に制限はないと述べた。
アプリケーションの面では、Baiduは最近AIGC分野でLenovoと提携に達し、Lenovoのプライベートカスタマイズ事業はBaidu Wenxin Yigeを全面的に導入し、消費者は公式WebサイトでAIGCをテーマにしたペイント活動を通じてラップトップの外観をカスタマイズできる。 Huawei Cloud Pangu Large ModelとMeitu Visual Large Model MiracleVisionは共同で、衣料品の電子商取引効率を効果的に向上できるAIモデルフィッティング機能を開始しました。
垂直大規模モデルは、一般的な大規模モデルのようなパラメータや計算能力に対する高い要件はありませんが、シナリオやデータに対する要件が高く、開発者には専門的な知識、豊富な業界アプリケーション実践の蓄積、およびエラーに対する許容度が求められます。また、AI には超安定性と信頼性が求められます。したがって、垂直産業に近づくほど、垂直モデルの利点が大きくなります。
「一般的な大規模モデルは、100 のシナリオで問題の 70% ~ 80% を解決できますが、企業の特定のシナリオのニーズを 100% 満たすことはできない可能性があります。企業が大規模なインダストリ モデルと独自のデータを利用して、可用性の高いインテリジェント サービスを作成するための専用モデルを構築できます。また、モデル パラメータは一般的な大規模モデルよりも少なく、トレーニングと推論のコストが低く、モデルの最適化が可能です。テンセントグループ上級副社長、クラウド・スマートインダストリービジネスグループCEOの唐道生氏は語った。
この観点から見ると、「小さなモデル」はよりセクシーで、特定の問題をよりよく解決できる可能性があります。
SenseTime は、1,000 億のパラメーターを備えた大規模なモデルを発表しました。また、さまざまな垂直分野向けに 100 億のパラメーターを備えた小規模なモデルも発表しています。大規模モデルの利点は、新しいソリューションを見つけて新しい問題の解決に役立つことです。一度解決すると、狭いフィールドで大量のデータを生成し、小規模なモデルを再トレーニングできることです。一部の小型モデルは、端末上で低コストで実行できる場合もあります。しかし、大きなモデルがなければ小さなモデルは存在しません。
02 大手メーカーがすべての勝者を奪いますが、新興企業のチャンスはどこにありますか?
業界では中国版ChatGPTはBaidu、Ali、Tencent、Byte、Huaweiの5社のみで生産されるのではないかとの見方がある。
インターネット時代の典型的な「721」、1位は旨くて辛い、2位は辛うじて生き残っている、3位は危うい。
現在、100 のモデルが争っており、誰もが大きなモデルの分け前を手に入れようとしています。しかし、大きな工場には、大規模なモデルを作るときに新興企業には太刀打ちできない利点があるという非常に現実的な問題があります。小さくて美しい新興企業にとって、たった 3 人か 5 人の大きな工場を打倒したいなどという考えは、おそらく単なる幻想にすぎません。
大規模なモデルをクラウド プラットフォームから切り離すことはできません。大規模なモデルのランディングには継続的な微調整とトレーニングが必要であり、それらはすべてクラウド プラットフォーム上で実行する必要があります。 Baidu、Ali、Tencent、Byte、Huawei はそれぞれ独自のクラウド ビジネスを持っており、Baidu と Huawei もチップからアプリケーションまでのレイアウトを完了しています。Baidu は「Kunlun Core + Flying Paddle Platform + Wenxin Large Model」、Huawei は「Shengteng チップ」 + MindSpore フレームワーク + Pangu ラージモデル」という、スタートアップ企業には真似できないメリットがあります。
また、大企業は資本準備金、人材、利用シーン、データ蓄積などの面で当然有利です。スタートアップの着陸シナリオがなければ、テクノロジーを反復したり、継続的に最適化したり、データ ネットワーク効果を形成したりすることはできません。
では、中小企業にはチャンスがないのでしょうか?
ゴールド ラッシュ時代の比喩をもう一度見てみましょう。「この時代は、ゴールド ラッシュの時代と非常によく似ています。当時、金を採りにカリフォルニアに行ったら、多くの人が死ぬでしょう。しかし、スプーンやシャベルを売る人は死ぬかもしれません。」これもまた真実で、Qiji Chuangtan の創設者兼 CEO である Lu Qi 氏は、最近起業家たちとこう語った。 Lu Qi は、中国の起業家がこの歴史的な転換点を認識し、今日の時代の座標を特定し、自らの立場を見つけるのを支援したいと考えています。
7月初旬、カリフォルニア大学バークレー校のコンピューターサイエンス教授であり、『人工知能—最新のアプローチ』の著者でもあるスチュアート・ラッセル氏は、ChatGPTなどのAIを活用したボットが間もなく「宇宙中のテキストを使い果たす」可能性があると警告した。 ." "、そして大量のテキストを収集してボットを訓練する技術は「困難に直面し始めている」。
先週、8,500人以上の作家が、OpenAI、Microsoft、Meta、Alphabetを含む企業のリーダーに、許可や支払いなしにAIシステムのトレーニングに自社の作品を利用しないよう求める書簡に署名し、これらの人工知能企業に著作権の損失を補償するよう求めた。
インターネット データのストックは枯渇しつつあり、高品質のデータはますます不足しています。モデルの良し悪しは 20% がアルゴリズムによって決まり、80% はデータの品質によって決まります。データ、コンピューティング能力、アルゴリズムの「トロイカ」において、データは中核的で最も長期にわたる最も基本的な要素です。大規模なモデルを継続的に最適化し、反復するには、大量のデータを供給する必要があります。
次に本当の価値となるのは、持続可能な高品質なデータです。合法でコンプライアンスに準拠し、ビジネス ロジックに沿ったデータ ソースを継続的に取得する方法が、大規模モデルのパフォーマンスを向上させる重要な要素になります。したがって、データ オペレーターは大規模モデルの開発を制限する重要な役割になる可能性があります。
理想的には、モデルは継続的にユーザーにサービスを提供し、ユーザーはモデル用に新しいデータを継続的に生成します。次のステップとしては、個人データが明らかになります。よりパーソナライズされたサービスはより多くのプライベートデータを意味し、人間が遠慮なくプライベートデータを大きなモデルに示す可能性は低いです。
いつの時代も「水売り」は商売上手です。興味深いことに、開拓者、探検家、金採掘者であっても、水なしではやっていけません。もちろんスプーンやシャベルも販売しています。
##03 結論
過去数か月の間に、ソーシャル プラットフォームで広く拡散した投稿がありました。
AIを子供のようなものだと考えてください。欧米のAIはエリート教育ルートに属し、彼が生まれた後、博士号を取得するまで家族がわざわざお金を出して勉強させてくれた。
中国の AI は功利主義教育に属しており、生まれたときは生き残るために育てられ、15 歳になると家族のためにお金を稼ぐ方法を見つけ、スキルを売り出す方法を学ぶことを余儀なくされます。
一言、丁寧に味わい、風味豊かに。
必ずしも真実ではありませんが、これは、OpenAI と ChatGPT が中国で登場しなかった理由もある程度説明できるかもしれません。実際、国内の投資家や起業家の中には、当初は自信満々で、中国版OpenAIになりたいと考えていた人もいた。数か月悩んだ結果、収益モデルを見つけ、ビジネス アプリケーション シナリオと商品化機能を検討する必要があることがわかりました。
一部の C エンド ユーザーが最近、特定のタスクにおける ChatGPT-4 のパフォーマンスが低すぎると認識していることについて言及する価値があります。これは、コストを削減し効率を向上させるために OpenAI による混合エキスパート モデル (MOE) が使用されていると考えられます。 、エンタープライズレベルのサービスに焦点を移すこともアクションの1つです。
周囲を見渡すと、Apple も独自の大規模言語モデル Apple GPT を開発しており、クアルコムはすでに、パラメータ レベル 100 億から 150 億のモデルをオフラインで実行できるように、今年末までにそれを実現する方法を検討しています。クラウド処理のない携帯電話。
ビッグモデルは生産性の再構築であり、パラダイムシフトです。 200年前、人類は初めて蒸気機関を利用して熱エネルギーを運動エネルギーに変換し、工業化の時代が始まりました。今日、人類は大型モデルを使用して電気エネルギーを脳力と一般的な知力に変換し、新たな時代が幕を開けようとしています。
もちろん、あまり多くのホイールは必要ありませんが、それでも良いホイールが必要です。
まだまだ先は長い。