モデル、かっこいい

画像ソース: Unbounded AI によって生成

200 日以上にわたる大規模な起業家精神を経て、中国人探検家の精神は理想的な興奮から現実へと変化しました。

これに先立ち、AI モデルの起業家精神には、企業そのものに加え、国民感情や時代の流れなど、より多くの意味が与えられており、汎用モデル ChatGPT の登場に直面して、中国の起業家たちは、中国版 OpenAI と ChatGPT を構築する方法について急速に合意に達しました。

ChatGPT が今年世界のトッププレイヤーであることは疑いの余地がありません。そのおかげで、OpenAI Web サイトのトラフィックは 4 月に 18 億を超え、世界トラフィックランキングでトップ 20 に入っています。しかし、ウェブ分析会社であるSimilarwebが発表したデータによると、ChatGPTの訪問数は6か月間の急速な成長の後、初めてマイナス成長となり、6月の訪問数は前月比9.7%減少しました。

ChatGPTトラフィックの突然の減少は、世界のテクノロジーコミュニティでAI業界のバブルのリスクについての懸念と議論を引き起こし、エコノミスト誌は「より大きく、より優れたAIへの道はもはや実現不可能である」との結論を下した。 「中国版ChatGPT」になるという考えも、中国の起業家界からは遠ざかりつつある。

GSRの創設パートナーであるZhu Xiaohu氏はモーメンツで次のように書いている。「一般的なモデルについて迷信を持たないでください。来年にはGPT-3.5がコモディティ(一般インフラ)になり、3年後にはGPT-4もそうなるでしょう。ほとんどの起業家にとって、現場が最優先であり、データは王様です!」

実務家の考え方が変化すると同時に、大規模な起業家市場が分裂し始めています

中国の大規模モデル企業はもはや「中国のOpenAIになる」という理想的な目標やパラメトリックモデルやコンピューティングパワーの追求に執着しているのではなく、より現実的な答えを持ち、実際の産業シナリオにおける問題解決にもっと注意を払っている。

AI 大型モデルの競争により、新しいトラック ノードが登場しました。

集団的プラグマティズム

今年の初めに、Ctrip の創設者で取締役会会長の梁建章氏が ChatGPT と連絡を取り始めました。近年、彼は人口統計学者として学界やビジネス界で活躍していますが、中国で最も早く最年少のプログラマーでもあり、人工知能の博士号を取得する寸前でした。

梁建章さんは 13 歳で韻詩を書くプログラムを設計して国家賞を受賞し、15 歳で復旦大学 3 年生に入学し、卒業後渡米して 21 歳でジョージア工科大学でコンピュータ サイエンスの修士号を取得しました。 22 歳のとき、博士号取得を目指して勉強していた Liang Jianzhang 氏は、理論的知識の限界に突然気づき、米国の Oracle に入社するために博士号を放棄することを選択しました。

ChatGPT の出現により、Liang Jianzhang は、**「これらの自然言語処理アルゴリズムはすべて、ChatGPT (ChatGPT) によって完全に敗北した」**ため、人工知能の博士号取得のための勉強を続けなくてよかったと思いました。 ChatGPT に初めて触れたとき、彼は「非常にショックを受けた」と回想し、2 番目の感情は「私たちが最終的に作成した最もインテリジェントなアルゴリズムは、人間の脳の生物学的構造に非常に近かった」という謙虚な気持ちでした。

Liang Jianzhang 氏は、AI 大型モデルと Ctrip ビジネスの組み合わせについて考え始めました。

梁建章氏は、インテリジェント社会を背景に、観光業は「自動化が困難な精神的需要産業」として、社会全体の豊かさの向上とともに需要が増加し、経済に占める割合も拡大するとみている。彼は観光産業の垂直モデルに注目しました。

過去6か月間で、シートリップのさまざまな事業のメンバーがシートリップ大型モデル技術チームを結成しました。大型モデル開発の初期段階で、Ctripは大型モデルの戦略的要件に応じて組織構造を調整し、一般技術チーム、コンテンツ戦略チーム、リストチームなどのさまざまな部門を形成し、大型モデル製品の継続的なアップグレードと反復に応じて技術チームを適応させました。

Liang Jianzhang氏は、シートリップは大型モデルへの投資にあらゆる努力を惜しまないと述べ、「顧客や販売業者にとって価値があるのであれば、長期的にはしっかりと投資すべきだ。これ(大型モデル)は非常に新しく、技術チームは常に投資額を最適化しているが、制限はない。」と述べた。

7月中旬、シートリップは観光産業の大規模な垂直モデルを正式にリリースした。 Askedは200億件の非構造化観光データをスクリーニングし、シートリップの既存の構造化リアルタイムデータ、シートリップの歴史的に訓練されたロボットと検索アルゴリズムを組み合わせ、自社開発の垂直モデルトレーニングを実施し、「同時に、一般的な旅行返信コンテンツの生成と検証に多くの人的資源を投資した」と梁建章氏は強調した。

質問が公開される前に、シートリップは社内テストを実施しましたが、顧客サービススタッフのワン・ユンさんは明らかに自分の仕事が大きく変わったと感じていました。以前は、販売後の注文キャンセルや荷物の紛失に関する顧客の質問に答えるために、1 日に 150 件以上の電話に応答しなければなりませんでしたが、今では、旅行前に顧客サービスを推奨するようになり、舞台裏から生放送室に入り、旅行前に準備する必要があるサービスや提案をネチズンに提供しています。

Liang Jianzhang 氏の見解では、汎用の大規模モデルに基づいて、観光業界の正確性の問題を解決することが依然として重要です:「旅行は多消費産業です。たとえ計画に 30 分の時間が節約されたとしても、推奨されるホテルや旅程の結果が間違っている可能性が 5% あるかもしれません。」 したがって、ChatGPT のような汎用の大規模モデルと比較して、Liang Jianzhang 氏は垂直方向の大規模モデルの機会により多くの注意を払っています。モデル

パラメーターの点では一般的な大規模モデルほど優れておらず、一般的な大規模モデルのような計算能力やその他の条件に対する厳しい要件もありませんが、垂直大規模モデルはデータとシナリオに対してより高い要件を提示します。

Ask の大規模モデルトレーニングにおける最大の課題は、実際の現場では、ユーザーが旅行情報を取得し、複数ラウンドのインタラクティブなデータ収集とクリーニングを行う過程で、データ量とデータの精度を常に修正する必要があることです。特に観光業界は大きな変化を遂げており、3 年前の目的地情報は今では完全に古くなっている可能性があり、特に世界の観光業界に対する疫病の影響により、データの適時性が悪化しています。

Ctrip のように、大型モデルのトラックを垂直分野に置く企業が増えています。

JD.com から渡された延西大規模モデルの解答用紙でも、産業大規模モデルが重要な特徴として取り上げられています。 Jingdong Group の新しい CEO である Xu Ran 氏によると、過去の人工知能技術の開発は、何度か応用爆発の危機に瀕していましたが、最終的には短命に終わることが多く、その重要な理由の 1 つは、この技術が業界で確固たる応用を形成していないことです**。

7月7日のファーウェイ盤古大型モデル3.0の記者会見で、ファーウェイクラウドの張平安CEOは「盤古大型モデルには詩を書いたり、チャットしたりする時間がない。パラメータがどれだけ多く、対話能力がどれだけ優れていても、現実的な問題を解決できなければ、あまり役に立たない」と歯に衣着せぬ発言までした。

テンセントはまだ一般的な大規模モデル「渾源」の進捗状況を発表していないが、業界の大規模モデル路線を大々的に発表し、主要10業界向けに50以上のソリューションを一度に投入した。テンセントの副社長兼政府・企業ビジネス担当社長の李強氏も「一般的な大型モデルだけがモデル適用の方向性ではなく、垂直産業向けのモデルが大型モデルの価値の転換点になるだろう」と述べた。

考え方の転換

大規模起業家の精神的変化における明らかな結節点は、王恵文氏がうつ病と診断され、創業から何光年も離れて美団社に買収されたときに始まった。誰もが期待し、大きな期待を寄せていたスター企業も、さまざまな事故によって業務を停止しなければならない可能性があることに突然誰もが気づきました。

ほんの半年前、他のアウトレットは一夜にして消滅したかのように見え、大型モデルだけがCの位置にありました。中国のテクノロジー界の起業家や投資家たちは、OpenAI から学ぶためにシリコンバレーに飛び、これらの巨大企業のナンバーワン、つまり意思決定の中心人物である張一明、馬化騰、王興は、夜遅くまで論文を読んだり、技術を交換したりして、最初に事業を始めたときの興奮と好奇心の状態に一晩で戻りました。

当時、中国の大型模型の探索者は皆、家族や国家への感情の問題について考えていたようです。 ChatGPT の急速な反復に直面して、中国の起業家が設定した目標は、いかにしてどれくらいの期間で追い越しを達成するかということです。

Li Yanhong 氏は「Baidu Wenxinyiyan は研究開発段階にあり、Baidu の技術チームは ChatGPT との比較テストを行った。当時その差は 40 ポイントだったが、1 か月以内に追いつく可能性がある」と述べ、Wang Xiaochuan 氏もまた、年末までに中国で最高の大きな言語モデルを作ると述べた。

360の創設者である周宏毅氏は「中国の起業家」とのインタビューで、「大型モデルはもはや商業競争の次元ではない。中国のインターネットの閉鎖性とモバイルインターネットによって引き起こされるAPP間のデータアイランド問題が解決されなければ、人工知能エンジンのトレーニングの限界につながる可能性が高く、それが中国と米国の間でAI革命の新たなラウンドを引き起こす可能性がある。世代間ギャップ」と述べた。

なぜ中国でOpenAIのような企業が生まれなかったのかというと、中国の起業家たちは当時、国内の人工知能の探究があまりにも現実的で、すべてがKPI中心であったため、誰もがそれに投資する決意と忍耐力を持たず、そのような重要な節目を見逃していたと反省し始めた。

熱意を持って、Baidu Wenxin が第一弾を発射してから、半年以内に 80 を超える大型 AI モデルが出現し、上海で開催された 2023 年世界人工知能会議だけでも 30 を超える大型モデルが登場し、大型モデルの人気は「百モデル戦争」と表現しても過言ではありません。

しかし、本当にこれほど多くの大きなモデルが必要なのでしょうか?どのような大きなモデルが必要ですか?

実際、Robin Li 氏は非常に早い段階で「スタートアップ企業が ChatGPT を再作成するのはあまり意味がありません。この大規模な言語モデルに基づいてアプリケーションを開発する素晴らしい機会があると思います。車輪を再発明する必要はありません。車輪が利用可能になった後は、車や飛行機を作る価値が車輪の価値よりも大きくなる可能性があります。」と提案しました。

京東グループの技術担当副社長、何暁東氏も当初から「大型モデルに価値があるなら、それを業界に導入する必要があり、産業価値の高い分野に置くのが最善だ。この方法でのみ真に長期的に持続可能なものになれる。そうでなければ短命なものになる可能性がある」と認識していた。

新しい変数

国内の起業家たちが AI モデルの探索に苦戦していたまさにそのとき、ザッカーバーグ氏の大きな動きは、この絶え間なく変化する分野に新たな変数をもたらした。

北京時間 7 月 19 日の早朝、Meta はオープンソースの大型モデル Llama 2 をリリースしました。これにより、AI 界は再び爆発しました。Llama 2 は、GPT-3 と同じパフォーマンスを備えているだけでなく、無料でオープンソースであり、商用利用可能です。 Llama 2 は、今年 3 月初めに Meta によってリリースされた Llama モデルの後継製品です。

その後開催された Microsoft Inspire パートナー カンファレンスで、Microsoft CEO の Satya Nadella 氏は、Meta と Microsoft の提携のニュースを発表し、この提携により、Llama 2 は Microsoft のクラウド サービス Microsoft Azure 上で実行できるようになりました。同時に、Amazon AWS クラウドも Meta との協力に加わりました。

大規模モデルの起業家にとっての Llama 2 の重要性は、Android システムが APP 開発にとって重要であるのと同じように、 開発者が車輪の再発明をする必要がなく、最も低コストで大規模モデルのインフラストラクチャを直接入手できるため、独自の産業シナリオにより集中できることです。

これはある意味、ほとんどの起業家にとって、業界の垂直アプリケーションに焦点を当てることを選択することがより現実的な道であることが証明されたことも意味します。

ただし、一般的な大型モデルとは異なり、**産業用大型モデルは、業界参加者に対して異なるしきい値と要件も提示します。**一方で、産業用大型モデルでは、開発者に一定の技術的蓄積と強みが求められますが、他方で、産業用大型モデルでは、オペレータが豊富な産業用アプリケーションの実践シナリオを持っていることも必要とされます。

Liang Jianzhang 氏は「中国の起業家」に次のように語った。「一般的な大規模モデルの最も重要な指標は、パラメーターの数や GPU の数などですが、垂直大規模モデルと大規模言語モデルはその一部にすぎません。また、手動検証などを含む他のデータとの組み合わせもあります。これらの方が重要です。最終的には、顧客からの質問と回答の効率、正確さ、信頼性がどの程度向上するかをテストできるかどうかを指します。」

「観光業界の最大の問題は信頼性だ。これは確かにAIが詩や記事、小説を書くよりも複雑だ。また、長期にわたる作業でもある。これを80%、90%、95%、さらには99%まで改善できるなら、やる価値はある」と梁建章氏は最後に語った。

原文表示
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)