生成型AIはバイドゥの未来を生み出すことができるか?

元のソース: ライトコーンインテリジェンス

著者: 劉玉奇

画像ソース:無制限のAIによって生成

風は清平の終わりに始まり、運命の事故と必然性はしばしば絡み合っています。

2019年は人工知能の歴史全体の中で最も暗い年です。 2016年にAlphaGoがイ・セドルを破った後、2017年にタンスフォーマーアーキテクチャが登場し、テクノロジーが爆発的に増加し、2018年に起業家ブームが起こりました。 2019年、資本の衰退、技術的なボトルネック期間、着陸シーンの難しさにより、人工知能の歴史に「混沌とした時代」が開かれました。

トリソラランが太陽がいつ昇るかを知らないのと同じように、一般的なAIがいつ到着するかは誰にもわかりません。 **

その年、多くのAI企業がレイオフ、資本チェーンの崩壊、製品の生産の困難に陥り、存続するものはほとんどありませんでした。

しかし、AIへの新たな希望が生まれ始めたのも2019年でした:OpenAIは7月にマイクロソフトの投資と深い協力を受け入れ、現在世界に衝撃を与えているGPT-3が開発され始めたのはその年からでした。 中国で最初にAI戦略を確立した百度は、年初から半年間の人員調整を実施し、今では軍隊の再編成により4年間の忍耐期間が開かれたようです。

2019年、Wang HaifengはグループCTOに昇進し、バイドゥの最も重要な技術基盤であるAIテクノロジープラットフォームシステム(AIG)と基本テクノロジーシステム(TG)のゼネラルヘッドを引き続き務めました。 シェンはモバイルエコシステムビジネスグループを担当するシニアバイスプレジデントに昇進し、2022年にバイドゥインテリジェントクラウドに異動し、バイドゥの第2の成長曲線のパイオニアとなった。 2019年に導入された新しい部隊の中で、He Junjieは80年代以降の唯一のバイドゥ副社長であり、最初に投資のM&Aと戦略的投資を担当し、次に再利用され、シェンジンの空いているモバイルエコロジカルビジネスグループを担当し、より真の力を持っています。

時は2023年になり、トランスフォーマーの能力は今年OpenAIによってついに天井を破り、新しいレベルに進み、テクノロジーのブレークスルーによりOpenAIは世界で最も注目されている企業になりました。 マイクロソフトはGoogleの技術的輝きを覆い隠した。

**過去4年間で、バイドゥのコアビジネスはシェンティアンインテリジェントクラウドが率いる三角形の構造を形成し、He Junjieはモバイルエコロジー、Wang Haifengプレスアレイ技術を担当し、Baiduはついに静かな期間を終了し、防御を攻撃に変え始め、アクションは継続的です。 **

「すべてのアプリケーションを再度実行する」は、半年間の電力蓄積後の最初の明るい剣であり、現在、バイドゥは惑星のようであり、巨大な「技術的重力場」に遭遇し、その軌道を完全に変えようとしています。

大型モデル登場の前夜

2017年、Googleは、従来のRNNおよびCNNループモデルを置き換えるために、「注意はすべて必要な」という論文でTransformerアーキテクチャを提案し、Transformerのトレーニング精度が以前のすべてのモデルよりも高く、トレーニング時間は以前のモデルよりも大幅に低く、トレーニングセットの内容が小さい場合もトレーニング効果が良好であることを示しました。

それ以来、トランスフォーマーアーキテクチャは、NLPとCVの分野、特に注意メカニズムにより、マシンがセマンティクスをより正確に理解して生成し、情報の重複を減らすことができるNLPの分野で急速に受け入れられ、適用されてきました。

変圧器技術ルートを発見してフォローアップした最初の企業の1つとして、Baiduは10年以上にわたってNLP分野で研究を行っており、Wang Haifeng、Wu Tian、Wu Huaなどのトップエキスパートによって形成された無駄のないNLPチームを形成しています。

ワン・ハイフェン

当時、NLPチームの最初の重要なタスクは、バイドゥ翻訳を構築することでした。 Wang Haifengは、ディープラーニングとニューラルネットワークを翻訳に大胆に適用して、機械のコンテキストの理解を高め、よりスムーズな翻訳を形成します。 この大胆な試みにより、Baidu翻訳は、Googleの1年3か月前でさえ、200以上の言語をサポートする最初の翻訳システムになりました。

**これは、ビッグモデルの4つのコア能力「理解、生成、論理、記憶」における理解能力の原型でもあります。 **

しかし、王海峰はNLPだけでは不十分だと感じています。 彼は特別にLi Yanhongの事務所に報告し、次の「上陸したノルマンディー」である音声認識を提案しました。 彼の推論は、音声認識技術が工業化の臨界点に到達しようとしており、それが突破すると、すぐに大規模に商業化されるだろうということです。

李燕宏は、技術に関する独自の判断で、王海峰を再び支援することを決定し、NLP部門と並行して「音声認識部門」、「画像認識部門」、「ナレッジグラフ部門」を次々と設立しました。

Wang Haifengの作戦は、多くのBaiduの学生を困惑させました、「これらの技術はBaiduの現在の製品とは何の関係もありません、それは1つの脳に非常に多くの部門を作成するために新年のために節約するためですか?」 "

当時、Wang Haifengは、検索データが大規模なモデル形成のロジックを非常に強力にサポートしていることを見ました。 「Baiduは世界最大の検索エンジンを持っており、情報の適時性が高いだけでなく、最も完全な知識グラフを構築できる高い精度も備えています」とWang氏は公開インタビューで説明しました。 **

Wenxinを作成する前に、Baiduは50億を超えるエンティティと550億の事実を含む多種超大規模知識グラフを作成し、言語、聴覚、視覚などを通じて世界の統一された理解を得ることができました。 2021年にリリースされた知識強化モデルであるERNIE(Wenxin)3.0は、Wenxin Yiyanの前身であり、プロジェクトは主にWu Tianを担当しています。

ウー・ティエン

2019年に再びBaidu Wenxin 1.0がリリースされ、3年間で4つのバージョンが繰り返されました。 2022年11月、Wu Tianは、Wenxinが公開サミットで蓄積した、電気、ガス、金融、航空宇宙などの分野をカバーする11の業界モデルを同時に発表し、産業エコロジーが最初に形成されました。

**これらはすべて、バイドゥがウェンシンの言葉を先制的に解放する道を予見し、開いた。 3月16日、ウェンシンの言葉が発表された後、バイドゥは再び脚光を浴びましたが、肯定する以上に、それは疑わしいものでした。 **

「このような強い市場需要の場合、誰が最初にそれを作るかはまだ非常に意味があります」とLi Yanhongはかつてインタビューで述べました、たとえ製品が完全に成熟していなくても、それでもリリースされなければなりません:「Wenxinの言葉のリリース後、数え切れないほどの人々、過去に私と接触したことのない人々、または業界で私から遠く離れている人々は、バイドゥとどのように協力できるか、できるだけ早くそれを試す方法を尋ねています。」

**技術的な観点からは、大規模なモデルは「ますます使用される」の高速反復です。 **「内部テスト中に、従業員は尋ねました。ウェンシンはどうやって頭を隠して詩をひどく書くことができますか? 私は待って、明後日それを学ぶことができると思います、そしてそれは翌日使われるでしょう、そして大きなモデルの進歩も継続的な学習プロセスです」と王海峰は笑顔で言いました。

半年で、Wenxin Yiyanは3.0から3.5、そして4.0バージョンへの3回の反復を実行し、会議でのWang Haifengによると、Wenxin Yiyanユーザーの規模は4500万人、54,000人の開発者、4,300のシナリオ、825のアプリケーション、500以上のプラグインに達しました。

NLPで水をやり、肥料を散布し、2023年にようやく豊作をもたらし、Li Yanhongが言ったように、技術開発の道は「2つの人生、2つの人生3、3つの人生、そしてすべてのもの」のプロセスです。

ビッグモデルの背後にある内部強度

一般的な人工知能の発生後、クラウドコンピューティングの注目と企業の注目はピークに達し、それはまた「iPhoneの瞬間」にも来ました。

大規模なモデルの出現は、巨大なコンピューティングパワーギャップをもたらし、クラウドコンピューティングは、大規模なモデルがクラウドコンピューティングパワーのサポートを提供するだけでなく、大規模なモデル着陸企業にとって最良の着陸点であり、Baiduであろうと、大規模なモデルを持つ企業であろうと、大規模なモデルが登場すると、次の焦点は市場に宣伝し、企業に使用させることです。

**バイドゥにとって、そのような負担はシェンシュウの肩にかかっています。 **

シェンは震えた

バイドゥのビジネスグループリーダー6社のうち、CTOの王海峰氏を除く唯一の上級副社長はシェン氏である。 どちらも技術的なバックグラウンドを持っていますが、Wang Haifengの「エンジニア」の役割とは異なり、シェンはバイドゥに入社して以来、主要ビジネスの成長を担当してきました。

バイドゥに入社してから10年間で、シェンは広告システムを次々と統合し、システムの収益化能力を向上させてきました。 検索ストリームとフィードストリームを組み合わせます。 検索によってアップグレードされたモバイルエコシステムビジネスグループを統合し、バイドゥのモバイルエコシステムの領域を完成させる。

**王海峰が鋭いナイフを作成した場合、シェンシュウはこの鋭いナイフを使用して領土を開くことができる先駆的な役人であり、李燕宏の言葉を借りれば、「厳しい戦いを敢えて戦いに勝つことができる」。 **

2022年5月、シェン・ジシンはバイドゥインテリジェントクラウド(ACG)ビジネスグループの社長に交代しました。 Baiduにとって、当初はクラウドコンピューティングに完全に賭けていませんでしたが、人工知能技術の継続的な開発により、Baiduはクラウドコンピューティングの欠点を認識し、密かに2番目の成長曲線を開拓し始めました。

**先行者の利点がないため、過去10年間のBaidu Cloudの目標は非常に明確であり、IaaSレイヤーの規模で「古い銃」と競争するのではなく、PaaS + SaaSとインテリジェント機能の組み合わせを通じて差別化を図り、小さな戦いで企業のデジタル化に切り込むことです。 **

2023年のBaidu世界会議で、Shen氏は再び「クラウドインテリジェンス統合」戦略を提案しました:「人工知能とクラウドコンピューティングの深い組み合わせは、企業がAIネイティブアプリケーションを迅速に実装するための鍵です。 現在、Baiduグループのすべてのアプリケーションとサービスは、『クラウドインテリジェンス統合』技術アーキテクチャに基づくBaiduインテリジェントクラウド上で実行されている」と語った。

**光コーンの観察によると、クラウドインテリジェンス統合戦略の中核は、一方ではBaiduインテリジェントクラウドに依存して、企業に大規模なモデルサービスの完全なセットを迅速に提供できることです。 一方、大規模なモデルでは、企業のデジタル化の敷居が低くなっています。 **

ACGを引き継いでから5か月で、シェンは「ビッグモデルサービススーパーファクトリー」であるウェンシンチェンファンを、大型モデルの時代の企業のコアニーズに応えて迅速に統合し、ユーザーをニーズに応じて5つのカテゴリのユーザーに分けました。

まず第一に、計算能力リソースによって引き起こされる需要ギャップを考慮して、Qianfanプラットフォームはさまざまなタイプの異種計算能力を提供します。 たとえば、最も高価なトレーニングリンクでは、分散並列トレーニングとマイクロ秒レベルの相互接続機能により、Qianfanプラットフォームは95%のトレーニング加速率と96%の有効トレーニング時間比を達成でき、顧客の計算能力と時間コストを大幅に削減できます。

第二に、モデルレベルでは、既存の大規模モデルを直接呼び出したい顧客のために、企業はWen Xin Yiyanを含む複数の大規模モデルをすばやく呼び出すことができ、Qianfanプラットフォームは中国語の強化、パフォーマンスの強化、コンテキストの強化などのツールを提供します。 Shen Ji氏によると、Qianfanプラットフォームは17,000を超える顧客にサービスを提供してきました。

**二次開発ニーズを持つ顧客向けに、Qianfanプラットフォームは、業界最多の41の高品質業界データセットを使用して、大規模モデルの再トレーニング、微調整、評価、展開などの完全なライフサイクルツールチェーンを提供し、独自のビジネスシナリオに合わせて迅速に最適化します。

会議はまた、検索強化世代(RAG、Retri Augmented Generation)フレームワークに基づいてSany Heavy Industryの知識Q&Aアプリケーションを迅速に開発する方法の実践的なデモンストレーションを実施しました:Qianfan AIネイティブアプリケーションワークベンチでプリセットRAGフレームワークを選択し、対応するパラメーターを設定して、Sany Heavy Industryの公式Webサイトでインテリジェントカスタマーサービスアプリケーションの開発と立ち上げを迅速に実現します。

**シェン氏は、このような「小さなアシスタント」を構築すると、数千語の長さの文書を処理する必要がある場合でも、コストはわずか数百元であると述べました。 その後、ユーザーの各相談は数セントしかかかりません。 **

長い間、大規模な産業、製造業、農業はデジタル化の深海地域であり、その主な理由は、業界の複雑さがデジタル化の敷居が高く、着陸が難しいことです。

ただし、大規模なモデルにより、使用のしきい値が削減されるだけでなく、使用コストも削減されます。 新しいシステムを構築する必要はなく、手動の参加も必要ではなく、技術コンポーネントのより高度なアプリケーション方法であり、**2つの組み合わせだけでなく、クラウドインテリジェンスフライホイールを回し、徐々に蓄積します。 **

大型モデルのイノベーションの課題

過去は当然の結論ですが、未来は変わる可能性があります。

大規模なモデルを持つすべてのベンダーは、アプリケーション層に機会を見出しています。 マイクロソフトは3月にBing、Office、Windowsシステムを含むフルラインの製品に取り組み始め、アリダニエル・チャンは「すべての製品をやり直すにはビッグモデルを使用しなければならない」と述べましたが、この文は簡単に言えば、ラージモデルの時代における最大のイノベーションチャレンジです。

AIはどのようにアプリケーションをリファクタリングしますか? これにはビジネス能力だけでなく想像力も必要であり、新しいAI時代に直面して、バイドゥは若者の手にバトンを委ねました。 **

2022年5月以降、シェン・ジエは、バイドゥの人材階層建設計画で紹介された80年代以降の世代の副社長である賀俊傑にMEGビジネスグループの責任者として引き継がれました。 シェン・ジャンが「ハードウォー派閥」である場合、彼は真の「若い強い派閥」です。 任正非が言ったように、「大砲を聞いた人に戦いを指揮させる」必要があります。

**アプリケーションのリファクタリングは壊れていないか、立っているのではなく、対照的に、Baiduは確かにそれ自体に対して「特に冷酷」です。 **

「エコロジー」に焦点を当てたバイドゥ世界会議では、He Junjieは「モバイルエコロジー」、「コンテンツエコロジー」、「ビジネスエコロジー」の回答を手渡しました。

その中で、モバイルエコシステムは、「新しい検索」、「新しい文空」、「文新YyanAPP、百度電子商取引「Huibexing」などのAIネイティブアプリケーションをカバーしています。 コンテンツの生態学的レベルでは、Baidu APP「AIエディター」などの一連のアプリケーションがクリエイターエコシステムを強化します。 ビジネスエコロジーのレベルでは、AIネイティブマーケティングプラットフォーム「Light」が立ち上げられました。 さらに、He Junjieは、現在完全にオープンしているWen Xin Yyyanプラグインエコロジー「スピリットマトリックス」も発表しました。

**Baiduによって定義された新しい検索は、まさに2010年にRobin Liによって提案されたボックス計算のロジックです。 **究極の満足感、推奨刺激、マルチラウンドインタラクションの3つの特徴があります。 つまり、ユーザーが質問を検索すると、「リンクの束が表示されなくなりました」が、コンテンツを理解することで、テキスト、画像、動的チャートなどのマルチモーダル回答を生成します。 レコメンデーション刺激は、ユーザーが気にかけている問題をリアルタイムで推奨できます。 複雑なニーズに対応して、マルチラウンドインタラクションは、プロンプトや調整などを通じてユーザーのパーソナライズされた検索ニーズを満たすことができます。

需要からマッチングまでのプロセスは「エンドツーエンド」検索とも呼ばれますが、これはバイドゥがかつて依存していた入札ランキングモデルを破り、広告収入は常にバイドゥの最大のドル箱でした。

AIGCの機能は、コンテンツ検索ツールからコンテンツ制作ツールにアップグレードされたBaiduドキュメントなど、Baiduの古いアプリケーションの一部に新しい活力を与え、Baiduエディターはコンテンツ生成ツールになりました。 他の部分では、AIGCとインテリジェントデリバリーによるBaidu Diagerのマーケティングコンテンツのワンストップ生成と、デジタルヒューマン生成プラットフォーム「Huaicast Star」を組み合わせて、マーチャントがマーケティングの範囲とシナリオを拡大するのに役立つなどの新しいシナリオについても説明します。

**同時に、大規模なモデルアプリケーションが徐々に着陸するにつれて、Baiduは、それ自体の強さに依存することは最終的に制限されており、無限は垂直と水平であることにも気づきました。 **

これが、大型モデルのプラグイン開発のコストを大幅に削減し、創造性とアイデアを持つ一般の人々がプラグイン開発者になることを可能にするプラットフォームであるSpirit Matrixの価値です。 Li Yanhong氏は、プラグインは特別なAIネイティブアプリケーションであり、しきい値が最も低く、開始が最も簡単なAIネイティブアプリケーションでもあると述べました。

プラグインの特徴は、検索、ミニプログラム、コンテンツプラットフォーム、または任意の入り口を接続できる「ユニバーサルインターフェイス」であるため、「プラグアンドプレイ」を使用すると、開発者と作成者がエコシステムにすばやく参加できます。

He Junjieは、立ち上げから1か月後、Lingjing Matrixが企業、機関、個人開発者を含む20以上の垂直分野をカバーする27,000の開発者登録申請を受け取ったことを明らかにした。

BaiduのインサイダーはLight Cone Intelligenceに、「アプリケーション層の大規模モデルプラグインは、Lingjingをメインプラットフォームとし、Wenxin YyyanとBaiduアプリに配置されます。 Qianfanはより最下位レベルにあり、精神的な領域はより上位レベルにあり、将来的にはアプリケーションプラグインのレベルでQianfanを置き換えることさえ可能です。」

結論

2016年、李氏は、バイドゥは破産までわずか30日であると述べました。 「恐竜は足のスクープを踏んで、脳が反応するのに何時間もかかりました。 ですから、どんなに大きな恐竜が成長しても、絶滅します。」

Baiduは恐竜になりたくありません、そして意識のレベルでは、それは常に10歩離れて考えます。

幸いなことに、バイドゥは新しい時代を待ち、最も困難な瞬間を乗り越えました。 残念ながら、この新しい時代の初めには、長い競争の下では、骨の折れるひったくりは取るに足らないように思えます。

しかし、新しいチケットを取得することは、少なくとも新しい始まりです。

参考:

人工知能のさまざまな分野の国境を越えた専門家-トランスフォーマー」

旅は遠いです:彼らは人工知能のために魂を彫刻します

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)