ウェンシンビッグモデル4.0リリース! GPT 4.0 のベンチマークに対する主張

記事の出典:オタクパーク

著者 | リー・ユアン

編集| ジン・ユー

検索、ライブラリからビジネス分析まで、AIのビッグモデルはバイドゥの「垂直線」になっています。

「ジェネレーティブAIの時代へようこそ! **」

2023年10月17日、白いシャツと小さな白い靴を履いたバイドゥの創設者、会長兼CEOであるロビン・リーは、ステージ上で新しい時代の到来を発表しました。

「未来を創る」と名付けられたこの記者会見で、ロビン・リーは同社のビッグ言語モデルであるウェンシンビッグモデルの最新の4.0バージョンを正式にリリースし、アップグレードされたウェンシンビッグモデルを適用するために迅速な言葉を使用する方法を人々に教え、人々が北京プロビデントファンドを使用して河北省の住宅を購入し、広告やビデオを作成し、オンライン小説を作成するのを支援しました。

ロビン・リーは会議でGPT-4でウェンシンモデル4.0を直接ベンチマークしました|Baidu

会議で、**Robin Liは、Wen Xinモデルのバージョン4.0の機能は「GPT-4以上」であると自信を持って述べました。

同時に、半年前に発表した「すべてのアプリケーションは大型モデルで再構築する価値がある」という声明も、同日の会議で成果を上げました。 メインのビジネス検索から、Baiduライブラリ、ネットワークディスク、マップ、その他のBaiduファミリーバケットアプリケーションまで、Wenxinビッグモデルに接続されており、より優れたインタラクションとロジック機能を示しています。

B面では、ロビン・リーはGBI(ジェネレーティブビジネス分析)ツールや、大規模なモデル機能「Ruliu」を備えたオフィスアシスタントも公開しました。

ジェネレーティブAIがテクノロジーの世界全体を活性化させるなら、バイドゥは最も恩恵を受ける巨人かもしれません。

01 温新 4.0 ダイレクトベンチマーク GPT-4

記者会見が始まるとすぐに、ロビン・リーは最初にWenxinモデルのバージョン4.0のリリースを発表しました。

Baiduは、大規模モデルの能力について、理解、生成、ロジック、メモリの4つの定義基準を分類しています。 今回のWen Xinビッグモデル4.0アップグレードでは、インフラストラクチャは3.0および3.5バージョンと同じですが、ロジックとメモリの点で大幅に改善されていると主張しています。

ロビン・リーがウェンシングランドモデル4.0を発表|バイドゥ

BaiduのCTOであるWang Haifengによると、Wenxin Big Model 4.0の理解力と生成能力の向上は同様ですが、論理の改善は理解力の3倍、記憶力の向上は理解力の2倍です**。

4つの異なる機能により、さまざまなアプリケーションシナリオの効率を向上させることができます。 これらの能力のために、李燕紅はその場でそれを示しました。

理解は、ユーザーを支援する会話型AIの基礎であり、政府業務、マーケティング、カスタマーサービスなどの分野で非常に重要です。

理解力に関しては、シーンは語順の逆転と曖昧な表現(プロンプト)を使用して、モデルの能力をテストしました:「承徳に戻って家を購入したいのですが、積立基金ローンを使用できますか?」 手続きはどうですか? 私は北京で働いています。」

この文を理解するには、AIは「北京で働く」ことと「承徳に戻って家を買うこと」が実際には「北京で積立基金を支払うこと」であり、戸口は承徳にあることを理解する必要があります。 中国語の特徴を持つこの種のサブテキストは、ユーザーが必要とする正確な答えを出すことができます。 そして案の定、ウェンシンはすぐに質問の鍵を理解し、正しい答えを出しました。

ロビン・リーがAIの4つのコア機能を説明する|バイドゥ

生成能力は、主にブランドマーケティング、コピーライティング、クリエイティブ作業の効率を向上させることができます。

現場で、Li Yanhongは、写真によると、自然言語のプロンプトを使用して、公式Webサイトの情報に従って、背景の変換、被写体のぼかし、ポスターとコピーライティングを生成できることを示しました。

これらの従来の画像処理に加えて、バイドゥはビデオを生成する能力も実証しました。 自然言語を通じて、ライブデモンストレーションで、Wen Xinはほとんど遅延なくデジタル人間の口頭ビデオ広告を生成しました。 ビデオには製品の写真が組み込まれ、多くの過渡的な背景が追加され、スーツを着たデジタルの人物が時々登場して、公式Webサイトから収集された製品の機能を紹介します。

ウェンシンモデル4.0広告生成機能のライブディスプレイ|百度

複数のAIGC製品の協力によってのみ達成できた効果は、このディスプレイにシームレスに統合されました。 1つの広告フィルム、5つの広告コピー、およびポスターの生成には3分もかかりませんでした。

論理的推論、通常は数学的論理のテストとして現れます。 このショーケースでは、バイドゥは教育におけるその可能性を強調しました。

Li Yanhongは、円錐体積を立方体体積に変換するアプリケーションの問題を提供し、Wen Xinは解決策を提供するだけでなく、問題を段階的に解決し、各ステップに関連する知識ポイントを分析しました。

生成人工知能を使用して子供たちに宿題を指導する方が簡単です|Baidu

記憶能力の表示のために、Baiduの選択はより特別です。

バイドゥは、ウェンシンに武道小説の概要設定を書かせることを選びました。 執筆が完了した後、元のアウトラインで、ビッグモデルがキャラクター間の関係を増やし、ドラマの葛藤を増やし、ビッグモデルが複雑な情報を追加した後、元のアウトライン設定とキャラクター能力を記憶できることを示します。

Baiduはまた、Wenxinの大型モデル機能の改善のための技術サポートを共有した。

Baiduは以前、Wenxinモデルが中国のWankaクラスターを使用してトレーニングされた最初の大規模モデルであると発表しており、多くの人々はWenxinモデル4.0のパラメータスケールが兆レベルを超えると予想されていると推測しています。 しかし、この会議では、Baiduは大規模モデルのパラメータレベルを強調しませんでした。

BaiduのCTOは、Wankaトレーニングに加えて、Baiduのアルゴリズムトレーニングの安定性の週平均が98%を超え、知識ポイント強化テクノロジーが入力と出力の観点から実行されていると述べました。

02 "リファクタリング" Baiduファミリーバケット

これらは別々に示されていますが、実際には多くの場合、大規模モデルの4つの基本機能を組み合わせて適用されます。

5月、Baiduは、Baiduのアプリケーションを再構築するために大型モデルを使用することを発表しました。 この会議で、Baiduは、BaiduによるWenxin大規模モデル再構成の適用の最新の成果も示しました。

その中で、最も驚くべきことは検索のリファクタリングです。

2月、マイクロソフトはGPTのテクノロジーに基づいて検索をリファクタリングするNew Bingを発売しました。 MicrosoftのNadella氏は最新の証言で、検索市場におけるMicrosoftのシェアは、AI機能をBingに追加して以来、ほとんど変わっていないと述べた。

マイクロソフトのニュー Bingは主に、ニュー Bingとチャットして質問をし、リンクと統合された情報を取得できる会話型ボットのシステムを立ち上げました。 グーグルの吟遊詩人も同様だ。

百度、AIで本業検索の再構築|百度

しかし、今回のバイドゥの検索再構成は、検索システム全体に深く入り込んでいます。 Baiduはそれを「究極の満足、推奨刺激、そして相互作用の複数回のラウンド」と表現しています。

究極の満足感は、検索ボックスに質問を入力することに反映されます, 検索はもはやリンクを与えることはできませんが、直接最良の答えを生成します.

プレゼンテーションの中で、ロビン・リーは、過去20年間のさまざまな国の産業付加価値のランキングは何かという問題を提起しました。

リンクされたデータの回答を提供する可能性のあるNew BingやBardとは異なり、新しいBaiduは、さまざまな国の産業成長値を示す棒グラフの形式で動的なテーブルグラフを直接提供できます。 このグラフは動的で、時間とともに成長し、変化しています。

レコメンデーション励起機能は、現在の検索エンジンの関連する質問とある程度同等であり、「産業付加価値とGDPの関係は何ですか?」など、プロンプトに従っていくつかの関連する質問を理解し続けるようにユーザーに促すことができます。 「国民経済の発展に対する産業の影響は何ですか?」.

ロビン・リーがAIを再構築し、バイドゥファミリーのバケットアプリケーション体験を再構築|バイドゥ

そして、相互作用の複数のラウンドも非常に興味深いです。

現在の大きな言語モデルの起業家精神の波では、多くの起業家の1人が、レコメンデーションエンジンを備えた大規模な言語モデルを使用して、ユーザーに最良の選択を提供するために複数の対話を行うように努力しています。

9月、バイドゥはウェンシンカップ起業家精神コンペティションプロジェクトを開催し、Buysmart.AI 最優秀賞受賞者はこの方向のリーダーでした。 ユーザーは自然言語とクリックを使用して常にニーズを明確にし、Buysmart.AI レコメンデーションエンジンを使用して、ユーザーが最も必要とする製品を最終的に推奨します。

再構築されたBaidu検索は、検索に同様の方向の関数を直接追加します。

デモでは、Baiduの検索プロンプトで「北京周辺のハイキングに行く場所」と尋ねられます。 白華山、海陀山などの複数の回答を与えた後、検索エンジンを使用すると、ユーザーはさらにクリックして補足し、自分の状況を選択できます。 たとえば、親子ハイキングの初心者を追加することを選択した場合、検索エンジンは、西山や白王山など、比較的登りやすく、親子の活動に優しい場所を推奨するように変更されます。

検索の再構築に加えて、BaiduはBaiduネットワークディスク、Baiduマップ、Baiduライブラリ、およびその他のアプリケーションの再構築も示しました。

Baiduネットワークディスクのクラウドパーソナルクラウドアシスタントは以前に発売されました。 世界初のパーソナルクラウドアシスタントとして、現在2,000万人のユーザーがいます。 自然言語を使用して、アシスタントと通信したり、パーソナルクラウド内のビデオを1つの文で検索したり、ビデオコンテンツを理解したり、ビデオ内の特定のコンテンツを検索したり、ビデオの黄金の文を要約したりできます。

Baiduのプロモーションによると、Baiduマップは世界初のAIネイティブマップ製品です。 マップのアシスタントと話すことで、1つのステップでマルチレベルのメニューで何千ものサービスにアクセスすることができます。 また、適切な場所にあるレストランを推薦し、レストランの環境から選択し、最後にタクシーを直接予約することもできます。

Baidu Wenkuは、過去の数十億の原稿リソースに依存して、ユーザーが特定のトピックに関する情報を検索した後、必要な記事の種類、深刻な学術文献、または一般資料を直接選択し、ワンクリックの記事を生成できます。

再構築されたBaiduライブラリは、ビューが並置されているかプログレッシブであるかを理解し、ワンクリックでPPTスタイルを切り替えることができるPPT生成の機能も追加し、Baiduは「市場に出回っている他のPPT生成ツールをはるかに超えている」と主張しています。

03 パワーB面

このデモでは、Baiduはいくつかの新しいB面アプリケーションも示しました。

その中で、Baiduはビジネスインテリジェンス製品の発売に注力しました。 Baidu GBI、ジェネレーティブビジネスインテリジェンス。

これは、中国初の生成型ビジネスインテリジェンス製品であるBaiduが発売した新製品であり、自然言語インタラクション、クロスデータベース分析、専門知識学習をサポートする機能を備えており、ビジネスアナリストが数日で完了できるデータ分析作業を数分に短縮します。

バイドゥGBIはB面をターゲットに|バイドゥ

コマーシャルでは、「推定コストはいくらですか?」という質問があります。 お金を失うことなく最低価格はいくらですか? お客様から3ヶ月以内に納品を完了するように依頼されましたが、できますか? 最速はどれくらいですか? 低価格などの競争が正しければ、何ができるでしょうか?」 この一連の関連する財務分析、プロジェクトの相互作用、およびユーザー分析の質問について、Baidu GBIは自然言語対話を通じて直接回答を提供し、図解された回答を生成できます。

エキスパートは必要なく、データベースやテーブル間でデータにアクセスするために追加の操作は必要ありません。 さらに、企業は専門知識を学び、業界の専門家になるように訓練することもできます。

もう一つのB面製品はルリウです。 FlowなどのリファクタリングにジェネレーティブAIを使用した後、ワンクリックで会議の議事録を生成し、何千ものワークグループのコンテンツを要約できます。 会社のCRMシステムと組み合わせて、マネージャーにプロジェクトの背景とプロジェクトのディスカッションを提案します。 個人的な旅程に応じて、作業計画を計画し、会議の招待状を送信します。

Baiduは、オフィスの実現に加えて、自動運転、インテリジェントコックピット、政府のインテリジェント監視プロジェクト向けの大型モデルのエンパワーメントも実証しました。

半年以上のリリース以来、WenxinはBaiduアプリケーションの再構築を迅速に繰り返し、同時にWenxinエコシステムを徐々に確立しています。

Baiduはまた、記者会見で最近立ち上げられたLingjingプラットフォームを紹介した。 個人データであろうと企業データであろうとアプリケーションであろうと、Lingjingプラットフォーム上のプラグインにすばやく変換でき、APIを使用してWenxin大規模モデルの機能にアクセスできます。

ロビン・リーは来るAIエコロジー時代を予測します|Baidu

Baidu氏は、Lingjingプラットフォームの立ち上げ以来、今月、27,000人の開発者が定住を申請し、法律相談、履歴書作成、脳地図作成、スピーキング練習、その他のさまざまなシナリオでのネイティブアプリケーションを含む20以上の分野をカバーしていると紹介しました。 企業の個人データは、漏洩のリスクなしに、この最先端の大規模モデルの機能に簡単かつ迅速にアクセスできます。

「中国には豊富なアプリケーションシナリオがあり、中国のユーザーは当然新しいテクノロジーを積極的に受け入れます。高度な基本的なビッグモデルにより、繁栄するAIエコシステムを構築し、共同で新しい経済成長を生み出すことができます。」 李燕紅は言った。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)