記事の出典:AIダークホース *シェアリングゲスト:バイドゥ・ロビン・リー**フィールド記録:起業家精神のダークホース* 世界は以前の姿に戻り、ロビンがステージ上で真面目な広告を出し、テクノロジー製品の未来的な感覚と好奇心を明らかにしていると言う人もいます。 それは、ステージの内外、会社、そしてユーザーのテクノロジーの未来への希望と共鳴です。 Baidu世界会議2023は、2006年から17年間開催されているBaiduの最も重要な戦略、技術、製品発売会議です。 **10月17日、起業家精神のダークホースが百度世界会議に招待され、その場で10の重要な内容を記録し、ロビン・リーのスピーチの全文を整理して全員と共有しました。 **1.生成人工知能の時代へようこそ! 昨年のテクノロジーにおける最大のイノベーションは、AIネイティブアプリケーションを開発するための基盤であるビッグモデルからのインテリジェンスの出現です。 Wenxin Model 4.0が正式にリリースされ、基本モデルの包括的なアップグレードを実現し、理解、生成、ロジック、メモリ機能が大幅に向上し、包括的なレベルはGPT-4以上のレベルです。2.AIネイティブアプリケーションは、大規模なモデルの理解、生成、ロジック、およびメモリ機能に基づいて開発されたアプリケーションです。 これらの機能は過去の時代には利用できなかったため、イノベーションのための無限のスペースが開かれます。 3.生成AIと検索は天国で行われた試合です。 Baidu検索はAI大規模モデルに基づいて再構築されており、新しい検索には、極端な満足度、推奨刺激、マルチラウンドインタラクションの3つの特徴があります。 検索の品質を向上させるだけでなく、検索の適用範囲を突破し、製品の境界を拡大します。4. Baidu GBIは、中国で最初の生成型ビジネスインテリジェンス製品であり、ビジネスアナリストが10日以上で完了できるデータ分析とレポート作成作業を分単位に短縮でき、大規模なモデル機能に基づく意思決定ツールです。 5. Baiduライブラリは、AI再構築の最も徹底的な製品です。 大規模なモデル再構成に基づくBaidu Wenkuが発表され、「コンテンツツール」から「生産性ツール」に変身しました。 資料の理解、記事の執筆、PPTインテリジェント生成、スタイルの切り替えなどの機能が急速に進化しています。6. バイドゥネットワークディスクはAIの再構築を完了しました。 パーソナルクラウドインテリジェントアシスタント「Cloud One」は、グラフィカルインターフェイスインタラクションから自然言語インタラクションへの変換を実現し、マルチモーダル情報理解を強化し、ビデオを正確に見つけ、ワンクリックでビデオコンテンツを要約し、黄金の文章を洗練し、世界をリードしています。7.プラグインは特別なAIネイティブアプリケーションであり、しきい値が最も低く、最も使いやすいです。 このプラグインは、大規模なモデルの機能を強化し、より実用的で使いやすくし、多くのエンタープライズプライベートデータを漏洩のリスクなしに簡単かつ迅速に使用できるようにします。8.将来のAIネイティブアプリケーションはマルチモーダルである必要があり、自動運転は物理的な世界を再構築するための視覚的な大規模モデルの典型的なアプリケーションです。9.バイドゥは、デジタル技術と実体経済の深い統合を積極的に推進しており、大規模なモデル技術は、製造、エネルギー、電力、化学工業、輸送、その他の実産業に適用されており、インテリジェントな検査を使用して潜在的な安全上の問題を低減し、インテリジェントなスケジューリングを使用して配送サイクルを短縮し、インテリジェントな意思決定を使用して企業の効率を向上させ、インテリジェントな情報制御を使用して交通渋滞を解決し、大規模モデルは新しい工業化の重要な原動力になりつつあります。10.私たちはAIネイティブの時代、人間とコンピューターの相互作用の時代に入ろうとしています! **以下は、バイドゥの創設者兼CEOであるロビン・リーのスピーチの全文であり、Dark Horse of Entrepreneurshipが編集したものです。こんにちはゲスト! バイドゥワールドコングレス2023へようこそ!ジェネレーティブAIの時代へようこそ! ****本カンファレンスのテーマはAIネイティブアプリケーションです。 過去数か月間のさまざまな製品ラインのAIネイティブ再構築プロセスにおけるBaiduの経験を詳しく共有します。 ** ご存知のように、AIネイティブアプリケーションは大規模なモデルに基づいて開発されています。 昨年のテクノロジーセクターにおける最大のイノベーションは、間違いなく、AIネイティブアプリケーションを開発するための基盤であるビッグモデルによってもたらされたインテリジェンスの出現でした。 したがって、BaiduのAIネイティブアプリケーションも、Wen Xinの言葉に基づいて開発されています。 Wen Xinの言葉は今年3月16日に最初にリリースされ、それ以来、私たちは迅速に反復し、8月31日に世界に公開することが承認され、多くのユーザーフィードバックを得て、イノベーションのスピードが加速しています。本日、Wenxinグランドモデル4.0の公式リリースを発表できることを嬉しく思います。同時にテストの招待も始めました。 現場の友達は、ゲストカードのQRコードをスキャンして体験クーポンを受け取るだけで、ウェンシン・イヤンの公式ウェブサイトまたはウェンシン・イヤンアプリにログインしてウェンシンモデル4.0を体験できます。 これはこれまでで最も強力なWenxinビッグモデルであり、基本モデルの包括的なアップグレード、理解、生成、ロジック、メモリの4つの主要な機能を達成し、Wenxin Yiyanの現在のバージョンと比較して大幅に改善され、包括的なレベルはGPT4以上です! **いわゆるAIネイティブアプリケーションは、私が理解しているように、大規模なモデルの理解、生成、ロジック、およびメモリ機能に基づいて開発されたアプリケーションです。 これらの機能は過去の時代には利用できないため、イノベーションのための無限のスペースを開くことができます。 **以下では、アプリケーションシナリオを組み合わせて、Wen Xinの言葉の4つの機能を紹介します。 これら4つの機能を備えたアプリケーションは、AI時代のネイティブアプリケーションです。 **1つ目は理解力です。 これは、ビッグモデルと触れ合って感じた最も驚くべきことです。 **過去には、AIは「人工知的障害」であり、AIは人の言葉を理解できないことが多く、時間が経つにつれて、あえてあまり話しかけなくなると述べました。今日、あなたが言うすべての言葉は、あなたの友人や同僚があなたが言っていることを理解するよりも何倍もよく理解できる可能性が最も高いです。たとえば、あなたは北京で働く若い男性で、河北省で家を購入したいと思っており、北京で積立基金ローンを申請できるかどうかを知りたいと思っています。行を入力しましょう。[承徳に戻って家を購入したいのですが、積立基金ローンを使用できますか、手続きはどうすればよいですか? 私は北京で働いています。 】結果を見てみましょう。 ウェンシンは、プロビデントファンドローンを使用できると答えました。 なぜこのQ&Aは大きなモデルを理解する能力を反映しているのですか? 実際、私が今与えたことは、一見単純ですが、理解すべきいくつかの小さな落とし穴があります。まずは前後の表現です。 ほとんどの人が質問をするために電話をかけるとき、彼らはどこに言うべきかを考えます、それほど厳密ではありません、このように、私は最初に家を購入し、積立基金を扱うことについて言いました、そして最後に「私は北京で働いています」と言いました。第二に、ここでは意図的に2つの曖昧な表現を使用しています。 1つは「北京で働く」、サブテキストは「北京に積立基金を預ける」、もう1つは「承徳に戻って家を買う」、単なる「帰還」という言葉であり、実際、私はおそらく承徳戸口であることを意味します。第三に、Wen Xinはコンテキストを組み合わせ、すべての情報ポイントを組み合わせて、「河北省承徳に戸籍を持つユーザーが北京の積立基金を使用して承徳の家をローンで購入できるか」という本当の質問を正確に理解し、この質問に対する回答と処理手順を示しました。Wen Xinの言葉は、「順不同の表現、比較的曖昧な表現の意図、および単語のサブテキスト」をかなり正確に理解していることがわかります。 この能力は、政府業務、マーケティング、顧客サービス、その他の分野で非常に幅広いアプリケーションの見通しを持っています。 **大規模モデルの2番目の重要な機能は、テキスト、画像、ビデオなどのマルチモーダルコンテンツを生成できる「生成」です。 **では、発電電力をどのように使用するのでしょうか。 私はWen Xinに、一言でクリエイティブのセットを生成するように依頼しました。最初に画像を入力してから、段落を入力します。[長安の新エネルギー車] 春、背景に活気に満ちた風景、そしてスピードを出している車の感覚を持つ2つの画像を生成するのを手伝ってください。 】この世代は、スピード違反のぼやけを伴って、春の活気に満ちた屋外の風景を使用していることがわかります。私はそれに直接垂直ポスターを生成するように頼みました。[長安の公式ウェブサイトにある長安Qiyuanの情報と組み合わせて、縦型広告ポスターを作成し、ボディスタイルを反映したシンプルでエレガントなマーケティングコピーを作成します。 】ご覧のとおり、画像とテキストの両方を含む垂直広告ポスターを生成しました。私たちは今広告ポスターを持っています、そして私たちはより豊富な広告コピーを必要とします、あなたはWen Xinにもう少し言葉を書くように頼むことができます:[この車は、デジタルインテリジェンスコックピット、福光デザイン、そして高品質の運転を強調しています。 さらに5つの広告コピーを書いてください、それぞれに短い見出しと説明を付けてください]科学技術の美しさ、時代の流れを持つAIによって書かれたコピーライティングは、人間とコンピュータの相互作用も強調し、コピーライティングはより専門的でスムーズであり、ブランドマーケティングの基準に達しています。それでもビデオが必要な場合はどうなりますか?[公式ウェブサイト情報と既存のビデオコンテンツを組み合わせて、デジタルヒューマンオーラルビデオを生成してください、インフィード広告を掲載したい。 】生成されたら、ビデオを開いて効果を確認します。これは確かにより特徴的なデジタル人口放送ビデオであり、この車の特徴も反映しています。現在、コマーシャルフィルム1枚、広告コピー5枚、ポスター1枚があり、ウェンシンに1枚の画像素材と「デジタルインテリジェントカー」や「高品質の運転」などのいくつかの単語を与えただけで、プロセス全体に3分もかかりませんでした。少し前に、この機能を使ってAIGCマーケティングクリエイティブプラットフォームSteering Engineを立ち上げ、1人がAIマーケティングチームになることを可能にしました。 今日、シーンにはコピーライティングの友人がいるかもしれませんが、これを見て、大きなモデルはより創造的なインスピレーションをもたらし、効率を向上させるのに役立つと思いますか? 次に、大規模モデルの3番目の機能であるロジックについて説明します。 **多くの人々はしばしば宿題で子供たちを助けなければなりません。 「宿題を書かないと母親は親孝行で、宿題を書くと鶏が飛んで犬が飛び跳ねる」と冗談を言う人もいます。 それでは、ウェンシンの言葉は、親が宿題の個別指導の問題を解決するのに役立ちますか?数学の問題を作り上げて、それがどのように機能するかを見てみましょう:[円錐形の砂の山、底の面積は8平方メートル、高さは12デシメートル、幅2メートル、厚さ5cmの道路にこの砂の山を広げ、何メートル舗装できますか? 】これは私たちが子供の頃にやったかもしれない一種の数学の問題であり、Wen Xinの答えから判断すると、その答えの論理は非常に明確です。 すべてのステップが書き込まれます。 保護者は、それがいくつかの個別指導資料に記載されているものよりも詳細であるかどうかを確認できます。AIは、子供たちが学習を統合するのを助けるために問題を解決するために使用される知識ポイントを指摘することができます、もう一度それを尋ねましょう:【上記の問題解決プロセスにはどのような知識ポイントがあるのか? 】Wen Xinは、円錐体積の公式、統一された測定単位、変更されていない体積、方程式の解法など、この質問に関連する知識ポイントを明確に示しました。 これは、生徒、教師、保護者にとって実用的です。 これらの知識ポイントが明確に習得された後、子供たちはお互いから推論を引き出す能力を持つようになります。大規模モデルの超論理的能力は、問題解決に使用できるだけではありません。 スマートマップのルート計画、複雑なタスク用のスマートアシスタント、高度道路交通システムの信号機制御などはすべて、ロジック機能を使用する必要があります。 次に、4点目のラージモデルの記憶能力について見ていきましょう。 **ここでの記憶は、主にあなたが以前に言ったことを指し、AIがそれを覚えているかどうか、AIによって生成されたコンテンツは矛盾します。 これは大規模なモデルの知性を区別するための重要な指標であり、マルチラウンド対話は記憶能力の具現化です。多くのクリエイターがウェンシンを使って小説を書いていることを知っています。 そして小説の内容が矛盾しているならば、それは読めません。 今日は、その場で小説を書いてもらい、気を散らすものに質問を散りばめ、書いたものを覚えているかどうかを確認します。最初に1つ入力します。[武道小説を書くのを手伝ってください、主人公は女性で、プロットには浮き沈みがあります。 】さて、見てみましょう、小説の概要が出てきました:最初は物語の背景であり、古代の武道の世界では、闇の勢力が台頭しています。 ヒロインの名前はリンガーで、内力や逃走を操る力を持つ。最初に1つ入力します。[武道小説を書くのを手伝ってください、主人公は女性で、プロットには浮き沈みがあります。 】さて、見てみましょう、小説の概要が出てきました:最初は物語の背景であり、古代の武道の世界では、闇の勢力が台頭しています。 ヒロインの名前はリンガーで、内力や逃走を操る力を持つ。次に、物語の始まりです。 リンガーは闇の勢力を打ち負かし、武道を救いたいと思っています。 小説のクライマックスで、彼女は悪役と生死の戦いを戦い、悪役を倒し、武道とすべての宗派を救います。結局、リンガーと彼女の同盟国も一緒に内部権力育成研究所を設立しました。ストーリーは基本的に形成されましたが、少し単純なので、キャラクターの要件をさらに追加したいと思います。[今はキャラクター関係が単純すぎて、キャラクターは2人しかなく、さらに4人追加されています]ウェン・シンは一言でさらに4つの役割を果たし、それぞれが異なるアイデンティティと個性を持ち、異なる性格を持ち、このムロン・グチェンはグランドマスターの世代であり、未来を予測できる預言者シャオ・ハンヤンがいます。しかし今、小説、劇的な対立にはまだ必要な要素があります。 葛藤のない物語は良い物語ではありません、そしてヒロインが今闇の勢力を倒すプロセスは単純すぎます、それをもっと難しくすることができるかどうか見てみましょう。別のものを入力してください【ストーリーをより見やすくするために、本線の劇的な葛藤をストーリーに加えることも必要】ほら、それはすでに劇的な対立のために書かれています。 これは逆転です、闇の勢力の後ろで、本当のリーダーは非常に尊敬されているグランドマスターレベルの人物であり、それはヒロインを数回危険にさらしました。 決定的な戦いまで、ヒロインは反撃する機会がありました。ご覧のとおり、物語のメインラインはリンガーと闇の勢力の対立であり、紛争もこのメインラインを中心に展開していることを覚えています。それで、ウェンシンはまだ彼が書いたばかりの物語を覚えていて、これらのキャラクターを物語に関連付けていますか?もう1つリクエストしましょう。[これらのキャラクターをあなたが私のためにデザインしたストーリーのアウトラインに持ち込み、タイトルをデザインしてください。 】結果は大画面で上映され、小説は「川と湖の正義の戦い」と呼ばれ、ストーリーのアウトラインにキャラクターと劇的な対立が追加されています。 ここの第4章と第5章では、この悪役の偉大なマスターは紹介されたばかりのムロン・グチェンであるとも述べています。プロセス全体を通して、私は難易度を上げ続け、その記憶を妨害するための新しい要件を提案し続けました、そしてウェンシンはまだ以前のすべてのニーズと答えを覚えていて、ストーリーラインとキャラクターに正確に対応することができました、そして彼の記憶は非常に素晴らしかったです。それから今テストシーンのみんな、あなたは覚えていますか、主人公リンガーの特別な能力は何ですか?たぶんほとんどの人は覚えていないので、ウェンシンが覚えているかどうか見てみましょうか?【ヒロインが持っている能力とは? 】さて、答えは出ています、それは内部の力と飛行を操作する力です。 これは、Wen Xinが最初の対話で書いたテキストの例です。 さて、5ラウンドの対話と数千語のフィクションの後、それはまだそれが以前に書いたものを覚えていることができます、それは大きなモデルの記憶能力です。 もちろん、ビッグモデルの4つの能力を体験したばかりですが、ほとんどの場合、これらの4つの能力は単独では現れず、互いに補完し合っています。 **たとえば、広告コピーを作成するには、作成のテーマを理解し、作成のロジックを明確にし、メモリを通じて一貫性を維持する必要があります。問題解決においては、理解力、生成力、論理力、記憶力を総合的に応用することも必要です。包括的なアプリケーション例を見てみましょう。まず、再構築されたBaiduアプリを開き、患者が取り出した薬箱をカメラでスキャンし、小さな活字で指示を見る必要はなく、デジタル人間の医師が説明をお手伝いします。「食前か食後か」、「アルコールを飲むか食べられるか」、「他にどのような予防策があるか」など、今画面に表示された質問は、毎日の投薬で多くの患者が問題に遭遇することになります。大規模なモデルは、患者が薬の指示を解釈するのに役立つだけでなく、パーソナライズされたニーズを組み合わせて投薬の効率を改善し、患者の投薬の正確さと適時性を確保できることがわかります。少し前に、私たちはWen Xinモデルを専門的な医学的知識と組み合わせ、スピリットメディシンボットを適用して患者と医師が話し、医療記録を生成するのに役立つスピリットメディシンビッグモデルをリリースしました。 この例では、論理メモリを理解および生成する機能だけでなく、マルチモーダル音声、ビジョンなどの機能も使用します。前回のデモは、主に、すべてのAIネイティブアプリケーションの存続の基礎となる理解、生成、ロジック、メモリの4つの機能におけるWenxinモデルの進歩を反映しています。 同様に、基本モデルの上に構築された豊富なAIネイティブアプリケーションエコロジーがなければ、大規模なモデルは価値がありません。 私は5月に、バイドゥがすべての製品を再構築する最初の会社になり、AI思考を使用してAIネイティブアプリケーションを作成すると公に述べました。 **過去数か月で、ストリーム、マップ、オンラインディスク、ライブラリなどの検索で、新しい外観でお会いします。 期間中、私はたくさんのピットを踏んだ、そして私はあなたと共有することをいとわない、私はあなたが開発プロセスで曲がりくねった道をたどることができることを願っています。 **次に、大型モデルで再構築されたこれらの製品がどのように見えるかをお見せします。 これはまた、すべての人の想像力を広げ、より素晴らしいAIネイティブアプリケーションを作成するようにすべての人を鼓舞するためでもあります。  私が最初にあなたに示すのは、Baiduが始まったところである検索です。 多くの人の検索の印象は、キーワードを入力すると、BaiduがWebリンクを提供することです。 もうこれ以上!Baiduの新しい検索は、インターフェイスを開くと、検索ボックスが表示されるだけでなく、検索結果が過去とはまったく異なります。**再構築された新しい検索には、極端な満足度、推奨刺激、および複数回の相互作用の3つの特徴があります。 **究極の満足とは何ですか? 検索ボックスに "MBTI とは" などの質問を入力すると、次のような質問が入力されます。 「横に駐車する方法」、新しい検索はもはやあなたにたくさんのリンクを与えることではなく、大きなモデルを通して理解し、最良の答えを生成することです 例えば、「過去20年間の国別産業付加価値ランキング」を尋ねると、新しい検索では直接答えがわかるだけでなく、動的なチャートで答えが表示されます。私の後ろの大画面から、過去20年間で、私たちの工業製造業は急速な発展を遂げ、製造国から製造大国に変貌していることがわかります。これは究極の満足です:あなたに究極の答えを与えるための一歩。それで、2番目のステップは、答えを見た後、他に何を見たいですか?これは、推奨刺激が使用される場所です。 たとえば、動的チャートの後、推奨励起関数は、「産業付加価値とGDPの関係は何か」と「産業が国民経済の発展に与える影響は何か」も気になるかもしれません。 クリックして回答を取得します。もちろん、すべてのニーズに単一の正解があるわけではありません。 ユーザーのニーズは複雑な場合があり、1文または2文では明確ではありません。 また、ユーザーが非常に複雑な要件を一度に大きな説明で完全に表現することも困難です。現時点では、ユーザーにサービスを提供するために、より斬新でパーソナライズされた検索モデル、つまりマルチラウンドインタラクションを使用する必要があります。この例を見てみましょう。たとえば、「北京周辺の登山におすすめの場所はどこですか」と尋ねると、白華山や海陀山など、ハイキングルートに偏った複数の回答が得られます。次に、それはあなたの状況の選択を補足するためのいくつかのヒントを与えます、あなたは初心者、親子と落ち葉を見ることの間で選ぶことができます。 現在、比較的登りやすく、親子の活動に優しい西山と白王山を推奨するように変更されました。次に、登山やハイキングにはどのような機器が必要ですか? 答えはトレッキングポール、ハイキングシューズなどであり、以前に親子ツアーを選んだことも思い出し、特に子供の世話をする方法についてのヒントを提供しました。 ジェネレーティブAIと検索は天国で行われた試合と言えます。検索は、まだその単純なボックスから始まりますが、次のステップでは、元の検索モードを上回って再構築し、検索の品質を向上させただけでなく、検索の適用範囲を突破し、製品の境界を拡大しました。 そういうAIインタラクティブ検索は、検索業界の世代変革をリードします。近い将来、検索は親密なアシスタントになり、いつでも「終わり」の限界を呼び起こし、解決し、さらには「終わり」の制限を打ち破り、いつでもどこでも対応し、ニーズを満たし、プロセス全体に同行することができます。次に、2番目のAIネイティブ思考製品であるBaidu GBI、生成的ビジネスインテリジェンス、つまり生成的ビジネスインテリジェンスを見てみましょう。 **これはゼロからの製品であり、既存の製品のリファクタリングではありません。 ** 私たちのビジネスの世界では、最も切り離せないのはビジネス分析、つまりBIであり、最速のビジネス上の意思決定を行う方法は? まず、ビデオを通して感じてみましょう。ご覧のとおり、ビデオでは、大統領がさまざまな専門的な質問をしました。 財務分析、プロジェクトデリバリ、ユーザー分析があり、GBIの社長補佐は迅速に結果を出すことができ、社長はその場で意思決定を行うことができます。 これは、大規模なモデル機能に基づく意思決定ツールであり、中国で最初の生成型ビジネスインテリジェンス製品であるBaidu GBIです。 GBIを使用すると、すべてを高速に実行できます。高度なツールを持つ人々がAIに取って代わられないだけでなく、「昇進や昇給は夢ではありません」。 高度なツールを使用しない人は、職を失うリスクがあります。 **では、バイドゥGBIはどのようにして一歩先を行くのでしょうか。 これは、次の3つの方法で従来のデータ分析を覆します。まず第一に、従来のBIは専門家のみが操作できますが、GBIは社長の質問を直接理解してリアルタイムで実行できます。第二に、GBIは便利なアクセス方法を提供し、企業はデータにアクセスし、質問をし、自然言語でデータを分析することができ、データベースやテーブル全体でさまざまな専門的な操作を手動で行う必要がなくなります。第三に、GBIには学習能力もあり、企業は独自の業界専門知識を注入して業界の専門家になることができます。 これはBaidu GBIで、ビジネスアナリストが十数日で完了できるデータ分析とレポート作成作業を分単位に短縮できます。 世界のいわゆる武道はすぐに壊れることしかできません。**企業の競争、大きな魚は小さな魚を食べませんが、速い魚は遅い魚を食べ、競合他社よりも速い意思決定は、あなたが勝つ可能性があります! ** 迅速な意思決定と言えば、BaiduではRuliuと呼ばれるスマートオフィスプラットフォームに依存しており、このアプリケーションをAIで再考しました。 今日、それはバイドゥの人々がなくてはならないスーパーアシスタントになりました。今、誰もが見てください、これはリアルタイム録画を行うストリームのようなものです。 今述べたすべての点を覚えているかどうか見てみましょう。議事録のワンクリック生成機能です。 会議を効率的に行う方法は技術的な仕事だと言います。 この機能により、会議の作業負荷が大幅に軽減され、会議時間が40%短縮されます。別の一般的なシナリオは、ワークグループです。 職場のほとんどの人は、さまざまなグループチャットメッセージに襲われることがよくあります。 次に、グループチャットの要点をすばやく要約すると、非常に便利な機能になります。製品マネージャーがそれをどのように使用しているかを見てみましょう。 彼には9つのワークグループがあり、一定期間遅れ、1000を超える未読情報がある可能性があり、Ruliuは「1000メッセージ、1秒でフォーカスを取得する」だけでなく、読む必要のあるコンテンツをいくつかのカテゴリにインテリジェントに分割することもできます:「確認を待っている」、「焦点を合わせる」、「トピックディスカッション」、作業効率を大幅に向上させます。それで、それは正確に洗練されていますか、それは誤解されますか、それとも重要な情報を見逃しますか? これにより、大規模なモデルを理解して生成する能力がテストされます。 理解が深ければ深いほど、要約はより正確になります。 フロースーパーアシスタントなどの1,000、10,000個の情報は、数秒でインテリジェントな分類とインテリジェントな要約を提供することもできます。 職場の別のシナリオ、つまり旅行を見てみましょう。航空券、ホテル、交渉など、これらの取引タスクは面倒で時間がかかります! 些細なタスクを解決するのに役立つAIアシスタントがあれば、もっと働きたいですか?たとえば、最近、Ruliuのプロダクトマネージャーは、PICCの王氏と会うために上海に旅行することを計画しました。 PICCは、製品やサービス、ビジネスモデル、デジタルテクノロジーなどのイノベーションを推進しており、バイドゥの人工知能テクノロジーが役割を果たすことができることを私たちは知っています。この出張の旅程は、スーパーアシスタントのルリウに引き渡すことができ、そのパフォーマンスを見てみましょう。スーパーアシスタントは、スケジュール情報に基づいて旅行を手配できます。最新の会議が4時に終了するように、7:30以降にフライトを予約してください。 そして、彼の旅行基準に従って、彼が滞在できるホテルを見つけるのを手伝ってください。 最後に、顧客への招待状が発行されました。彼はクライアントと会う前にいくつかの背景を必要とするかもしれません、そしてスーパーアシスタントもこれで彼を助けることができます。 CRMや他の社内システムデータとの連携により、連携案件や訪問記録など詳細なデータを提供します。ビジネス協力の状況やフローなどの外部情報を理解することで、ディスカッションリファレンスを生成し、顧客が尋ねる可能性のある質問を事前設定し、協力の提案を行うのにも役立ちます。 この観点から、ルリウは本当のアシスタントのようなものですか?たった3つの言葉で、Ruliuは旅行伝票、マシンワイン、スケジュールの予約を完了し、Ruliuの「ワンクリック旅行」である交渉の参考資料も準備しました。 それはどのようにそれをしますか? これは、大規模なモデルの理解、生成、ロジック、およびメモリ機能の包括的なアプリケーションであり、複雑なタスクを複数の単純なタスクに自動的に分解して個別に実行し、マージして最終結果を生成します。 効率の向上とは、「スマートワーク」を「ハードワーク」に置き換えさせるなど、競争力を高めることだと言います。 それでは、新しいBaiduライブラリを見てみましょう。 これも、これまでに完全にリファクタリングされたと思う製品です。 **Baidu図書館は、私たちの仕事、学習、創造の習慣を完全に変えます。過去にどのように作成したのですか? たとえば、心理学におけるAIの応用についてプレゼンテーションを行っているとします。 情報の確認、資料の整理、原稿の執筆、PPTの作成、PPTの美化には数日かかります。 今日、Baidu Wenkoでは、大画面を見て、1つの文で作業を開始できます:最初に、あなたはそれがスピーチを書くことを望みます、そしてそれは人工知能と心理学のトピックに関する何十もの資料を見つけます。また、どれが学術雑誌、権威あるレポート、そしてどれが単なる大量資料であるかを特定することもできます。 活気のある記事を書きたい場合は、エッセイやポピュラーサイエンスなどの人気のある資料を選択してください。次に、厳密な学術スピーチが必要な場合は、コンテンツの正確性を確保するために、信頼できるコンテンツのみを確認できます。 次に、これらの原稿を理解することにより、ライブラリは、コンテンツを磨き、フォーマットしながら、適切に構造化され、明確に定義された記事を作成します。これは、Baidu Wenkuがすでに10億の高品質のドキュメントを持っているため、これらの内容の理解に基づいて、多くの大規模なモデルのような深刻なナンセンスではなく、真に実用的で明確なドキュメントを作成し、一般的な空の話でもありません。次に、プレゼンテーションにもPPTが必要です。 ライブラリは、原稿を収集した資料の一部と組み合わせて、PPTのフレームワークを自動的に生成し、図面を美化して数十ページのPPTを作成できます。スタイルの選択やワンクリックのスタイルの切り替えなど、マルチモーダル生成機能を備えたゲームプレイもあります。 しかし、図書館の能力をよりテストし、内容を正確に理解する必要がある場所がいくつかあります。 たとえば、正しいチャートを設計するには、アイデアが並置されているか従属しているかにかかわらず、アイデア間の関係を知る必要があります。この理解能力のために、ライブラリはPPTの生成に基づいてこのPPTに対応する音声スクリプトを書くこともできます。 それだけでなく、これらのコンテンツを使用して、視聴者が尋ねる可能性のある質問を推測し、回答の準備をすることもできます。ライブラリ、特にPPTを生成する機能は、外国であろうと国内であろうと、市場に出回っている他のどのツールをはるかに超えていると評価しました。 過去には、人々は既製のコンテンツを見つけるために図書館にやって来ました。 将来的には、人々は他のどの生産性ツールよりも効率的に、好きなようにコンテンツを制作できるようになります。 Wenxinモデルの4つの機能に基づいて、Baidu Wenkuは根本的に自らの生活に革命を起こし、「コンテンツツール」から「生産性ツール」への進化を完了したと言っても過言ではありません**。少し前まで、Baidu Wenkuの新しいバージョンの初日、新しいAI機能は200万を超えるエクスペリエンスをもたらしました。 今では、ビッグモデルの時代には、Baidu Wenkuがコンテンツを制作するための最良の出発点であると自信を持って言えます。  ウェンクのように、Baiduネットワークディスクもおなじみの古い友人です。 過去11年間で、Baiduネットワークディスクは8億人のユーザーにサービスを提供し、ファイル量は4兆に達し、ユーザーは毎日10億枚以上の画像をアップロードしています。AI再構築の方向では、Baiduネットワークディスクは、個人ファイルのインテリジェントサービスで良い仕事をすることに焦点を当てています。今表示されているのは、Baiduネットワークディスクの新しいホームページです。**再構築されたネットワークディスクは、グラフィカルインターフェイスインタラクションから自然言語インタラクションへの変換を実現するだけでなく、マルチモーダル情報理解を強化します。 **これで、たった1文で、オンラインドライブ内のファイル、写真、ビデオなどを操作できます。 これはBaiduネットワークディスク「Cloud One」であり、業界、さらには世界初のパーソナルクラウドインテリジェントアシスタントです。 「Cloud One」が解決し、新しいエクスペリエンスをもたらすことができる問題点を感じてみましょう。最初のポイントは、写真やビデオを見つけることです。 時々、私たちは絵を考えて、ネットワークディスクでそれを見つけたいのですが、多くの場合、多くのステップの後、半日投げても見つかりません。 今、あなたは「クラウドワン」に一言言います、そしてそれはあなたがそれを特定するのを助けることができます:まあ、それは私がOpenAIのチーフサイエンティストLLYAがトランスフォーマーについてインタビューしたものをすぐに見つけるのに役立ちました。この一見単純な検索の背後には、ビデオコンテンツを理解し、キャラクターを識別し、コンテキストメモリを形成して、ビデオの特定のフレームを正確に特定できる複数のAI機能の役割があり、これはグローバルなパーソナルクラウド分野で非常に最先端のテクノロジーです。Yunyiの2番目の機能は、ユーザーがビデオの内容をすばやく理解できるようにすることです。内容を要約・要約する能力と、黄金の文章を抽出する能力の2つの能力が発揮されていることがわかります。 これは43分のインタビューで、AIの理解と論理的能力を通じて、Yun Yiduoはビデオを要約して改良し、Llyaと彼の主なアイデアを紹介しました。しかし、多くの場合、元のテキストは非常にエキサイティングであり、メインのアイデアや要約を蒸留した後、それほど魅力的ではないので、今の2番目の機能は、実際には私にとってより便利だと思います、つまり、元のビデオの最もエキサイティングな部分である黄金の文章を見つける必要があります。 たとえば、LLYAは、「統計法則を学ぶことは、外観を見ることよりもはるかに重要である」と述べています。 この黄金の文章を抽出する上での重要なブレークスルーは、世界をリードする技術であるマルチモーダル情報の効率的な抽出です。 長い面接内容から最適な部分を見つけられるため、学習効率や作業効率が大幅に向上します。AI再構築後の新しいネットワークディスクです。 昨日の時点で、Yunyiは2000万人のユーザーに達しました。パーソナルクラウドに基づくAIインテリジェントアシスタントです。 過去10年間で、Baiduはいわゆるネットワークディスクを定義してきました。 今後10年間で、バイドゥはAIを使用して新しいネットワークディスクを再定義します。 次に、より歴史的な製品であるバイドゥマップを見てみましょう。 **この18年前の製品をAIネイティブ思考で再構築し、世界初のAIネイティブマップ製品でもあります。 過去18年間、Baidu Mapsは豊富な機能を蓄積しており、ナビゲート、タクシーの呼称、代替ドライバーの検索、ホテルの予約、チケットの購入、さらにはより複雑な条件下でのPOI検索のニーズを満たすことができます。 以前は、これらの操作は複雑で、完了するまでに 6 つまたは 7 つ以上の手順が必要になることがよくありました。これで、ユーザーが需要を言う限り、マップは何千ものサービスAPIインターフェイスを動員でき、マルチレベルメニューはワンステップの直接的かつ迅速な応答になります。次に、バイドゥマップはどのように実装されていますか? ビデオでは、ユーザーはBaidu Mapの汎需要の理解、中間のミーティングポイントの選択、複数の場所からの情報の比較、将来の旅行の推奨と予約をテストし、合理的なソリューションを提供します。 これは、Wen Xinの話す能力が、マップの独自の10億レベルのPOI知識と1兆レベルの交通認識データと融合されており、いつでも呼び出して推奨事項を提供できるためです。 再構築されたバイドゥマップは、ナビゲーションだけでなく、旅行ガイドでもあります。 あなたが賢ければ賢いほど、あなたはより賢く、あなたはあなたをより理解します。
スピーチの全文は11500語です| バイドゥ・ロビン・リー:私たちはAIネイティブの時代に入ろうとしています!
記事の出典:AIダークホース
フィールド記録:起業家精神のダークホース
世界は以前の姿に戻り、ロビンがステージ上で真面目な広告を出し、テクノロジー製品の未来的な感覚と好奇心を明らかにしていると言う人もいます。 それは、ステージの内外、会社、そしてユーザーのテクノロジーの未来への希望と共鳴です。
Baidu世界会議2023は、2006年から17年間開催されているBaiduの最も重要な戦略、技術、製品発売会議です。
**10月17日、起業家精神のダークホースが百度世界会議に招待され、その場で10の重要な内容を記録し、ロビン・リーのスピーチの全文を整理して全員と共有しました。 **
1.生成人工知能の時代へようこそ! 昨年のテクノロジーにおける最大のイノベーションは、AIネイティブアプリケーションを開発するための基盤であるビッグモデルからのインテリジェンスの出現です。 Wenxin Model 4.0が正式にリリースされ、基本モデルの包括的なアップグレードを実現し、理解、生成、ロジック、メモリ機能が大幅に向上し、包括的なレベルはGPT-4以上のレベルです。
2.AIネイティブアプリケーションは、大規模なモデルの理解、生成、ロジック、およびメモリ機能に基づいて開発されたアプリケーションです。 これらの機能は過去の時代には利用できなかったため、イノベーションのための無限のスペースが開かれます。
3.生成AIと検索は天国で行われた試合です。 Baidu検索はAI大規模モデルに基づいて再構築されており、新しい検索には、極端な満足度、推奨刺激、マルチラウンドインタラクションの3つの特徴があります。 検索の品質を向上させるだけでなく、検索の適用範囲を突破し、製品の境界を拡大します。
Baidu GBIは、中国で最初の生成型ビジネスインテリジェンス製品であり、ビジネスアナリストが10日以上で完了できるデータ分析とレポート作成作業を分単位に短縮でき、大規模なモデル機能に基づく意思決定ツールです。
Baiduライブラリは、AI再構築の最も徹底的な製品です。 大規模なモデル再構成に基づくBaidu Wenkuが発表され、「コンテンツツール」から「生産性ツール」に変身しました。 資料の理解、記事の執筆、PPTインテリジェント生成、スタイルの切り替えなどの機能が急速に進化しています。
バイドゥネットワークディスクはAIの再構築を完了しました。 パーソナルクラウドインテリジェントアシスタント「Cloud One」は、グラフィカルインターフェイスインタラクションから自然言語インタラクションへの変換を実現し、マルチモーダル情報理解を強化し、ビデオを正確に見つけ、ワンクリックでビデオコンテンツを要約し、黄金の文章を洗練し、世界をリードしています。
7.プラグインは特別なAIネイティブアプリケーションであり、しきい値が最も低く、最も使いやすいです。 このプラグインは、大規模なモデルの機能を強化し、より実用的で使いやすくし、多くのエンタープライズプライベートデータを漏洩のリスクなしに簡単かつ迅速に使用できるようにします。
8.将来のAIネイティブアプリケーションはマルチモーダルである必要があり、自動運転は物理的な世界を再構築するための視覚的な大規模モデルの典型的なアプリケーションです。
9.バイドゥは、デジタル技術と実体経済の深い統合を積極的に推進しており、大規模なモデル技術は、製造、エネルギー、電力、化学工業、輸送、その他の実産業に適用されており、インテリジェントな検査を使用して潜在的な安全上の問題を低減し、インテリジェントなスケジューリングを使用して配送サイクルを短縮し、インテリジェントな意思決定を使用して企業の効率を向上させ、インテリジェントな情報制御を使用して交通渋滞を解決し、大規模モデルは新しい工業化の重要な原動力になりつつあります。
10.私たちはAIネイティブの時代、人間とコンピューターの相互作用の時代に入ろうとしています!
こんにちはゲスト! バイドゥワールドコングレス2023へようこそ!
ジェネレーティブAIの時代へようこそ! **
**本カンファレンスのテーマはAIネイティブアプリケーションです。 過去数か月間のさまざまな製品ラインのAIネイティブ再構築プロセスにおけるBaiduの経験を詳しく共有します。 **
ご存知のように、AIネイティブアプリケーションは大規模なモデルに基づいて開発されています。 昨年のテクノロジーセクターにおける最大のイノベーションは、間違いなく、AIネイティブアプリケーションを開発するための基盤であるビッグモデルによってもたらされたインテリジェンスの出現でした。
したがって、BaiduのAIネイティブアプリケーションも、Wen Xinの言葉に基づいて開発されています。 Wen Xinの言葉は今年3月16日に最初にリリースされ、それ以来、私たちは迅速に反復し、8月31日に世界に公開することが承認され、多くのユーザーフィードバックを得て、イノベーションのスピードが加速しています。
本日、Wenxinグランドモデル4.0の公式リリースを発表できることを嬉しく思います。
同時にテストの招待も始めました。 現場の友達は、ゲストカードのQRコードをスキャンして体験クーポンを受け取るだけで、ウェンシン・イヤンの公式ウェブサイトまたはウェンシン・イヤンアプリにログインしてウェンシンモデル4.0を体験できます。
これはこれまでで最も強力なWenxinビッグモデルであり、基本モデルの包括的なアップグレード、理解、生成、ロジック、メモリの4つの主要な機能を達成し、Wenxin Yiyanの現在のバージョンと比較して大幅に改善され、包括的なレベルはGPT4以上です!
**いわゆるAIネイティブアプリケーションは、私が理解しているように、大規模なモデルの理解、生成、ロジック、およびメモリ機能に基づいて開発されたアプリケーションです。 これらの機能は過去の時代には利用できないため、イノベーションのための無限のスペースを開くことができます。 **
以下では、アプリケーションシナリオを組み合わせて、Wen Xinの言葉の4つの機能を紹介します。 これら4つの機能を備えたアプリケーションは、AI時代のネイティブアプリケーションです。
過去には、AIは「人工知的障害」であり、AIは人の言葉を理解できないことが多く、時間が経つにつれて、あえてあまり話しかけなくなると述べました。
今日、あなたが言うすべての言葉は、あなたの友人や同僚があなたが言っていることを理解するよりも何倍もよく理解できる可能性が最も高いです。
たとえば、あなたは北京で働く若い男性で、河北省で家を購入したいと思っており、北京で積立基金ローンを申請できるかどうかを知りたいと思っています。
行を入力しましょう。
[承徳に戻って家を購入したいのですが、積立基金ローンを使用できますか、手続きはどうすればよいですか? 私は北京で働いています。 】
結果を見てみましょう。 ウェンシンは、プロビデントファンドローンを使用できると答えました。 なぜこのQ&Aは大きなモデルを理解する能力を反映しているのですか? 実際、私が今与えたことは、一見単純ですが、理解すべきいくつかの小さな落とし穴があります。
まずは前後の表現です。 ほとんどの人が質問をするために電話をかけるとき、彼らはどこに言うべきかを考えます、それほど厳密ではありません、このように、私は最初に家を購入し、積立基金を扱うことについて言いました、そして最後に「私は北京で働いています」と言いました。
第二に、ここでは意図的に2つの曖昧な表現を使用しています。 1つは「北京で働く」、サブテキストは「北京に積立基金を預ける」、もう1つは「承徳に戻って家を買う」、単なる「帰還」という言葉であり、実際、私はおそらく承徳戸口であることを意味します。
第三に、Wen Xinはコンテキストを組み合わせ、すべての情報ポイントを組み合わせて、「河北省承徳に戸籍を持つユーザーが北京の積立基金を使用して承徳の家をローンで購入できるか」という本当の質問を正確に理解し、この質問に対する回答と処理手順を示しました。
Wen Xinの言葉は、「順不同の表現、比較的曖昧な表現の意図、および単語のサブテキスト」をかなり正確に理解していることがわかります。 この能力は、政府業務、マーケティング、顧客サービス、その他の分野で非常に幅広いアプリケーションの見通しを持っています。
では、発電電力をどのように使用するのでしょうか。 私はWen Xinに、一言でクリエイティブのセットを生成するように依頼しました。
最初に画像を入力してから、段落を入力します。
[長安の新エネルギー車] 春、背景に活気に満ちた風景、そしてスピードを出している車の感覚を持つ2つの画像を生成するのを手伝ってください。 】
この世代は、スピード違反のぼやけを伴って、春の活気に満ちた屋外の風景を使用していることがわかります。
私はそれに直接垂直ポスターを生成するように頼みました。
[長安の公式ウェブサイトにある長安Qiyuanの情報と組み合わせて、縦型広告ポスターを作成し、ボディスタイルを反映したシンプルでエレガントなマーケティングコピーを作成します。 】
ご覧のとおり、画像とテキストの両方を含む垂直広告ポスターを生成しました。
私たちは今広告ポスターを持っています、そして私たちはより豊富な広告コピーを必要とします、あなたはWen Xinにもう少し言葉を書くように頼むことができます:
[この車は、デジタルインテリジェンスコックピット、福光デザイン、そして高品質の運転を強調しています。 さらに5つの広告コピーを書いてください、それぞれに短い見出しと説明を付けてください]
科学技術の美しさ、時代の流れを持つAIによって書かれたコピーライティングは、人間とコンピュータの相互作用も強調し、コピーライティングはより専門的でスムーズであり、ブランドマーケティングの基準に達しています。
それでもビデオが必要な場合はどうなりますか?
[公式ウェブサイト情報と既存のビデオコンテンツを組み合わせて、デジタルヒューマンオーラルビデオを生成してください、インフィード広告を掲載したい。 】
生成されたら、ビデオを開いて効果を確認します。
これは確かにより特徴的なデジタル人口放送ビデオであり、この車の特徴も反映しています。
現在、コマーシャルフィルム1枚、広告コピー5枚、ポスター1枚があり、ウェンシンに1枚の画像素材と「デジタルインテリジェントカー」や「高品質の運転」などのいくつかの単語を与えただけで、プロセス全体に3分もかかりませんでした。
少し前に、この機能を使ってAIGCマーケティングクリエイティブプラットフォームSteering Engineを立ち上げ、1人がAIマーケティングチームになることを可能にしました。 今日、シーンにはコピーライティングの友人がいるかもしれませんが、これを見て、大きなモデルはより創造的なインスピレーションをもたらし、効率を向上させるのに役立つと思いますか?
多くの人々はしばしば宿題で子供たちを助けなければなりません。 「宿題を書かないと母親は親孝行で、宿題を書くと鶏が飛んで犬が飛び跳ねる」と冗談を言う人もいます。 それでは、ウェンシンの言葉は、親が宿題の個別指導の問題を解決するのに役立ちますか?
数学の問題を作り上げて、それがどのように機能するかを見てみましょう:
[円錐形の砂の山、底の面積は8平方メートル、高さは12デシメートル、幅2メートル、厚さ5cmの道路にこの砂の山を広げ、何メートル舗装できますか? 】
これは私たちが子供の頃にやったかもしれない一種の数学の問題であり、Wen Xinの答えから判断すると、その答えの論理は非常に明確です。 すべてのステップが書き込まれます。 保護者は、それがいくつかの個別指導資料に記載されているものよりも詳細であるかどうかを確認できます。
AIは、子供たちが学習を統合するのを助けるために問題を解決するために使用される知識ポイントを指摘することができます、もう一度それを尋ねましょう:
【上記の問題解決プロセスにはどのような知識ポイントがあるのか? 】
Wen Xinは、円錐体積の公式、統一された測定単位、変更されていない体積、方程式の解法など、この質問に関連する知識ポイントを明確に示しました。 これは、生徒、教師、保護者にとって実用的です。 これらの知識ポイントが明確に習得された後、子供たちはお互いから推論を引き出す能力を持つようになります。
大規模モデルの超論理的能力は、問題解決に使用できるだけではありません。 スマートマップのルート計画、複雑なタスク用のスマートアシスタント、高度道路交通システムの信号機制御などはすべて、ロジック機能を使用する必要があります。
ここでの記憶は、主にあなたが以前に言ったことを指し、AIがそれを覚えているかどうか、AIによって生成されたコンテンツは矛盾します。 これは大規模なモデルの知性を区別するための重要な指標であり、マルチラウンド対話は記憶能力の具現化です。
多くのクリエイターがウェンシンを使って小説を書いていることを知っています。 そして小説の内容が矛盾しているならば、それは読めません。 今日は、その場で小説を書いてもらい、気を散らすものに質問を散りばめ、書いたものを覚えているかどうかを確認します。
最初に1つ入力します。
[武道小説を書くのを手伝ってください、主人公は女性で、プロットには浮き沈みがあります。 】
さて、見てみましょう、小説の概要が出てきました:
最初は物語の背景であり、古代の武道の世界では、闇の勢力が台頭しています。 ヒロインの名前はリンガーで、内力や逃走を操る力を持つ。
最初に1つ入力します。
[武道小説を書くのを手伝ってください、主人公は女性で、プロットには浮き沈みがあります。 】
さて、見てみましょう、小説の概要が出てきました:
最初は物語の背景であり、古代の武道の世界では、闇の勢力が台頭しています。 ヒロインの名前はリンガーで、内力や逃走を操る力を持つ。
次に、物語の始まりです。 リンガーは闇の勢力を打ち負かし、武道を救いたいと思っています。 小説のクライマックスで、彼女は悪役と生死の戦いを戦い、悪役を倒し、武道とすべての宗派を救います。
結局、リンガーと彼女の同盟国も一緒に内部権力育成研究所を設立しました。
ストーリーは基本的に形成されましたが、少し単純なので、キャラクターの要件をさらに追加したいと思います。
[今はキャラクター関係が単純すぎて、キャラクターは2人しかなく、さらに4人追加されています]
ウェン・シンは一言でさらに4つの役割を果たし、それぞれが異なるアイデンティティと個性を持ち、異なる性格を持ち、このムロン・グチェンはグランドマスターの世代であり、未来を予測できる預言者シャオ・ハンヤンがいます。
しかし今、小説、劇的な対立にはまだ必要な要素があります。 葛藤のない物語は良い物語ではありません、そしてヒロインが今闇の勢力を倒すプロセスは単純すぎます、それをもっと難しくすることができるかどうか見てみましょう。
別のものを入力してください
【ストーリーをより見やすくするために、本線の劇的な葛藤をストーリーに加えることも必要】
ほら、それはすでに劇的な対立のために書かれています。 これは逆転です、闇の勢力の後ろで、本当のリーダーは非常に尊敬されているグランドマスターレベルの人物であり、それはヒロインを数回危険にさらしました。 決定的な戦いまで、ヒロインは反撃する機会がありました。
ご覧のとおり、物語のメインラインはリンガーと闇の勢力の対立であり、紛争もこのメインラインを中心に展開していることを覚えています。
それで、ウェンシンはまだ彼が書いたばかりの物語を覚えていて、これらのキャラクターを物語に関連付けていますか?
もう1つリクエストしましょう。
[これらのキャラクターをあなたが私のためにデザインしたストーリーのアウトラインに持ち込み、タイトルをデザインしてください。 】
結果は大画面で上映され、小説は「川と湖の正義の戦い」と呼ばれ、ストーリーのアウトラインにキャラクターと劇的な対立が追加されています。 ここの第4章と第5章では、この悪役の偉大なマスターは紹介されたばかりのムロン・グチェンであるとも述べています。
プロセス全体を通して、私は難易度を上げ続け、その記憶を妨害するための新しい要件を提案し続けました、そしてウェンシンはまだ以前のすべてのニーズと答えを覚えていて、ストーリーラインとキャラクターに正確に対応することができました、そして彼の記憶は非常に素晴らしかったです。
それから今テストシーンのみんな、あなたは覚えていますか、主人公リンガーの特別な能力は何ですか?
たぶんほとんどの人は覚えていないので、ウェンシンが覚えているかどうか見てみましょうか?
【ヒロインが持っている能力とは? 】
さて、答えは出ています、それは内部の力と飛行を操作する力です。 これは、Wen Xinが最初の対話で書いたテキストの例です。 さて、5ラウンドの対話と数千語のフィクションの後、それはまだそれが以前に書いたものを覚えていることができます、それは大きなモデルの記憶能力です。
たとえば、広告コピーを作成するには、作成のテーマを理解し、作成のロジックを明確にし、メモリを通じて一貫性を維持する必要があります。
問題解決においては、理解力、生成力、論理力、記憶力を総合的に応用することも必要です。
包括的なアプリケーション例を見てみましょう。
まず、再構築されたBaiduアプリを開き、患者が取り出した薬箱をカメラでスキャンし、小さな活字で指示を見る必要はなく、デジタル人間の医師が説明をお手伝いします。
「食前か食後か」、「アルコールを飲むか食べられるか」、「他にどのような予防策があるか」など、今画面に表示された質問は、毎日の投薬で多くの患者が問題に遭遇することになります。
大規模なモデルは、患者が薬の指示を解釈するのに役立つだけでなく、パーソナライズされたニーズを組み合わせて投薬の効率を改善し、患者の投薬の正確さと適時性を確保できることがわかります。
少し前に、私たちはWen Xinモデルを専門的な医学的知識と組み合わせ、スピリットメディシンボットを適用して患者と医師が話し、医療記録を生成するのに役立つスピリットメディシンビッグモデルをリリースしました。 この例では、論理メモリを理解および生成する機能だけでなく、マルチモーダル音声、ビジョンなどの機能も使用します。
前回のデモは、主に、すべてのAIネイティブアプリケーションの存続の基礎となる理解、生成、ロジック、メモリの4つの機能におけるWenxinモデルの進歩を反映しています。 同様に、基本モデルの上に構築された豊富なAIネイティブアプリケーションエコロジーがなければ、大規模なモデルは価値がありません。
次に、大型モデルで再構築されたこれらの製品がどのように見えるかをお見せします。 これはまた、すべての人の想像力を広げ、より素晴らしいAIネイティブアプリケーションを作成するようにすべての人を鼓舞するためでもあります。
Baiduの新しい検索は、インターフェイスを開くと、検索ボックスが表示されるだけでなく、検索結果が過去とはまったく異なります。
**再構築された新しい検索には、極端な満足度、推奨刺激、および複数回の相互作用の3つの特徴があります。 **
究極の満足とは何ですか? 検索ボックスに "MBTI とは" などの質問を入力すると、次のような質問が入力されます。 「横に駐車する方法」、新しい検索はもはやあなたにたくさんのリンクを与えることではなく、大きなモデルを通して理解し、最良の答えを生成することです
例えば、「過去20年間の国別産業付加価値ランキング」を尋ねると、新しい検索では直接答えがわかるだけでなく、動的なチャートで答えが表示されます。
私の後ろの大画面から、過去20年間で、私たちの工業製造業は急速な発展を遂げ、製造国から製造大国に変貌していることがわかります。
これは究極の満足です:あなたに究極の答えを与えるための一歩。
それで、2番目のステップは、答えを見た後、他に何を見たいですか?
これは、推奨刺激が使用される場所です。 たとえば、動的チャートの後、推奨励起関数は、「産業付加価値とGDPの関係は何か」と「産業が国民経済の発展に与える影響は何か」も気になるかもしれません。 クリックして回答を取得します。
もちろん、すべてのニーズに単一の正解があるわけではありません。 ユーザーのニーズは複雑な場合があり、1文または2文では明確ではありません。 また、ユーザーが非常に複雑な要件を一度に大きな説明で完全に表現することも困難です。
現時点では、ユーザーにサービスを提供するために、より斬新でパーソナライズされた検索モデル、つまりマルチラウンドインタラクションを使用する必要があります。
この例を見てみましょう。
たとえば、「北京周辺の登山におすすめの場所はどこですか」と尋ねると、白華山や海陀山など、ハイキングルートに偏った複数の回答が得られます。
次に、それはあなたの状況の選択を補足するためのいくつかのヒントを与えます、あなたは初心者、親子と落ち葉を見ることの間で選ぶことができます。 現在、比較的登りやすく、親子の活動に優しい西山と白王山を推奨するように変更されました。
次に、登山やハイキングにはどのような機器が必要ですか? 答えはトレッキングポール、ハイキングシューズなどであり、以前に親子ツアーを選んだことも思い出し、特に子供の世話をする方法についてのヒントを提供しました。
検索は、まだその単純なボックスから始まりますが、次のステップでは、元の検索モードを上回って再構築し、検索の品質を向上させただけでなく、検索の適用範囲を突破し、製品の境界を拡大しました。 そういう
AIインタラクティブ検索は、検索業界の世代変革をリードします。
近い将来、検索は親密なアシスタントになり、いつでも「終わり」の限界を呼び起こし、解決し、さらには「終わり」の制限を打ち破り、いつでもどこでも対応し、ニーズを満たし、プロセス全体に同行することができます。
次に、2番目のAIネイティブ思考製品であるBaidu GBI、生成的ビジネスインテリジェンス、つまり生成的ビジネスインテリジェンスを見てみましょう。 **
これはゼロからの製品であり、既存の製品のリファクタリングではありません。 **
私たちのビジネスの世界では、最も切り離せないのはビジネス分析、つまりBIであり、最速のビジネス上の意思決定を行う方法は? まず、ビデオを通して感じてみましょう。
ご覧のとおり、ビデオでは、大統領がさまざまな専門的な質問をしました。 財務分析、プロジェクトデリバリ、ユーザー分析があり、GBIの社長補佐は迅速に結果を出すことができ、社長はその場で意思決定を行うことができます。
高度なツールを持つ人々がAIに取って代わられないだけでなく、「昇進や昇給は夢ではありません」。 高度なツールを使用しない人は、職を失うリスクがあります。 **
では、バイドゥGBIはどのようにして一歩先を行くのでしょうか。 これは、次の3つの方法で従来のデータ分析を覆します。
まず第一に、従来のBIは専門家のみが操作できますが、GBIは社長の質問を直接理解してリアルタイムで実行できます。
第二に、GBIは便利なアクセス方法を提供し、企業はデータにアクセスし、質問をし、自然言語でデータを分析することができ、データベースやテーブル全体でさまざまな専門的な操作を手動で行う必要がなくなります。
第三に、GBIには学習能力もあり、企業は独自の業界専門知識を注入して業界の専門家になることができます。
これはBaidu GBIで、ビジネスアナリストが十数日で完了できるデータ分析とレポート作成作業を分単位に短縮できます。 世界のいわゆる武道はすぐに壊れることしかできません。
**企業の競争、大きな魚は小さな魚を食べませんが、速い魚は遅い魚を食べ、競合他社よりも速い意思決定は、あなたが勝つ可能性があります! **
今日、それはバイドゥの人々がなくてはならないスーパーアシスタントになりました。
今、誰もが見てください、これはリアルタイム録画を行うストリームのようなものです。 今述べたすべての点を覚えているかどうか見てみましょう。
議事録のワンクリック生成機能です。 会議を効率的に行う方法は技術的な仕事だと言います。 この機能により、会議の作業負荷が大幅に軽減され、会議時間が40%短縮されます。
別の一般的なシナリオは、ワークグループです。 職場のほとんどの人は、さまざまなグループチャットメッセージに襲われることがよくあります。 次に、グループチャットの要点をすばやく要約すると、非常に便利な機能になります。
製品マネージャーがそれをどのように使用しているかを見てみましょう。
彼には9つのワークグループがあり、一定期間遅れ、1000を超える未読情報がある可能性があり、Ruliuは「1000メッセージ、1秒でフォーカスを取得する」だけでなく、読む必要のあるコンテンツをいくつかのカテゴリにインテリジェントに分割することもできます:「確認を待っている」、「焦点を合わせる」、「トピックディスカッション」、作業効率を大幅に向上させます。
それで、それは正確に洗練されていますか、それは誤解されますか、それとも重要な情報を見逃しますか? これにより、大規模なモデルを理解して生成する能力がテストされます。 理解が深ければ深いほど、要約はより正確になります。 フロースーパーアシスタントなどの1,000、10,000個の情報は、数秒でインテリジェントな分類とインテリジェントな要約を提供することもできます。
航空券、ホテル、交渉など、これらの取引タスクは面倒で時間がかかります! 些細なタスクを解決するのに役立つAIアシスタントがあれば、もっと働きたいですか?
たとえば、最近、Ruliuのプロダクトマネージャーは、PICCの王氏と会うために上海に旅行することを計画しました。 PICCは、製品やサービス、ビジネスモデル、デジタルテクノロジーなどのイノベーションを推進しており、バイドゥの人工知能テクノロジーが役割を果たすことができることを私たちは知っています。
この出張の旅程は、スーパーアシスタントのルリウに引き渡すことができ、そのパフォーマンスを見てみましょう。
スーパーアシスタントは、スケジュール情報に基づいて旅行を手配できます。
最新の会議が4時に終了するように、7:30以降にフライトを予約してください。 そして、彼の旅行基準に従って、彼が滞在できるホテルを見つけるのを手伝ってください。 最後に、顧客への招待状が発行されました。
彼はクライアントと会う前にいくつかの背景を必要とするかもしれません、そしてスーパーアシスタントもこれで彼を助けることができます。 CRMや他の社内システムデータとの連携により、連携案件や訪問記録など詳細なデータを提供します。
ビジネス協力の状況やフローなどの外部情報を理解することで、ディスカッションリファレンスを生成し、顧客が尋ねる可能性のある質問を事前設定し、協力の提案を行うのにも役立ちます。 この観点から、ルリウは本当のアシスタントのようなものですか?
たった3つの言葉で、Ruliuは旅行伝票、マシンワイン、スケジュールの予約を完了し、Ruliuの「ワンクリック旅行」である交渉の参考資料も準備しました。 それはどのようにそれをしますか?
これは、大規模なモデルの理解、生成、ロジック、およびメモリ機能の包括的なアプリケーションであり、複雑なタスクを複数の単純なタスクに自動的に分解して個別に実行し、マージして最終結果を生成します。 効率の向上とは、「スマートワーク」を「ハードワーク」に置き換えさせるなど、競争力を高めることだと言います。
Baidu図書館は、私たちの仕事、学習、創造の習慣を完全に変えます。
過去にどのように作成したのですか? たとえば、心理学におけるAIの応用についてプレゼンテーションを行っているとします。 情報の確認、資料の整理、原稿の執筆、PPTの作成、PPTの美化には数日かかります。
今日、Baidu Wenkoでは、大画面を見て、1つの文で作業を開始できます:最初に、あなたはそれがスピーチを書くことを望みます、そしてそれは人工知能と心理学のトピックに関する何十もの資料を見つけます。
また、どれが学術雑誌、権威あるレポート、そしてどれが単なる大量資料であるかを特定することもできます。 活気のある記事を書きたい場合は、エッセイやポピュラーサイエンスなどの人気のある資料を選択してください。
次に、厳密な学術スピーチが必要な場合は、コンテンツの正確性を確保するために、信頼できるコンテンツのみを確認できます。 次に、これらの原稿を理解することにより、ライブラリは、コンテンツを磨き、フォーマットしながら、適切に構造化され、明確に定義された記事を作成します。
これは、Baidu Wenkuがすでに10億の高品質のドキュメントを持っているため、これらの内容の理解に基づいて、多くの大規模なモデルのような深刻なナンセンスではなく、真に実用的で明確なドキュメントを作成し、一般的な空の話でもありません。
次に、プレゼンテーションにもPPTが必要です。 ライブラリは、原稿を収集した資料の一部と組み合わせて、PPTのフレームワークを自動的に生成し、図面を美化して数十ページのPPTを作成できます。
スタイルの選択やワンクリックのスタイルの切り替えなど、マルチモーダル生成機能を備えたゲームプレイもあります。 しかし、図書館の能力をよりテストし、内容を正確に理解する必要がある場所がいくつかあります。 たとえば、正しいチャートを設計するには、アイデアが並置されているか従属しているかにかかわらず、アイデア間の関係を知る必要があります。
この理解能力のために、ライブラリはPPTの生成に基づいてこのPPTに対応する音声スクリプトを書くこともできます。 それだけでなく、これらのコンテンツを使用して、視聴者が尋ねる可能性のある質問を推測し、回答の準備をすることもできます。
ライブラリ、特にPPTを生成する機能は、外国であろうと国内であろうと、市場に出回っている他のどのツールをはるかに超えていると評価しました。 過去には、人々は既製のコンテンツを見つけるために図書館にやって来ました。 将来的には、人々は他のどの生産性ツールよりも効率的に、好きなようにコンテンツを制作できるようになります。
少し前まで、Baidu Wenkuの新しいバージョンの初日、新しいAI機能は200万を超えるエクスペリエンスをもたらしました。 今では、ビッグモデルの時代には、Baidu Wenkuがコンテンツを制作するための最良の出発点であると自信を持って言えます。
AI再構築の方向では、Baiduネットワークディスクは、個人ファイルのインテリジェントサービスで良い仕事をすることに焦点を当てています。
今表示されているのは、Baiduネットワークディスクの新しいホームページです。
**再構築されたネットワークディスクは、グラフィカルインターフェイスインタラクションから自然言語インタラクションへの変換を実現するだけでなく、マルチモーダル情報理解を強化します。 **
これで、たった1文で、オンラインドライブ内のファイル、写真、ビデオなどを操作できます。
最初のポイントは、写真やビデオを見つけることです。 時々、私たちは絵を考えて、ネットワークディスクでそれを見つけたいのですが、多くの場合、多くのステップの後、半日投げても見つかりません。 今、あなたは「クラウドワン」に一言言います、そしてそれはあなたがそれを特定するのを助けることができます:
まあ、それは私がOpenAIのチーフサイエンティストLLYAがトランスフォーマーについてインタビューしたものをすぐに見つけるのに役立ちました。
この一見単純な検索の背後には、ビデオコンテンツを理解し、キャラクターを識別し、コンテキストメモリを形成して、ビデオの特定のフレームを正確に特定できる複数のAI機能の役割があり、これはグローバルなパーソナルクラウド分野で非常に最先端のテクノロジーです。
Yunyiの2番目の機能は、ユーザーがビデオの内容をすばやく理解できるようにすることです。
内容を要約・要約する能力と、黄金の文章を抽出する能力の2つの能力が発揮されていることがわかります。 これは43分のインタビューで、AIの理解と論理的能力を通じて、Yun Yiduoはビデオを要約して改良し、Llyaと彼の主なアイデアを紹介しました。
しかし、多くの場合、元のテキストは非常にエキサイティングであり、メインのアイデアや要約を蒸留した後、それほど魅力的ではないので、今の2番目の機能は、実際には私にとってより便利だと思います、つまり、元のビデオの最もエキサイティングな部分である黄金の文章を見つける必要があります。 たとえば、LLYAは、「統計法則を学ぶことは、外観を見ることよりもはるかに重要である」と述べています。 この黄金の文章を抽出する上での重要なブレークスルーは、世界をリードする技術であるマルチモーダル情報の効率的な抽出です。 長い面接内容から最適な部分を見つけられるため、学習効率や作業効率が大幅に向上します。
AI再構築後の新しいネットワークディスクです。 昨日の時点で、Yunyiは2000万人のユーザーに達しました。
パーソナルクラウドに基づくAIインテリジェントアシスタントです。 過去10年間で、Baiduはいわゆるネットワークディスクを定義してきました。 今後10年間で、バイドゥはAIを使用して新しいネットワークディスクを再定義します。
この18年前の製品をAIネイティブ思考で再構築し、世界初のAIネイティブマップ製品でもあります。
過去18年間、Baidu Mapsは豊富な機能を蓄積しており、ナビゲート、タクシーの呼称、代替ドライバーの検索、ホテルの予約、チケットの購入、さらにはより複雑な条件下でのPOI検索のニーズを満たすことができます。 以前は、これらの操作は複雑で、完了するまでに 6 つまたは 7 つ以上の手順が必要になることがよくありました。
これで、ユーザーが需要を言う限り、マップは何千ものサービスAPIインターフェイスを動員でき、マルチレベルメニューはワンステップの直接的かつ迅速な応答になります。
次に、バイドゥマップはどのように実装されていますか?
ビデオでは、ユーザーはBaidu Mapの汎需要の理解、中間のミーティングポイントの選択、複数の場所からの情報の比較、将来の旅行の推奨と予約をテストし、合理的なソリューションを提供します。