**10 月 6 日のニュース、数日前の新製品発表カンファレンスで、Google は、より複雑な ML を実行できる Tensor G3 チップを搭載した新世代の Android フラッグシップ携帯電話 Pixel 8 / Pro シリーズを正式にリリースしました (機械学習)モデルを導入し、さまざまな言語や「より自然な」音声でユーザーに Web ページを読み上げたり、より自然に話す仮想アシスタントなど、多数の AI 機能強化を新しい携帯電話に追加しました。
Google は、Pixel 8 Pro は、Google の基本的な大規模モデルをデバイス上で直接実行する最初の携帯電話であり、これには Pixel 7 の最大の ML モデルの 150 倍の計算が必要であると指摘しています。
同時にGoogleは、携帯電話のパーソナルアシスタント機能と生成AIを組み合わせたAndroidおよびiOSデバイス向けの「Assistant with Bard」のリリースを発表し、ユーザーはテキスト、音声、画像を通じてBard Assistantと対話できる。言葉で言えば、それはマルチモーダル**です。
たとえば、ユーザーが「今週見逃した重要なメールは何ですか?」と尋ねると、吟遊詩人アシスタントは重要なポイントと特定の内容をリストし、対応する特定のメールへのリンクを添付します。また、ユーザーがアクティブなアドレスを抽出して表示するのにも役立ちます。 Google マップで表示します。
さらに、DeepMind の共同創設者であるムスタファ・スレイマン氏は最近のインタビューで、現在の生成 AI は技術的に過渡期にすぎず、次に AI がさまざまなタスクのニーズに基づいて構築されるインタラクティブ AI 時代**に突入すると述べています。他のソフトウェアを手配するか、実際の担当者に連絡して仕事を完了してもらいます。
彼は、AI の最初の波は主に分類に焦点を当てていると考えています。深層学習は、人間が AI を訓練して画像、ビデオ、音声、言語などの入力データを分類できることを示しています。人類は現在、「データを入力して新しいデータを生成する」という意味の「生成型AI」の第2波の中にいます。将来の第 3 の波は「対話型 AI」です。「対話は未来の対話型インターフェースです。」ユーザーはボタンをクリックしてテキストを入力するだけでなく、AI と直接対話します。その時までに対話型 AI は、独立した行動、行動。
天豊証券は、CサイドAIアプリケーションの実装段階でのシナリオの重要性がより顕著になってきており、チャットボット、AIコンパニオン、コンテンツ制作ツールのシナリオが最初に実装されると指摘し、その開発スピードと商用化の進捗状況を指摘した。これらのシナリオにおける AI アプリケーションは、予想を超える可能性があります。
別の生成 AI アシスタントが「搭載」されます。 Googleがマルチモーダル吟遊詩人アシスタントをリリース、インタラクティブAI時代は近い?
出典: Financial AP通信
**10 月 6 日のニュース、数日前の新製品発表カンファレンスで、Google は、より複雑な ML を実行できる Tensor G3 チップを搭載した新世代の Android フラッグシップ携帯電話 Pixel 8 / Pro シリーズを正式にリリースしました (機械学習)モデルを導入し、さまざまな言語や「より自然な」音声でユーザーに Web ページを読み上げたり、より自然に話す仮想アシスタントなど、多数の AI 機能強化を新しい携帯電話に追加しました。
Google は、Pixel 8 Pro は、Google の基本的な大規模モデルをデバイス上で直接実行する最初の携帯電話であり、これには Pixel 7 の最大の ML モデルの 150 倍の計算が必要であると指摘しています。
同時にGoogleは、携帯電話のパーソナルアシスタント機能と生成AIを組み合わせたAndroidおよびiOSデバイス向けの「Assistant with Bard」のリリースを発表し、ユーザーはテキスト、音声、画像を通じてBard Assistantと対話できる。言葉で言えば、それはマルチモーダル**です。
たとえば、ユーザーが「今週見逃した重要なメールは何ですか?」と尋ねると、吟遊詩人アシスタントは重要なポイントと特定の内容をリストし、対応する特定のメールへのリンクを添付します。また、ユーザーがアクティブなアドレスを抽出して表示するのにも役立ちます。 Google マップで表示します。
さらに、DeepMind の共同創設者であるムスタファ・スレイマン氏は最近のインタビューで、現在の生成 AI は技術的に過渡期にすぎず、次に AI がさまざまなタスクのニーズに基づいて構築されるインタラクティブ AI 時代**に突入すると述べています。他のソフトウェアを手配するか、実際の担当者に連絡して仕事を完了してもらいます。
彼は、AI の最初の波は主に分類に焦点を当てていると考えています。深層学習は、人間が AI を訓練して画像、ビデオ、音声、言語などの入力データを分類できることを示しています。人類は現在、「データを入力して新しいデータを生成する」という意味の「生成型AI」の第2波の中にいます。将来の第 3 の波は「対話型 AI」です。「対話は未来の対話型インターフェースです。」ユーザーはボタンをクリックしてテキストを入力するだけでなく、AI と直接対話します。その時までに対話型 AI は、独立した行動、行動。
天豊証券は、CサイドAIアプリケーションの実装段階でのシナリオの重要性がより顕著になってきており、チャットボット、AIコンパニオン、コンテンツ制作ツールのシナリオが最初に実装されると指摘し、その開発スピードと商用化の進捗状況を指摘した。これらのシナリオにおける AI アプリケーションは、予想を超える可能性があります。
AIのイテレーションとその後のイベント触媒作用は今後も加速するとアナリストは予想しており、今年下半期からは海外大手のアプリケーションやモデルのイテレーション速度が大幅に向上し、一般的なチャットボットの機能もさらに強化されると予想されている。ユーザーエクスペリエンスの向上とユーザー数のさらなる増加につながる可能性があります。
さらに、Huajin Securities は、大規模モデルの一般シナリオから垂直シナリオへの移行は、むしろ商業化の探求であり、大規模モデルがトレーニングから推論に移行する原動力であると付け加えました。 縦型大型モデルの開発と改善により、大型モデルの適用が成長の余地を大きく広げる鍵となります。エッジコンピューティングは明確で巨大なインクリメンタル市場であり、業界導入段階に達しており、クラウドコンピューティング企業、通信事業者、機器メーカー、CDN事業者などが積極的に業界導入を推進しています。