Google のアプローチは、大規模モデルを特定のアプリケーションに統合し、アプリが独自の大規模モデル機能を備えられるようにすることです。たとえば、Gmail ではメールを自動的に作成できます。ユーザーは Gmail の「書き方を手伝って」にニーズを入力するだけで、以前のメールの情報を組み合わせて完全なメールを作成します。たとえば、親友のリー・フアに毎日熱心に勉強するよう説得するなどです。
「Help me write」は Google Workspace(ワークスペース)機能の一部にすぎません。Workspac のその他の機能には、PPT コンテンツに基づいてスピーチを自動的に作成する機能などがあります。このようなサービスがクラウドで実行されるかオンプレミスで実行されるかは不明です。
ハードウェア会社として、クアルコムと Google はまったく異なる考えを持っており、大規模なモデルをアプリケーションの一部ではなく、独立したアプリケーションとして携帯電話上で実行することを望んでいます。
今年 6 月、クアルコムはデモビデオを公開しました。インターネットに接続していない Android スマートフォンは、安定拡散を使用して AI 画像を生成し、プロセス全体は 15 秒を超えません。
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
携帯電話 + AI モデルにはギミック以外に何が残っていますか?
2023 年に最も話題の人工知能アプリケーションである AI モデル。
スマートフォンは世界で最も普及しているスマート端末です。
1 つは将来の人工知能の波を表し、もう 1 つは過去 20 年間で最も成功した技術製品であり、中国語ではこれらはすべて同じ「知能」という言葉で表されます。
したがって、この2人の組み合わせは「運命」のように思えます。
今年4月、Qiji Chuangtanの創設者兼最高経営責任者(CEO)のLu Qi氏は講演の中で、未来はどこにでもモデルが存在する時代であると述べ、いつか大型モデルが携帯電話上で動作するようになるだろうと予測した。
少し前の2023年MWC上海モバイル通信カンファレンスで、HonorのCEOであるZhao Ming氏は、デバイス側にAIラージモデルを導入し、デバイス側で「パーソナルモデル」を作成することを率先して行うと述べた。同氏はまた、「この大規模なモデルは、私たちの思考の限界の多くを打ち破ったもので、これまでに見た中で最も優れたAIの解釈である」とも述べた。
当時、最高価格のフラッグシップ携帯電話であるHonor Magic V2の発売が近づいており、外部からは「HonorがMagic V2に初めて大型モデルを搭載する」と解釈されていた。
Honor は 7 月 12 日に折りたたみ式スクリーン携帯電話 Magic V2 を発売しましたが、その結果、Honor Magic V2 が初の大型スマートフォンではないことが明らかになりました。 1時間以上の記者会見で、趙明氏は大型モデルについてのみ言及した。しかし、Honorは「遅れている」とはいえ、携帯電話+AIモデルの議論は全く止まっていない。
Google、Huawei、Xiaomi、Baiduなどは、携帯電話に大規模モデル関連技術を採用することを示唆している。例えば、Baiduは今年5月にXiaodu携帯電話を発売したが、これも外部からはBaiduがハードウェア面で大型モデルを実装したいという希望があると解釈された。
数ある大型の「コンセプト株」の中でも、携帯電話メーカーが比較的信頼できそうだ。ただ、大手モデルにはすでに注目のスポットが多すぎるのですが、携帯電話メーカーは例外になるのでしょうか?
**AI大型モデル+携帯電話=? **
携帯電話と AI モデルをどのように組み合わせるかについては、現在業界で 3 つの主流ソリューションがあります。
1 つは、クラウド サービスや ChatGPT に似たアプリです。クラウドは大規模なモデル計算を提供し、それを携帯電話にフィードバックします。このソリューションの利点は、モバイルの弱い計算能力に依存する必要がないことです。電話の欠点は、インターネットに接続する必要があり、情報セキュリティに問題があることです。
2 つ目は、ローカル展開、ローカル コンピューティング、およびローカル サービスです。携帯電話に付属のプロセッサを直接使用して大規模モデルを実行します。これは、Zhao Ming 氏が「デバイス側」と呼んだものです。ネットワークに制限されず、情報がローカルに保存されるのが利点だが、携帯電話の計算能力が大型モデルの動作をサポートできるかが問題となる。
3 番目の解決策は、上記 2 つを組み合わせることであり、クラウドと端末が一緒に実行されます。メリットとデメリットは、上記 2 つのメリットとデメリットでもあります。
実際、Honor が携帯電話に AI モデルを導入すると発表する前に、携帯電話と AI モデルの間の大規模な接続を確立しようとした最初の企業は、Android システムの本拠地である Google でした。
もちろん、Google には携帯電話と大型モデルを組み合わせる十分な理由があります。同社の Android システムは世界のスマートフォンの 81% を制御しており、Google AI と DeepMind (AlphaGo 開発者) という 2 つのトップ AI 研究機関があり、大型モデルのインフラストラクチャとなっています。トランスフォーマーの作者。どう考えても、携帯電話+AIモデルを実現するにはGoogleが最適なターゲットだ。
しかし、OpenAIが昨年末にChatGPTをリリースして世界中で普及して以来、Geegleは外の世界では「出遅れ者」になってしまった。議論の余地のない事実は、Google が AI 分野に巨額の投資を行ったにもかかわらず、この AI の波で最も輝かしいスターになることができなかったということです。
そこで、ChatGPT 3.5 のリリースから半年後の今年 5 月、Google はついに ChatGPT に対抗する新世代の大規模言語モデル PaLM2 をリリースしました。差別化された競技として、PaLM2 はスマートフォンに導入できますが、ChatGPT トレーニングには数万枚の NVIDIA A100 グラフィックス カードが必要です。
もちろん、Google は携帯電話とプロ仕様の AI グラフィックス カードとのギャップも認識しているため、すべての大型モデルを携帯電話に展開できるわけではありません。 PaLM2 には 4 つの大きなモデルが含まれており、パラメータのスケールに応じて大から小まで、Unicorn (ユニコーン)、Bison (バイソン)、Otter (カワウソ)、Gecko (Gecko) という名前が付けられています。携帯電話で実行できるのは最小限のパラメーターを備えた Gecko だけであり、Google によればオフラインでも十分に高速に動作するとのこと。
**携帯電話での AI モデルの用途は何ですか? **
あいまいな専門用語は別として、AI モデルがどのような機能やサービスをもたらすことができるかは、何十億ものスマートフォン ユーザーにとってより重要です。 ChatGPT のような単なるチャット ロボットであれば、誰もが「なぜ 2 番目の ChatGPT を使用しなければならないのですか?」と疑問に思うかもしれません。
Google のアプローチは、大規模モデルを特定のアプリケーションに統合し、アプリが独自の大規模モデル機能を備えられるようにすることです。たとえば、Gmail ではメールを自動的に作成できます。ユーザーは Gmail の「書き方を手伝って」にニーズを入力するだけで、以前のメールの情報を組み合わせて完全なメールを作成します。たとえば、親友のリー・フアに毎日熱心に勉強するよう説得するなどです。
「Help me write」は Google Workspace(ワークスペース)機能の一部にすぎません。Workspac のその他の機能には、PPT コンテンツに基づいてスピーチを自動的に作成する機能などがあります。このようなサービスがクラウドで実行されるかオンプレミスで実行されるかは不明です。
ハードウェア会社として、クアルコムと Google はまったく異なる考えを持っており、大規模なモデルをアプリケーションの一部ではなく、独立したアプリケーションとして携帯電話上で実行することを望んでいます。
今年 6 月、クアルコムはデモビデオを公開しました。インターネットに接続していない Android スマートフォンは、安定拡散を使用して AI 画像を生成し、プロセス全体は 15 秒を超えません。
AI画像・アニメーション生成ツールとしてStable Diffusionもここ1年で脚光を浴びていますが、それ以前はStable Diffusionは個人ユーザーがコンピュータ上で利用することがほとんどであり、計算能力に対する要求も決して低くありません。
クアルコムが携帯電話で安定拡散を実行できる理由は、主にクラウドと端末を組み合わせて一連の「ハイブリッド AI」を作成するためです。コンピューティング能力の需要が大きい場合は、コンピューティングのためにクラウドに引き渡されます。計算能力の需要が低い場合は、端末によってローカルで処理が完了し、同時に実行することもできます。クアルコムは自社の計画を支持するために、「ハイブリッドAIはAIの未来である」というホワイトペーパーまで発表した。
ただし、将来的にどのソリューションが主流になるかを言うのはまだ困難です。
**大きなモデルをもっと必要とする人はいるでしょうか? **
Honorは携帯電話メーカーの中でAIの大規模モデルを携帯電話に導入することを明言した最初のメーカーだが、その熱意の裏にはHonor独自の配慮もある。
今年第2四半期の時点で、世界のスマートフォン出荷台数は7四半期連続で減少しているが、アップル、サムスン、シャオミなどの携帯電話メーカーは軒並み危機を免れており、オナー社も楽観視していない。
TechInsightsのデータによると、今年第1四半期の中国におけるHonor携帯電話の出荷台数は前年同期比22.2%減少し、国内携帯電話メーカー上位5社の中で2番目に大きな減少となり、市場シェアも2位から低下した。前年同期は4位に。
携帯電話市場が縮小し、同質性がますます深刻になる中、AIモデルはスマートフォンに新たな想像力を与え、その将来性は不透明ではあるが、Honorはそれを必要としている。
Google は世界で最も多くのソフトウェア ユーザーを抱えており、その 15 のアプリのユーザーは 5 億人を超え、クアルコムはこれまでに AI コンピューティング機能を備えた製品を 20 億以上出荷しています。携帯電話メーカー以上に携帯電話+AIの大型モデルを積極的に推進する理由もある程度ある。
しかしその一方で、近年は「携帯電話の過剰な性能」や「システムの肥大化」も物議を醸しており、グーグルやクアルコム、携帯電話メーカーは大規模なAIモデルを必要としているが、同時にユーザーからの疑問にも直面している。最良のネガティブ教材は、かつて大いに期待された「携帯電話で3Aの名作をプレイする」というクラウドゲームだが、現在に至るまでまだ市場の主流にはなっていない。 Google自体もクラウドゲームプラットフォームを閉鎖した。
さらに、「スマートフォンの翼」であるアップルは、これまでのところ関連する措置を講じていない。今年6月のWWDCでは、Appleは「AI」や「ビッグモデル」について一度も言及せず、関連技術を説明する際には、より伝統的で学術的な用語である「Machine Learning」(機械学習)を使用した。
Apple は昔から「下手なら出さない」の典型であり、Apple の保守性はスマートフォンへの AI 大型モデルの適用がまだ機能模索期にあることを側面から証明しているのかもしれない。ユーザーのニーズは不明です。
「いずれにせよ、携帯電話業界のイノベーションは長い間沈黙してきた。大型モデルが新たな市場と活力をもたらすことができれば、誰もがそれを喜ぶのは明らかだ。たとえ失敗したとしても、それはまた別のことでしかない」巨人の「誤審」。