Xiaomiの大型モデルが初めて公開され、Huawei Xiaoyiが最初に書類を提出 携帯電話のGPT時代は近づいているのか?

出典丨Smart Things

著者 | ユンペン

編集 | ハートフェイト

携帯電話メーカー間の大機種争奪戦が目前に迫っている。

たった今、Xiaomi の大型モデルが突然画面に現れ、C と CMMLU の 2 つの大型モデル テスト プラットフォームでそれぞれ中国語で 10 位と 1 位を獲得し、C ランクは Alibaba Cloud の Tongyi Qianwen を上回りました。

▲Cリスト

C-およびCMMLUは現在、業界で権威のある中国の大規模モデルベンチマークテストとして認識されており、主に中国語分野の大規模モデルの包括的な知識の蓄積と言語理解能力を検査していることを知っておく必要があります。

▲CMMLU評価一覧

つい先週、ファーウェイの音声アシスタント「Xiaoyi」にも、自社のPanguモデルの機能の一部が統合され、音声アシスタントを使って記事の要約を書いたり、会議への招待メールを書いたり、自分の写真を使ってパーソナライズされたデザインを作成したりすることが現実になった。

国内携帯電話メーカーは大型機種路線で「音を出さなければ大ヒット作」という姿勢だ。 1 つはすでにアプリケーションに表示されており、もう 1 つは初めて画面に表示されます。

以前は、自社開発チップであれ、急速充電であれ、携帯電話メーカーは「新技術」を消費者市場に押し出す「先兵」のように見え、一般の人が新技術に触れられるようになっていました。

大規模モデルに基づく生成 AI の波の中で、携帯電話メーカーは新たな戦いを迎えることになるでしょう。

海外では、GoogleとAppleはすでに自社のインテリジェント音声アシスタントの「動員」を開始しており、大規模モデルの応用を模索している中国では、Xiaomiの大規模モデルの結果が発表される前に、XiaomiのAI研究所所長、Wang Bin氏がこう述べた。はすでにXiaomiの大型モデルについて外部に伝えており、モデル分野の計画と進捗に関しては、Xiaomi CEOの雷軍氏とXiaomi社長のLu Weibing氏も公の場でXiaomiの大型モデルと関連レイアウトについて何度も話してきました。 。

HonorのCEO、Zhao Ming氏は、Honorは大規模ネットワークモデルの需要に応じてインターネット企業と協力しており、地味に見えるOPPOとvivoは実際にはAI分野に長年取り組んでいると述べました. テストでは最高位にランクされ、いくつかの大手 AI 企業と協力しています。ファーウェイ側では、Xiaoyiはすでに上陸している。

表面的には波は穏やかだが、携帯電話メーカー各社の大型機種争いは目前に迫っている。各家庭が秘密裏に板道路を建設し、AI技術を駆使した熾烈なゲームが始まろうとしているかもしれない。

Xiaomiは大規模なモデルチームを結成し、Honor OVは「自己研究+協力」モデルを採用する可能性があります

携帯電話メーカーは、大規模モデルを自社用に作る場合と、他社の大規模モデルを流用する場合の2通りの使い方をしています。

現時点では、HuaweiとXiaomiが一歩先を行って自社用途に使用しているが、Honor、OPPO、vivoは大型モデルのレイアウトに関する公式情報を持っていないが、その中でもOVと他のメーカーは大型モデルに関する関連情報を持っているが、 、この2つがどのように採用されるかはまだ不明です。

まず第一に、今日画面をスワイプしている Xiaomi を見てみましょう. 実際、Xiaomi のインテリジェント音声アシスタントである Xiao Ai は、さまざまな企業の音声アシスタントの中で最も有名であると言うべきであり、また最も幅広い機能を備えていますXiaomi のほぼすべての種類の IoT デバイスが Xiao Ai にアクセスでき、Xiaomi はすべてのスマートフォン メーカーの中で最も多くの IoT エコデバイスを持っています。Xiaomi は、Xiaomi AI モデルが Xiao Ai と組み合わせられる可能性があることを明らかにしました。未来。

決算発表であれ、一部の公開インタビューであれ、シャオミの関連幹部らは大型モデルについて肯定的な見解を表明し、大型モデルに対するシャオミのレイアウトと計画について詳細に説明した。

今年4月、Xiaomi CEOの雷軍氏は個人的に、Xiaomiが大規模モデル技術を断固として採用する旨の文書を発表し、翌月の決算会見でXiaomi社長のLu Weibing氏は、同社が大規模なAI研究所を設立したことを発表した。 AI分野で1,200人以上が所属するスケールモデルチーム。

Xiaomiの大規模モデルチームの責任者はLuan Jian氏で、彼はXiaomi AI Labの所長であるWang Bin氏に直属しており、Wang Bin氏は中国科学院で20年以上NLP(自然言語処理)の研究を行った後、2018年にXiaomiに入社した。 。

Shenran とのインタビューの中で、Wang Bin 氏は、チームの目標はパラメータスケールが数百億の汎用大規模言語モデルであり、トレーニングのための設備投資は数千万人民元であると述べました。 Xiaomiの大型モデル上陸製品は「ハイブリッドモデル」を採用し、従来モデルと大型モデルがそれぞれ得意な問題を解決する。

Wang Bin氏によると、ChatGPT以前、Xiaomiは大規模モデル関連の研究と応用を行っていたが、モデルの規模は数十億単位であり、汎用的な大規模モデルではなく、主にマンマシン対話のための対話固有のモデル。

Xiaomi側では幹部らが頻繁に情報を公開し、Honor側でもCEOのZhao Ming氏がインタビューで生成AIや大規模モデルに対するHonorの見解を明らかにした。

Zhao Ming氏は、上海モバイルワールドコングレスで、Honorは大規模ネットワークモデルの需要に関してインターネット企業と協力しており、その時点で既に興味を持っている企業と連絡を取っていたと述べた。

現在、Baidu の Wenxin Yiyan、Ali の Tongyi Qianwen、Xunfei の Xunfei Xinghuo は、いずれも国内の大手インターネット企業や AI 企業が立ち上げた 3 者による大規模モデルであり、自社開発の大規模モデルは、設立間もない企業にとって非常に重要です。 Honorにとって、それは最も重要なことではなく、市場シェアと出荷量を増やすことが明らかにより重要であるため、協力することがHonorにとって大規模な技術を適用する方法である可能性があります。

OPPO側では、OPPO Chinaの劉波社長がインタビューで、OPPOが携帯電話への大型モデルの適用を検討していると述べた。

今年4月、Alibaba CloudはOPPOの大規模モデルインフラストラクチャをOPPO Andes Smart Cloudと共同で構築すると発表し、Tongyi Qianwenに基づいて大規模モデルの継続的な学習、微調整、フロントエンドプロンプトプロジェクトを完了すると発表した。 、OPPOエンドユーザー向けのAIサービスを構築します。

Huawei Xiaoyiの例から判断すると、Tongyi Qianwenを微調整して最適化し、OPPOのスマート音声アシスタントで使用できる軽量モデルを作成することは可能です。

しかし、Xiaomiの関連情報筋は、OPPOとvivoも独自の大型モデルを製造している可能性があることを明らかにしました。

この点に関しては、OV の以前の行動からもいくつかの兆候を見ることができます。たとえば、OPPO の Xiaobu アシスタント チームは、音声認識、意味理解、対話生成、知識質問応答システム、オープン ドメイン チャット、マルチモダリティなど、AI テクノロジーの分野で多くの研究を行っています。すべては生成 AI の主要テクノロジーに関連しています。

Xiaobu のアシスタント チームはこれまでに事前トレーニング モデルを調査および実装し、1 億、3 億、10 億のパラメーターを備えた事前トレーニング モデル OBERT を開発し、リストで 5 位、大規模ナレッジ マップで 1 位になりました。 KgCLUE1.0 の質問と回答のリスト。

昨年のOPPO Future Technology Conferenceでは、ユーザーの説明やアップロードした写真から絵を作成できるXiaobuのペイント機能に生成AI技術が使用された。

vivoでは、同社のAIチームが今年5月に自然言語理解タスク向けのテキスト事前トレーニングモデル3MP-Textを開発し、中国語理解評価ベンチマークのCLUEリストで1億パラメータと同じランクを獲得したモデル効果、最初にサイズ。

大型モデルが携帯電話に登場し、インテリジェントな音声アシスタントがアーリーアダプターの先駆者となる

携帯電話メーカーは大型機種の導入に積極的ですが、どうするのでしょうか?これまでに決定したことの 1 つは、さまざまな企業のスマート音声アシスタントでラージ モデルを使用することです。これにより、ラージ モデルが携帯電話の「システム レベル」機能になり、携帯電話がよりインテリジェントになります。アシスタントは「知恵遅れ」ではなくなります。

サムスンは携帯電話やタブレットのデフォルトの検索エンジンをグーグルからAIチャットに対応したマイクロソフトの新しい「ビング」に変更することを検討している。 5月のI/Oカンファレンスで、Googleはパラメータスケールの異なる4つの新世代大型言語モデルPaLM 2をリリースしたが、その中で最も小さい「Gecko」大型モデルは携帯電話上で実行できる。

Apple側では、一部の海外メディアが、Siri向けに開発コード名「Bobcat」という新しいAI機能を開発中であることを明らかにしており、新プロジェクトの技術フレームワークは「Siri Natural Language Generation」と呼ばれており、AI技術の統合も行われる予定である。避けられない。

スマートフォンの音声アシスタントにおける大型モデルの可能性は誰の目にも明らかです。

消費者にとって、インテリジェントな音声アシスタントと大規模モデルの組み合わせの既存の事例から、大規模モデルの機能を統合することで、ユーザーの音声アシスタントの使用習慣における最大の問題の 1 つである自然な対話や自然なコミュニケーションが十分ではないことが明確にわかります。それは意志で行うことはできません。

簡単に言うと、インテリジェントな音声アシスタントを、楽しくて目新しいものから使いやすいものに変え、さらには「習慣的なアクション」にすることです。大型モデルにより、インテリジェント音声アシスタントは私たちを真に理解し理解することができ、使いやすさの向上は非常に大きくなります。

一部の端末メーカーの見解では、ChatGPTのような大規模モデルのアプリケーションは、クリエイティブなコピーライティング、情報整理、質疑応答チャット、記事の要約などに重点が置かれていますが、音声アシスタントの位置づけは「インテリジェントパーソナルアシスタント」であり、デバイス制御からパーソナリティまで パーソナライズされたコンサルティング サービスを提供することで日常の事務作業の効率を向上させるには、消費シナリオにおけるインテリジェントな音声アシスタントの適用をさらに拡大する必要があります。

同時に、OpenAIのChatGPTやGoogleのBardなどの生成型AIチャットボットと比較して、インテリジェントな音声アシスタントは、音声対話、グラフィックおよびテキスト認識、サービス提案からデバイスの相互接続管理に至るまで、端末メーカーの「システムレベル」の機能となるでしょう。

関連する AI 専門家は、システム レベルの機能は、システム レベルの入り口がオペレーティング システムとより緊密に統合されていることを意味し、生態系との相互接続もシステム生態系の最下層に到達していることを意味すると Zhishi 氏に語った。この種の相互接続は本当に効率的であるまあ、この相互接続は、ChatGPT と App の間の 1 対 1 の SDK 呼び出しに匹敵するものではありません。

さらに、Huawei、Xiaomi、Honor、OV のいずれであっても、これらのメーカーはすでに幅広い IoT ビジネス レイアウトを立ち上げており、インテリジェント音声アシスタントはスマート デバイスを接続する主要な AI サービス ポータルとなっています。大規模モデルのソフトウェアおよびハードウェア エコシステム全体に対する機能。これはメーカーにとっても非常に重要です。

大きなモデルを携帯電話に詰め込むのは難しいですか?

インテリジェント音声アシスタントに大型モデルを使用することを考えるのは難しくなく、ChatGPT が登場した初日から、すべての音声アシスタント企業がこれについて考えてきました。

しかし重要なのは、それをどうやって達成するかということです。コストはそれがもたらす利益に比例するのでしょうか?数千億のパラメータを持つ GPT-4 のような大規模な言語モデルは、消費電力がわずか数ワットの携帯電話で使用される予定ですが、技術的な課題をどのように解決するのでしょうか?

これらの疑問については、上記の Huawei Xiaoyi の例でいくつかの答えが見つかるかもしれません。

一般的に、大規模モデルをスマート音声アシスタントに適用するには、少なくとも 2 つの作業を行う必要があります。まず、一般的な大規模モデルを音声アシスタントに適したバージョンに最適化します。

ファーウェイの例では、Pangu L0 大型モデルに基づいて、ファーウェイは通常の消費者シナリオに関連するデータを微調整および最適化し、Xiaoyi で使用される L1 レイヤーの対話モデルを構築しました。

これらの消費者シナリオでは、メーカーは対応するコーパス データを構築し、システムが理解して実行できるモデル出力を設計すると同時に、信頼できる構造化知識と非構造化知識を大規模モデルに入力して、大規模モデルが一般知識を学習できるようにする必要があります。 、論理的な関係。

ChatGPT は、携帯電話のセットアップや家庭内のさまざまなスマート デバイスの制御を支援することはできませんが、音声アシスタントにはそのような機能が必要であり、これはスマート音声アシスタントの非常に重要な機能でもあります。

したがって、メーカーも技術的な最適化を通じて効果的な分析と大規模モデルとシステム間の効率的な接続を実現する必要があります。まず、大規模モデルがこれらの操作スキルを学習できるように、複雑なシナリオに合わせて大規模モデルを「トレーニングして学習」します。大規模モデルの推論コストと推論時間を比較する 遅延の問題は解決されます。

音声アシスタントに適した大規模なモデルバージョンを作成するだけでは不十分で、消費電力や計算能力の問題を解決するには、デバイスとクラウドの組み合わせも重要です。

現在、ChatGPT アプリケーションはクラウド コンピューティングの能力に依存していますが、実際に音声アシスタントとして使用する場合、ユーザーの個人情報の使用と処理が含まれるため、必然的にローカライズされた運用が必要になりますが、完全にローカライズされた運用では消費電力不足の問題を解決できません。そして計算能力。

ファーウェイは、端末側とクラウド側の両方で異なる大規模モデルのバージョンを作成しており、さまざまなタスクに応じて、両方が連携して処理されます。

クアルコムはモバイルチップメーカーとして、これまで「ハイブリッドAI」コンセプトの推進に注力してきたが、実際、モバイル側で生成AIを応用するには、デバイス側とクラウド側の連携が必要となる。業界関係者全員の行動から判断すると、これは基本的に業界のコンセンサスとなっています。

もちろん、スマート音声アシスタントで大型モデルを使用することは、一言で述べたほど簡単ではありませんが、その背後には多くの技術的および産業上の課題があり、ファーウェイの例から少しアイデアを得ることができます。

しかし、難しいとはいえ、ファーウェイはこの問題の実現可能性を証明したばかりであり、インテリジェント音声アシスタントにおける大型モデルの適用は、確かに機能に多くの「質的変化」をもたらす可能性がある。

大規模モデルの戦いは熾烈を極めており、依然としてデータ、コンピューティング能力、人材が競争の中心となっています

生成 AI は数千の業界を席巻しており、大型モデルが携帯電話業界に与える影響は広範囲に及ぶでしょう。

消費者にとって、携帯電話はより「スマート」になり、より「効率的」になりました。ChatGPT の一部のテキストや画像生成機能など、音声アシスタントによって提供されるサービスを、ついにカジュアルな話し言葉で楽しむことができるようになり、スマート音声アシスタントも利用できるようになりました。インテリジェント音声アシスタント用の大型モデルの使用は必ず有益であり、消費者にとって非常に期待されていることがわかりました。

製造業者にとって、スマートフォンおよび関連する IoT デバイスに大型モデルに基づく生成 AI 機能が組み込まれることは、将来の開発において避けられない傾向であり、大型モデルがこれらのビジネスにもたらす変化は重要かつ価値のあるものとなるでしょう。

大型モデルを自社で作るにせよ、協力して作るにせよ、各メーカーがこの大型モデルの戦いに注目する必要がある。

もちろん、スマートフォンメーカー各社にとっても、この波がもたらす課題は明らかであり、この戦いに真に勝つためには、乗り越えなければならない困難が数多くある。

AI業界の一部の関係者は、独自の大規模モデルを構築したいメーカーにとって、大規模で高品質なデータの取得やクリーニングなどのデータ、計算能力、人材の蓄積が不可欠であるとZhishi氏に語った。システムレベルの課題を克服する方法、コストを制御可能にする方法のトレーニング。連携モデルを採用する製造業者は、より優れたエンドクラウドの連携処理を確保する方法、コストと利益のバランスをとる方法、ビジネス連携モデルを模索する方法のすべてに直面することになります。

結論: AI モデル、携帯電話メーカーにとって厳しい戦い

今日のノードに立って、携帯電話モックアップの戦いが始まりました。先手を打ったメーカーはすでに手札を示し、動かなかったメーカーも準備を進めています。携帯電話モックアップの戦いアンダーカレントです。

大型モデルと組み合わせた既存の音声アシスタントの成果から判断すると、AI大型モデルがスマートフォンの体験を向上させることは明らかであり、AI大型モデルはさまざまなビジネスの発展にも多大な影響を与えるでしょうAI大型モデルは、必然的に後続技術業界の主要な発展トレンドとなり、誰もが注目する主要な技術トラックの1つになるでしょう。

携帯電話メーカーにとって AI モデルは間違いなく厳しい戦いですが、産業構造を破壊したり、既存のゲームプレイを覆すような画期的な製品や技術を誰がもたらすのかはまだ不透明です。

将来に向けて、大型モデルとインテリジェント音声アシスタントの組み合わせはさらに近づき、さまざまなテクノロジー大手の追随により、インテリジェント音声アシスタントの「進化」の波は止まらなくなるでしょう。将来、どのような新しいアプリケーション シナリオ、新しいアプリケーション形式、機能が登場するかは想像力に満ちています。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)