Opinion | AIプラットフォーム開発の鍵は「ユーザーの利用シーン」

原作:ヤン・ジホン

**出典:**AI ダークホース

画像ソース: Unbounded AI によって生成

AI ダークホース ガイド 👉

「AI は新石器時代の弓矢です。」 AI によって形成される学習能力はパラメータのスケールに依存します。 GPT-2 には約 15 億のパラメーターがありますが、GPT-3 の最大のモデルには 1,750 億のパラメーターがあり、2 桁増加しています。メディアの憶測だが未確認のニュースによると、GPT-4のパラメータは100兆の規模に達する可能性がある。

この論文では主に、新時代のインタラクティブ AI プラットフォームの機能と構築、機会と課題について説明します。人工知能の構築は主にハードウェアの構築であるという一部の伝統的な見解とは異なり、中国中央ラジオテレビのオーディオビジュアルニューメディアセンターの副所長であるヤン・ジホン氏は「人」の観点から始め、「人」はユーザーであることを強調する、そしてそれは人工知能の決戦ですキャンペーンにおける戦略的リソース。彼女は、「ソフトテクノロジー」こそが、カーブでの追い越しや車線変更のための技術革新の「黄金の道」であると信じている。 「ユーザーの利用シーン」の「勝者」をしっかりと把握する。

インタラクティブ AI プラットフォームのハード パワーとソフト パワーに関する簡単な説明

01 はじめに 唯一変わらないのは変化です

イノベーションは決して止まらず、新しいテクノロジーが絶えず出現しており、AI による技術革新は私たちの生活と働き方を大きく変えています。

コンピュータ、ネットワーク、インターネットの普及がコンピュータによってもたらされる変化の波であるとすれば、AI の侵入はさらに強力かつ包括的です。伝統的な産業や職業は人工知能技術によって影響を受け、破壊され、多くの伝統的な仕事が置き換えられつつあり、継続的に学習し、新しい技術や新しいモデルに適応する必要があります。

この記事で AI について取り上げる場合、私は新しい視点を提示し、新しい時代のインタラクティブ AI プラットフォームの機能と構造、機会と課題を皆さんに検討してもらえるように努めています。人工知能の構築はハードウェアの構築が主であるという従来の考え方とは異なり、ハードパワーとソフトパワーを駆使して、刻々と変化する人工知能の能力をより高い次元で解体することを目指し、「人」の視点から「人」を重視しています。つまり、ユーザーは人工知能との決戦における戦略的資源である。

02 対話型AIプラットフォームの「ハードパワー」と「ソフトパワー」

1. インタラクティブ AI におけるハードパワー

1.1 CPU/GPUに代表されるコンピュータハードウェア

コンピューターのハードウェアは AI の基盤です。まず、コンピューター ハードウェアは、複雑なコンピューティング タスクを処理する AI の能力を直接決定します。大量のデータの処理、深層学習アルゴリズムの計算と学習などには十分な計算能力が必要であり、CPU/GPU の性能が AI の計算速度と効率に直接影響します。次に、ハードウェアデバイスとしてのCPU/GPUがAIソフトウェアの動作環境をサポートする必要があります。 AI には多数のデータ処理とコンピューティング タスクが含まれており、動作をサポートする特別なソフトウェア環境が必要です。さらに、コンピューター ハードウェアは高度な拡張性とプログラム可能性も必要です。 AI アプリケーション シナリオは広範囲にわたるため、さまざまなシナリオやアプリケーションに対してさまざまな AI ソリューションを提供する必要があります。コンピュータのハードウェアが高いスケーラビリティを備えている場合にのみ、リソースの動的な割り当てと拡張を迅速に実現できます。最後に、開発者がアルゴリズムとソリューションを迅速に最適化できるように、コンピューター ハードウェアはプログラム可能である必要があります。 AIシステムプラットフォームの基本的なハードウェア構成と機能を以下の図に示します。

2. 「ソフトパワー」は対話型 AI の安定器です

2.1 知識グラフ形状AIベーシックディスク

AI のナレッジ グラフは、広範なドメイン知識を含む構造化された知識ベースであり、人工知能システムの学習と推論をサポートするために使用されます。ナレッジ グラフは、エンティティ (人、場所、イベントなど) とそれらの間の関係で構成されます。定義、属性、カテゴリ、関連付けなど、さまざまな種類の知識を含めることができます。

ナレッジ グラフの構築と使用は、AI テクノロジーの重要な部分です。 AI システムがさまざまな分野の知識と意味情報を取得、整理、保存し、AI システムの認知能力とインテリジェンスを向上させるのに役立ちます。ナレッジ グラフは、自然言語処理、推奨システム、質問と回答のシステム、情報検索などのさまざまな側面で使用できます。

身近な例を挙げると、Google Knowledge Graph、Baidu Encyclopedia、Wikipedia はすべてナレッジ グラフです。

2.2 アルゴリズムレベルの駆動能力のアップグレード

2.2.1 アルゴリズムの重要性

アルゴリズムは、AI のさまざまなタスクを実現するための重要な手段です。 AIの開発と進歩を促進するには、アルゴリズムの設計と改善も鍵となります。アルゴリズムの重要性は、次の 3 つの側面に反映されています。

① モデルの精度と効率に影響する: アルゴリズムが異なると、モデルの精度と計算効率に影響します。適切なアルゴリズムを選択すると、モデルの精度が向上し、計算時間を短縮できます。

② さまざまなニーズとシナリオを満たす: さまざまなシナリオやアプリケーションにはさまざまなニーズがあり、それらを満たすためにさまざまなアルゴリズムを選択する必要があります。

③意思決定支援の提供:さまざまな問題やデータに応じて、アルゴリズムは意思決定支援を提供し、データを効果的に分析および予測できます。

2.2.2 共通アルゴリズム

AI では、さまざまなアプリケーション シナリオやニーズに適応するために多くのアルゴリズムが使用されています。機械学習アルゴリズム、深層学習アルゴリズム、自然言語処理アルゴリズム、推奨アルゴリズムには 4 つの一般的なカテゴリがあります。

①機械学習アルゴリズム:

(1) 教師あり学習アルゴリズム: 線形回帰、ロジスティック回帰、サポート ベクター マシン、デシジョン ツリー、ランダム フォレストなど。

(2) 教師なし学習アルゴリズム: K 平均法クラスタリング、階層的クラスタリング、期待値最大化アルゴリズムなど。

②ディープラーニングアルゴリズム:

(1) 畳み込みニューラル ネットワーク (CNN): 主に画像処理やコンピューター ビジョンのタスクで使用されます。

(2) Recurrent Neural Network (RNN): 主に自然言語処理や音声処理などのシリアル化タスクで使用されます。

(3) Generative Adversarial Network (GAN): 主に画像やテキストの生成などのタスクに使用されます。

(4) トランスフォーマーネットワーク(Transformer):主に機械翻訳やテキスト要約などのタスクで使用されます。

③自然言語処理アルゴリズム:

(1) キーワード抽出:TF-IDFアルゴリズム、TextRankアルゴリズムなど。

(2) 固有表現認識:条件付きランダム場モデルなど。

(3) 構文解析アルゴリズム:ルールモデル、転送モデルなど。

(4) 感情分析アルゴリズム:辞書モデル、機械学習モデルなど。

④ レコメンドアルゴリズム:

(1) コンテンツベースの推奨: TF-IDF アルゴリズム、LDA アルゴリズムなど。

(2) 協調フィルタリングに基づく推奨: UserCF、ItemCF、LFM アルゴリズムなど。

(3) 深層学習の推奨事項: DeepFM、 Wide&Deep、DIN、BERT4Rec など。

アルゴリズムは、さまざまなタスクを実行するための人工知能の基礎です。テクノロジーの発展と革新が続くにつれて、新しい AI アルゴリズムが常に登場しています。 AI 機能を向上させる鍵は、適切なシナリオに適切なアルゴリズムを選択して適合させることです。この観点から見ると、人工知能の鍵は依然として人間の設計にあります。

2.3 トレーニング シナリオは進化速度に影響します

2.3.1 トレーニングの重要性

トレーニングは、AI モデルが知識とスキルを学習して獲得するプロセスであり、人工知能にとって非常に重要です。

① モデルの精度の向上:合理的なデータセットの選択と十分なトレーニング時間を通じて、AI モデルはデータ内のパターンと特徴を徐々に学習し、それによってモデルの精度と精度を向上させることができます。

② モデルの汎化能力のサポート: トレーニングにより、モデルは汎化能力を持つことができます。つまり、モデルはトレーニング セット外の新しいデータ サンプルを処理し、他の状況で役割を果たすことができます。

③ モデルの堅牢性の向上: トレーニングにより、一部のノイズの多いデータ、偽造データ、干渉データに対する AI モデルの処理能力と堅牢性が向上します。

④ AI モデルの更新と反復: トレーニングを通じて、実際のアプリケーションのニーズに合わせて AI モデルを継続的に更新および改善できます。

⑤ モデルの解釈可能性の向上: AI データモデルの解釈可能性は、多くの分野で非常に重要です。トレーニングを通じてモデルの解釈可能性と透明性が向上し、理解しやすくなり、使いやすくなります。

2.3.2 トレーニングシナリオは進化速度に影響を与える

トレーニング シナリオの設定と選択は、AI モデルのパフォーマンスとパフォーマンスにとって重要であり、モデルの品質と使いやすさを直接決定します。 AI モデルのトレーニング結果をより正確かつ信頼できるものにするために、トレーニング プロセス中に、データの前処理、適切なアルゴリズムの選択、アルゴリズムのハイパーパラメーターの最適化、アンダーフィッティングとオーバーフィッティングの制御などを行う必要があります。これらの最も重要なタスクは基本的に手動の参加に依存しており、これは最も中核的な戦略的リソースとしての「人」の地位も反映しています。

① 教師あり学習シナリオ: ラベル付きデータセットをモデルに提供することで、データがどのカテゴリまたは目標値に属するかを示します。

② 教師なし学習シナリオ: トレーニング データセットには特定のラベルや目標値がなく、モデルはデータセットの統計的特性に従ってデータの法則と特性を自ら発見し、データを処理および分類する必要があります。データ。

③ 半教師あり学習シナリオ: ラベル付きデータとラベルなしデータが含まれており、モデルはこれらのラベルなしデータを分類する方法を学習する必要があります。

④ 強化学習シナリオ: モデルは継続的に環境と対話し、あらゆる瞬間を観察して環境と対話し、フィードバック情報に基づいてモデルの戦略を調整します。

⑤ 自然言語処理シナリオ: トレーニング データ セットは通常、大量のテキスト データであり、モデルはテキスト データとテキスト間の関係を理解する方法を学習する必要があります。

⑥ コンピューター ビジョン シナリオ: トレーニング データ セットは通常、画像またはビデオ データであり、モデルはターゲット検出や画像認識などのタスクを達成するために、これらの画像データを理解し、処理する方法を学習する必要があります。

03 「ユーザー利用シナリオ」は希少な戦略リソースです

  1. 制限されたユーザー、無制限のデータ

現在、コンピューターハードウェアの拡張やデータベースの拡張によって人工知能製品の精度と知能レベルを向上させることには、一定の限界と限界があります。一方で、コンピュータハードウェアの拡張やデータベースの拡張には、多大な人的資源、資金、時間の投資が必要であり、システムの規模が拡大し続けるにつれて、リソースの需要も増加します。一方で、現在の人工知能分野の技術開発には、アルゴリズムの有効性や自己学習の効果など、依然として不確実な要素が多くあります。これらの要因は、人工知能製品の開発スペースに影響を与えます。

無制限のデータと比較すると、ユーザー リソースの獲得競争はゼロサム ゲームです。人工知能製品のユーザー数が多く、頻繁に使用される場合、ユーザーの使用状況データの監視と分析を通じて人工知能製品のインテリジェントなアップグレードを実現し、製品システムを継続的に改善し、使用価値を高めることができます。

より多くのユーザーがより高度なプラットフォームを作成し、より高度なプラットフォームがより良いエクスペリエンスを生み出し、より良いエクスペリエンスがより多くのユーザーを惹きつけます。

将来のさまざまなイデオロギーの下での AI プラットフォームの機能の違いは、基本的にユーザーの数と使用頻度の違いによって決まります。より多くのユーザーを獲得し、頻繁に使用してもらうためには、製品のユーザーインターフェイス、機能、サービス品質、市場プロモーションなどを継続的に改善および最適化し、ユーザーのニーズを継続的に満たし、ユーザーエクスペリエンスを向上させ、ユーザーの信頼とロイヤルティを獲得する必要があります。

  1. 「マシュー効果」による共食い

マシュー効果とは、一定の条件下において、優れた人材が継続的に支持され、その結果、人材間の格差が拡大する現象のことを指します。

人工知能の開発プロセスでは、多くの場合、高度なテクノロジーや先進的な企業が最初のユーザーと市場シェアを獲得する方が容易であり、その結果、より多くの投資とより良い利益が得られます。この現象により、業界の主導的地位がさらに強化されることになります。

一方で、AI技術の開発には多くの専門的な人材も必要です。大手企業やプラットフォームは、人材の優位性を獲得するために、より多くの資金とリソースを投資し続けるリソースを持っているため、後発企業は追いつく能力を完全に失います。

最も重要なことは、先進的なプラットフォームがより良いユーザーエクスペリエンスを提供することですが、現在、AI to C市場におけるマシュー効果が顕著になってきています。ユーザー心理の観点から見ると、ある種類の AI 製品の使用に慣れているユーザーは、同じ種類の別の製品に切り替えるときに再学習して適応する必要があり、多くの時間とエネルギーが必要になります。データスケールの観点から見ると、大量のユーザーデータの蓄積は製品の利用効果や分析に大きな意味を持ち、ユーザーデータの保持は製品の定着の鍵となりますが、新製品にはデメリットがつきものです。 AI システムに固有の「フライホイール効果」は、ユーザー エクスペリエンスにおける「マシュー効果」をさらに増幅します。

##04 結論

興味深い発言です。AI は新石器時代の弓矢です。

AIが形成する学習能力はパラメータの大きさに依存します。学術的な経験によれば、ディープ ニューラル ネットワークの学習能力はモデルのパラメーター スケールと正の相関があり、モデルのパラメーターが多いほど学習能力は高くなります。 GPT-2 には約 15 億のパラメーターがありますが、GPT-3 の最大のモデルには 1,750 億のパラメーターがあり、2 桁増加しています。メディアの推測によると、まだ確認されていないニュースによると、GPT-4 のパラメーターは 100 兆に達する可能性があります。

業界の一部の専門家は、ハードテクノロジーが「ソフトテクノロジー」の開発に重要なコンポーネントとハードウェアインターフェースを提供し、「ソフトテクノロジー」のサプライチェーンのニーズに合わせた革新をもたらすと信じています。 「ソフトテクノロジー」は技術革新のカーブでの追い越しや車線変更の「黄金軌道」。

CCTV は効果的な組み合わせを見つけ出しました: まず、ユーザーのニーズを医療支援、農業支援、美容支援、学生支援などの一連の AI エンパワーメントの方向に絞り込み、次にあいまい検索のセマンティック マッチングを通じて局全体のレベルを高めます。リソースはさまざまなアプリケーション シナリオで高頻度使用モデルを構築し、ナレッジ ベースやアルゴリズムなどの「ソフト パワー」の自己組織化された自己学習を形成します。これにより、GPU コンピューティング パワーや CDN 帯域幅などのハード パワーの構築が強制されます。 「ユーザーの利用シーン」の「勝者」をしっかりと把握する。

興味深いのは、現時点では GPT の技術的方向性が明確であり、克服できない技術的障害がないことです。私たちは中国人が最も得意とする「長期主義」の精神を利用して、この「新石器時代」の弓矢を可能な限り遠くまで射ることができます。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)