OpenAI 共同創設者: Autopilot と VR はどちらも「誤った方向に導かれた」 AI エージェントが未来

著者: 葛嘉明

葛嘉明

Huang Renxun 氏と Musk 氏が AI エージェントの発展の可能性を次々と目にした後、OpenAI の共同創設者で元 Tesla 人工知能部長の Andrej Karpathy 氏も最近、**AI エージェントはクレイジーな未来を象徴していると叫びました。 **

アンドレイ・カルパシー氏は、テスラで働いていたときは「自動操縦に気を取られていた」と率直に述べ、自動操縦やVRの研究はAIエージェント開発の正しい方法ではないと語った。今こそ、インスピレーションを得るために神経科学に戻る時です。

一方、Andrej Karpathy 氏は、AI エージェントの構築に関しては誰もが OpenAI のような企業よりも有利である、現在は誰もが平等な競争状態にあるため、この点での結果を見ることを楽しみにしていると考えています。 :

AI エージェントはクレイジーな未来を表します少し遠いかもしれませんが、今日ここにいる全員が構築した AI エージェントはすでに AI エージェント機能の最前線にあります。 現在、OpenAI などの大規模な言語モデルに取り組んでいるすべての機関が、この分野の最前線にいるとは思えません。最前線にいるのはここにいる皆さんです。

Google の AI チーム DeepMind の最新の論文では、自己改善が可能な AI エージェントである RoboCat が紹介されています。RoboCat は、本質的には AI を搭載したソフトウェア プログラムであり、ロボットの「脳」に相当します。 RoboCatがサポートするロボットは、RoboCatがより「普遍的」であり、自己改善と自己改善を達成できるという点で従来のロボットとは異なります。

身体化された知性は人型ロボットよりも価値がある

身体化された知性はAIの脳に相当し、この脳の担体はいかなる形態であってもよい。それはロボット アーム、ロボット犬、さらには車である可能性があります。

一方、現時点で人型ロボットがあまり知性のない鉄鋼の巨人とみなされているのは、AIの頭脳の欠如+柔軟性のない身体にある。

簡単に言うと、GPT-4 のような大きなモデルは物理世界に実際の影響を与えませんが、身体化された知性はセンサーを介して環境情報を収集し、物理的な操作に機械的アクチュエーターを使用し、またはリアルタイムでロボットを使用する追加の本体を持っています。人間や環境との具体的な存在との相互作用

マスク氏はかつて、将来誰もが人型ロボットを所有する日が来るかもしれないが、現在展示されているオプティマスの人型ロボット製品は反復的な単純労働しか実行できないと語った。

身体化されたインテリジェンスの目標は、機械が複雑な環境をよりよく理解して適応できるようにし、問題をより効率的に解決し、より柔軟な動作能力を備えられるようにすることです。知覚、意思決定、実行のプロセスを統合することにより、身体化インテリジェンスにより機械が人間の知能のパフォーマンスに近づくことが可能になり、ロボット工学、自動運転、スマート製造において重要な役割を果たします。

Karpathy 氏は、7 年前には AI エージェントを研究する時期がまだ熟しておらず、技術的な限界により結果が良くなかったので、彼と OpenAI は方向性を変え、大規模な言語モデルの研究を始めたと率直に語った。

AI エージェントを研究するための新しい技術的手段が登場した現在、状況は 2016 年とはまったく異なります。

最も単純な例は、現在、2016 年のように強化学習手法を使用して AI エージェントを研究する人は誰もいないということです。現在の研究手法や方向性は当時は想像もできなかったものです。

AI の次の波?

大規模な言語モデルの出現により、身体化されたエージェントの構築に新たな可能性がもたらされました。 LLM ベースのエージェントは、事前トレーニングされたモデルに含まれる世界の知識を使用して、一貫したアクション プランや実行可能な戦略を生成できるため、ゲームやロボットなどのタスクに非常に適しています。

DeepMind の RoboCat は、AI 対応ロボットの代表的な例の 1 つにすぎません。

今年の初め以来、いくつかの企業が言語モデルをロボットに適用しており、2023 年初めに Google が視覚言語モデル PaLM-E を発表し、それを産業用ロボットに適用し、4 月にアリババが Qianwen の大型モデルを産業用ロボットに接続しました。 5 月には、テスラの人型ロボット オプティマスが正確な制御と認識能力を実証し、同月、エヌビディアは新しい自律移動ロボット プラットフォームをリリースしました。

そのおかげで、人工知能の恩恵を受けた知性を体現したロボットアバターは世界中から大きな注目を集めています。

マスク氏は2023年のテスラの株主総会で、人型ロボットが将来テスラの長期的価値の主な源泉になると述べた。

「人型ロボットと人間の比率が約 2 対 1 である場合、ロボットに対する人々の需要は 100 億、さらには 200 億に達する可能性があり、これは電気自動車の数をはるかに上回ります。」

Nvidia の創設者 Huang Renxun 氏も、ITF 2023 世界半導体会議で、AI の次の波は「身体化されたインテリジェンス」 になるだろうと述べました。ウォール・ストリート・ニュースは以前、国生証券のアナリストが、身体化されたインテリジェンスには物理的なフィードバックと物理的な出力の特性があり、通信、コンピューティング、ストレージの新たなキャリアになる可能性があると信じていると指摘しました。

将来的には、身体化されたインテリジェンスは、エッジ通信機能とエッジ コンピューティング能力のマッチングと結合をますます重視することになります。

AI の身体は実際には最も重要なことではなく、AI が物理世界を能動的に認識し、擬人化された思考経路が目標を達成できるように、AI の脳を開発し、人間とコンピューターのインタラクション方法を開拓することが中心となるべきです。人間が期待する行動フィードバック。マシン ビジョンとマルチモーダル大型モデルは、この世界を開く 2 つの鍵です。

原文表示
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)