Co-fondateur d'OpenAI : le pilote automatique et la réalité virtuelle sont tous deux "malavisés", les agents d'IA sont l'avenir

Auteur : Ge Jiaming

Ge Jiaming

Après que Huang Renxun et Musk aient vu le potentiel de développement des agents d'IA l'un après l'autre, le co-fondateur d'OpenAI et ancien directeur de l'intelligence artificielle de Tesla, Andrej Karpathy, a également récemment crié que **les agents d'IA représentent un avenir fou. **

Andrej Karpathy a déclaré sans ambages qu'il était "distrait par le pilote automatique" lorsqu'il travaillait chez Tesla, et qu'étudier le pilote automatique et la réalité virtuelle n'est pas la bonne façon de développer des agents IA. Il est maintenant temps de revenir aux neurosciences pour l'inspiration.

D'un autre côté, Andrej Karpathy pense que tout le monde a un avantage sur des entreprises comme OpenAI en termes de création d'agents d'IA, tout le monde est actuellement dans un état de concurrence égale, il attend donc avec impatience de voir les résultats à cet égard :

Les agents IA représentent un avenir fou Bien qu'il soit peut-être un peu lointain, les agents IA construits par toutes les personnes présentes aujourd'hui sont déjà à la pointe des capacités des agents IA. Maintenant, toutes les institutions qui travaillent sur de grands modèles de langage, comme OpenAI, etc., je ne pense pas qu'elles soient à l'avant-garde dans ce domaine, et l'avant-garde, c'est tout le monde ici.

Le dernier article de l'équipe d'IA de Google, DeepMind, présente un agent d'IA capable de s'auto-améliorer - RoboCat, qui est essentiellement un logiciel alimenté par l'IA, qui équivaut au "cerveau" du robot. Le robot pris en charge par celui-ci est différent des robots traditionnels en ce que RoboCat est plus "universel" et peut réaliser l'auto-amélioration et l'auto-amélioration.

L'intelligence incarnée est plus précieuse qu'un robot humanoïde

L'intelligence incarnée équivaut au cerveau de l'IA, et le porteur de ce cerveau peut être sous n'importe quelle forme. Il peut s'agir d'un bras robotique, d'un chien robot ou même d'une voiture.

D'autre part, la raison pour laquelle les robots humanoïdes sont considérés comme un géant de l'acier pas si intelligent pour le moment est à cause du manque de cerveau IA + corps inflexible.

Pour le dire simplement, un grand modèle comme GPT-4 n'a pas d'impact réel sur le monde physique, tandis que l'intelligence incarnée a un corps supplémentaire, qui collecte des informations environnementales via des capteurs, utilise des actionneurs mécaniques pour des opérations physiques ou utilise des robots pour en temps réel. interaction avec les humains et l'environnement avec des entités concrètes telles que

Musk a dit un jour que bien que tout le monde puisse avoir un robot humanoïde un jour dans le futur, les produits de robot humanoïde Optimus actuellement affichés ne peuvent effectuer qu'un travail simple et répétitif.

L'objectif de l'intelligence incarnée est de permettre aux machines de mieux comprendre et de s'adapter à des environnements complexes, de résoudre des problèmes plus efficacement et de posséder des capacités de comportement plus flexibles. En intégrant les processus de perception, de prise de décision et d'exécution, l'intelligence incarnée permet aux machines de se rapprocher des performances de l'intelligence humaine, jouant ainsi un rôle important dans la robotique, la conduite autonome et la fabrication intelligente.

Karpathy a déclaré sans ambages qu'il y a 7 ans, le temps d'étudier les agents d'IA n'était pas encore mûr et que les résultats n'étaient pas bons en raison de limitations techniques, alors lui et OpenAI ont changé de direction et ont commencé à étudier de grands modèles de langage.

Maintenant qu'il existe de nouveaux moyens techniques pour étudier les agents IA, la situation est complètement différente de 2016 :

L'exemple le plus simple est qu'aujourd'hui plus personne n'utilise de méthodes d'apprentissage par renforcement pour étudier les agents IA comme en 2016. Les méthodes et orientations de recherche actuelles étaient inimaginables à l'époque.

La prochaine vague d'IA ?

L'émergence de grands modèles de langage a apporté de nouvelles possibilités à la construction d'agents incarnés. Parce que les agents basés sur LLM peuvent utiliser les connaissances du monde contenues dans le modèle pré-formé pour générer des plans d'action cohérents ou des stratégies exécutables, il est très approprié pour des tâches telles que les jeux et les robots.

RoboCat de DeepMind n'est que l'un des principaux exemples de robots compatibles avec l'IA.

Depuis le début de cette année, plusieurs entreprises ont appliqué des modèles de langage aux robots : début 2023, Google a lancé le modèle de langage visuel PaLM-E et l'a appliqué aux robots industriels ; en avril, Alibaba a connecté le grand modèle Qianwen aux robots industriels ; en En mai, le robot humanoïde Tesla Optimus a démontré des capacités de contrôle et de perception précises.Le même mois, Nvidia a lancé une nouvelle plate-forme de robot mobile autonome.

Grâce à cela, l'avatar robot incarné par l'intelligence bénie par l'intelligence artificielle a attiré l'attention du monde entier.

Musk a déclaré lors de l'assemblée des actionnaires de Tesla en 2023 que les robots humanoïdes seraient la principale source de valeur à long terme de Tesla à l'avenir :

"Si le rapport entre les robots humanoïdes et les humains est d'environ 2 pour 1, alors la demande des gens pour les robots pourrait être de 10 milliards ou même de 20 milliards, dépassant de loin le nombre de véhicules électriques."

Le fondateur de Nvidia, Huang Renxun, a également déclaré lors de la conférence ITF World 2023 Semiconductor que ** la prochaine vague d'IA sera "l'intelligence incarnée" **. Wall Street News a précédemment souligné que les analystes de Guosheng Securities pensent que l'intelligence incarnée a les caractéristiques d'une rétroaction physique et d'une sortie physique, et peut devenir un nouveau vecteur de communication, de calcul et de stockage :

À l'avenir, l'intelligence incarnée mettra de plus en plus l'accent sur l'appariement et le couplage des capacités de communication de pointe et de la puissance de calcul de pointe.

Le corps de l'IA n'est en fait pas la chose la plus importante.Le noyau devrait être de développer le cerveau de l'IA et d'ouvrir les méthodes d'interaction homme-ordinateur, afin que l'IA puisse percevoir activement le monde physique et que le chemin de la pensée anthropomorphique puisse atteindre le rétroaction comportementale que les humains attendent. La vision industrielle et les grands modèles multimodaux sont les deux clés pour ouvrir ce monde.

Voir l'original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)