Le co-fondateur d'OpenAI, Karpathy, a partagé: les agents d'IA peuvent prendre 10 ans pour vraiment fonctionner

Organiser : Compte Twitter « @GPTDAOCN »

Récemment, Andrej Karpathy, le co-fondateur d'OpenAI, a prononcé un bref discours lors d'un événement pour développeurs, évoquant son point de vue interne et celui d'OpenAI sur les agents IA (agents d'intelligence artificielle).

Andrej Karpathy a comparé les difficultés de développement d'agents IA dans le passé avec les nouvelles opportunités développées sous de nouveaux outils technologiques.Il n'a pas oublié de ridiculiser son travail chez Tesla parce qu'il était "distrait par le pilote automatique". Il voit la conduite autonome et la réalité virtuelle comme des exemples de mauvais agents d'IA.

Pour de nouvelles opportunités, Andrej Karpathy pense que c'est le moment de revenir à nouveau aux neurosciences et de s'en inspirer, tout comme ce qui s'est passé aux débuts de l'apprentissage en profondeur.

D'un autre côté, Andrej Karpathy estime que les gens ordinaires, les entrepreneurs et les geeks ont plus d'avantages que des entreprises comme OpenAI dans la construction d'agents d'IA. Tout le monde est actuellement dans un état de concurrence égale, il attend donc avec impatience de voir les résultats à cet égard.

Voici le texte intégral de ce partage :

Bonjour à tous. J'ai été invité à prononcer quelques mots de motivation sur le thème des agents d'IA.

Je pense que AI Agents est proche de moi d'une certaine manière, permettez-moi de commencer par une histoire, c'est une histoire très ancienne d'OpenAI, OpenAI peut-être seulement une douzaine de personnes à cette époque, vers 2016, à cette époque La tendance est en fait aux agents RL ( agents d'apprentissage par renforcement). Tout le monde était très intéressé par les agents de construction, mais à l'époque, c'était principalement basé sur le jeu, et l'excitation était autour des sociétés de jeux comme Atari, et mon projet chez OpenAI essayait de concentrer les agents RL sur les claviers et la souris est utilisée sur l'ordinateur , pas le jeu. Je veux les rendre plus utiles et faire beaucoup de travail, le projet s'appelle World of Bits. Quelques collègues et moi avons fini par publier un article.

Ce n'est pas un article étonnant, car il est en fait basé sur des méthodes d'apprentissage par renforcement RL. Nos pages Web sont très simples et permettent aux gens de réserver un vol ou de commander de la nourriture, etc. Rien de tout cela n'allait évidemment fonctionner car la technologie n'était pas prête et il ne serait pas sage de faire ce genre de choses à l'époque. Les faits ont prouvé que nous devrions complètement oublier les agents IA et faire des modèles de langage.

Nous sommes revenus ici cinq ans plus tard, et j'étais un peu distrait par la conduite autonome, mais maintenant que les agents IA sont à nouveau cool, notre boîte à outils est complètement différente, et la façon dont nous abordons ces problèmes est complètement différente. En fait, vous travaillez tous sur des agents IA, mais vous n'utilisez peut-être aucune méthode d'apprentissage par renforcement. C'est fou, je ne pense pas qu'on aurait vu ça venir. C'était trop amusant.

Permettez-moi de prendre un moment pour expliquer pourquoi les agents IA sont si populaires. Je pense qu'il est clair pour beaucoup que l'IAG (intelligence générale artificielle) tirera pleinement parti des capacités des agents IA, pas un, mais plusieurs. Peut-être y aura-t-il des organisations ou des civilisations d'entités numériques, ce que je trouve très inspirant, voire un peu fou. Cependant, je veux aussi jeter un peu d'eau froide à ce sujet. Je pense qu'il y a toute une classe de problèmes qui sont faciles à imaginer, faciles à construire, faciles à démontrer, mais vraiment difficiles à faire un produit. Beaucoup de choses entrent dans cette catégorie, je pense que la conduite autonome en est un exemple.

La conduite autonome est facile à imaginer et il est facile de créer une démonstration d'une voiture roulant autour d'un pâté de maisons, mais il a fallu une décennie pour en faire un produit. De la même manière, je pense que c'est pareil avec la VR, ça va prendre une décennie pour que ça marche.

Je pense que la même chose est vraie dans une certaine mesure avec les agents IA. Il est facile d'imaginer des scénarios pour cela, et c'est très excitant, mais je pense que si vous y êtes, vous devriez y investir une décennie pour qu'il fonctionne réellement.

Une autre chose que je veux dire, c'est que je pense qu'il est intéressant de revenir aux neurosciences maintenant et de s'en inspirer à nouveau d'une certaine manière, les premiers jours de l'apprentissage en profondeur ont été inspirés par les neurosciences. C'est très intéressant de réfléchir à la relation entre eux, surtout je pense que beaucoup de gens considèrent les modèles de langage comme faisant partie de la solution, mais comment construire une entité numérique complète qui possède toutes les capacités cognitives des humains ? De toute évidence, nous convenons tous que nous avons besoin d'une sorte de système sous-jacent pour planifier, penser et réfléchir sur ce que nous faisons, et c'est là que les neurosciences entrent en jeu.

Par exemple, l'hippocampe est très important, qu'est-ce qui, dans AI Agents, joue le rôle de l'hippocampe, qui sert à stocker la mémoire, à récupérer les marques, etc. ? Nous avons une compréhension générale de la façon de construire les cortex visuel et auditif, mais il y a beaucoup de choses dont nous ne savons pas ce que cela signifie dans les agents IA. Comme à quoi ressemble un jeu visuel dans AI Agents ? Quel est l'équivalent du thalamus, l'emplacement de l'esprit subconscient, chez les agents IA ? C'est très intéressant.

J'ai en fait apporté un livre sur les neurosciences avec moi aujourd'hui, The Brain and Behavior de David Eagleman, que j'ai trouvé très intéressant et instructif. En nous inspirant des neurosciences, comme nous l'avons fait au début lorsque nous avons conçu des neurones individuels, nous devrions probablement le refaire aujourd'hui.

Enfin, je voudrais terminer par quelques mots d'encouragement. Une chose intéressante mais pas évidente est que les agents IA que vous construisez (en référence au public en direct) sont en fait à la pointe des capacités des agents IA contemporains.Toutes les grandes institutions LLM telles que OpenAI, DeFi, etc., je doute qu'ils soient à l'avant-garde. Vous êtes à l'avant-garde.

Par exemple, OpenAI est très bon pour former les grands modèles de langage Transformer. Si un article propose une méthode de formation différente, la discussion dans notre groupe Slack à l'intérieur d'OpenAI sera comme, oh ouais, quelqu'un l'a essayé pendant deux ans et demi et ça n'a pas marché, nous ne sommes pas intéressés par cette méthode Très bonne compréhension des tenants et aboutissants. Mais quand le nouveau papier AI Agents est sorti, nous étions très intéressés et avons pensé que c'était très cool, parce que notre équipe n'a pas passé cinq ans dessus, nous ne savons rien de plus que vous, nous travaillons avec vous tous Les gens rivalisent ensemble. C'est la raison pour laquelle vous pensez être à la pointe de ce que les agents IA peuvent faire.

Voir l'original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)