El cofundador de OpenAI, Karpathy, compartió: los agentes de IA pueden tardar 10 años en funcionar realmente

Organizar: cuenta de Twitter "@GPTDAOCN"

Recientemente, Andrej Karpathy, cofundador de OpenAI, pronunció un breve discurso en un evento para desarrolladores, hablando sobre sus puntos de vista internos y los de OpenAI sobre los agentes de inteligencia artificial (agentes de inteligencia artificial).

Andrej Karpathy comparó las dificultades para desarrollar agentes de IA en el pasado con las nuevas oportunidades desarrolladas bajo las nuevas herramientas tecnológicas y no se olvidó de ridiculizar su trabajo en Tesla porque estaba "distraído por el piloto automático". Él ve la conducción autónoma y la realidad virtual como ejemplos de malos agentes de IA.

Para nuevas oportunidades, Andrej Karpathy cree que este es el momento de volver a la neurociencia y buscar inspiración en ella, tal como sucedió en los primeros días del aprendizaje profundo.

Por otro lado, Andrej Karpathy cree que la gente común, los empresarios y los geeks tienen más ventajas que empresas como OpenAI en la construcción de agentes de IA. Todos se encuentran actualmente en un estado de competencia igualitaria, por lo que espera ver los resultados en este sentido.

El siguiente es el texto completo de este intercambio:

Hola a todos. Me invitaron a hablar algunas palabras de motivación sobre el tema de los agentes de IA.

Creo que AI Agents está cerca de mí en cierto modo, permítanme comenzar con una historia, esta es una historia muy temprana de OpenAI, OpenAI tal vez solo una docena de personas en ese momento, alrededor de 2016, en ese momento La tendencia es en realidad RL Agents ( Agentes de aprendizaje por refuerzo). Todo el mundo estaba muy interesado en crear agentes, pero en ese momento se basaba principalmente en juegos, y la emoción estaba en torno a las empresas de juegos como Atari, y mi proyecto en OpenAI estaba tratando de centrar los agentes de RL en los teclados y el mouse se usa en la computadora. , no el juego. Quiero hacerlos más útiles y hacer mucho trabajo, el proyecto se llama World of Bits. Algunos colegas y yo terminamos publicando un artículo.

No es un documento sorprendente, porque en realidad se basa en métodos de aprendizaje por refuerzo de RL. Nuestras páginas web son muy simples y permiten a las personas reservar un vuelo o pedir comida, etc. Obviamente, nada de esto iba a funcionar porque la tecnología no estaba lista y no sería prudente hacer estas cosas en ese momento. Los hechos han demostrado que debemos olvidarnos por completo de los agentes de IA y hacer modelos de lenguaje.

Regresamos aquí cinco años después y estaba un poco distraído con la conducción autónoma, pero ahora que los agentes de IA vuelven a ser geniales, nuestra caja de herramientas es completamente diferente y la forma en que abordamos estos problemas es completamente diferente. De hecho, todos ustedes están trabajando en AI Agents, pero es posible que no estén utilizando ningún método de aprendizaje por refuerzo. Es una locura, no creo que hubiésemos visto venir esto. Fue demasiado divertido.

Permítanme tomarme un momento para hablar sobre por qué los agentes de IA son tan populares. Creo que está claro para muchos que AGI (inteligencia general artificial) aprovechará al máximo las capacidades de los agentes de IA, no uno, sino muchos. Tal vez habrá organizaciones o civilizaciones de entidades digitales, lo que creo que es muy inspirador, incluso un poco loco. Sin embargo, también quiero echarle un poco de agua fría a esto. Creo que hay toda una clase de problemas que son fáciles de imaginar, fáciles de construir, fáciles de demostrar, pero realmente difíciles de hacer un producto. Muchas cosas entran en esta categoría, creo que la conducción autónoma es un ejemplo.

La conducción autónoma es fácil de imaginar, y fácil de construir una demostración de un automóvil que conduce alrededor de una cuadra, pero tomó una década convertir eso en un producto. De la misma manera, creo que es lo mismo con la realidad virtual, llevará una década hacer que funcione.

Creo que lo mismo es cierto hasta cierto punto con los agentes de IA. Es fácil imaginar escenarios para ello, y es muy emocionante, pero creo que si estás en ello, deberías invertir una década para que realmente funcione.

Otra cosa que quiero decir es que creo que es interesante volver a la neurociencia ahora e inspirarse nuevamente en ella de alguna manera, los primeros días del aprendizaje profundo se inspiraron en la neurociencia. Es muy interesante pensar en la relación entre ellos, especialmente creo que mucha gente ve los modelos de lenguaje como parte de la solución, pero ¿cómo se construye una entidad digital completa que tenga todas las capacidades cognitivas de los humanos? Claramente, todos estamos de acuerdo en que necesitamos algún tipo de sistema subyacente para planificar, pensar y reflexionar sobre lo que estamos haciendo, y aquí es donde entra en juego la neurociencia.

Por ejemplo, el hipocampo es muy importante ¿Qué papel juega el hipocampo en los agentes de IA, que se utiliza para almacenar memoria, recuperar marcas, etc.? Tenemos una comprensión general de cómo construir las cortezas visual y auditiva, pero hay muchas cosas que no sabemos qué significan en AI Agents. ¿Cómo se ve un juego visual en AI Agents? ¿Cuál es el equivalente del tálamo, la ubicación de la mente subconsciente, en AI Agents? Es muy interesante.

De hecho, traje un libro de neurociencia hoy, El cerebro y el comportamiento de David Eagleman, que encontré muy interesante y esclarecedor. Tomando una inspiración interesante de la neurociencia, como hicimos en los primeros días cuando diseñamos neuronas individuales, probablemente deberíamos hacerlo de nuevo hoy.

Finalmente me gustaría terminar con unas palabras de aliento. Una cosa interesante pero no obvia es que los agentes de IA que creas (refiriéndose a la audiencia en vivo) están realmente a la vanguardia de las capacidades de los agentes de IA contemporáneos.Todas las grandes instituciones LLM como OpenAI, DeFi, etc., I Dudo que estén a la vanguardia. Estás a la vanguardia.

Por ejemplo, OpenAI es muy bueno para entrenar modelos de lenguaje grandes de Transformer. Si un documento propone algún tipo de método de capacitación diferente, la discusión en nuestro grupo de Slack dentro de OpenAI será como, oh sí, alguien lo probó durante dos años y medio y no funcionó, no estamos interesados en este método. Muy comprensivo de los entresijos. Pero cuando salió el nuevo documento de AI Agents, nos interesó mucho y pensamos que era genial, porque nuestro equipo no pasó cinco años en eso, no sabemos nada más que ustedes, estamos trabajando con todos ustedes. Las personas compiten juntas. Esa es la razón para pensar que está a la vanguardia de lo que pueden hacer los agentes de IA.

Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)