¡Rompe el juego! Los nuevos logros de NVIDIA en datos sintéticos: la creación de una "máquina de movimiento perpetuo de datos de entrenamiento" para robots

Fuente original: Science and Technology Innovation Board Daily

Fuente de la imagen: Generado por Unbounded AI

Con la enorme demanda de datos de la IA, los recursos de datos están casi agotados, por lo que las empresas han comenzado a encontrar una "nueva forma" de obtener datos: "crear" datos ellos mismos. Sin embargo, la mayoría de los datos sintéticos anteriores se utilizaron para el entrenamiento de modelos grandes de IA, y esta vez, Nvidia ha creado un "granero de datos" para el entrenamiento de robots.

En un nuevo trabajo de investigación entre NVIDIA y la Universidad de Texas en Austin, se describe un sistema llamado "MimicGen" que puede generar automáticamente conjuntos de datos de entrenamiento de robots a gran escala con solo un pequeño número de demostraciones humanas. Jim Fan, científico sénior de Nvidia, dijo que la compañía abrirá todo, incluidos los conjuntos de datos generados.

¿Cuál es la escala de los datos generados? Usando 10 demostraciones humanas, MimicGen puede generar 1000 ejemplos de síntesis; Con 200 demostraciones humanas, MimicGen pudo generar directamente 50.000 datos de entrenamiento en 18 tareas y múltiples entornos simulados.

¿Qué pasa con el conjunto de datos generado?

MimicGen puede "evolucionar" la misma escena en diferentes etapas sobre la base de los datos originales:

También puede generar diferentes conjuntos de datos en una amplia gama de distribuciones de restablecimiento de tareas, incluido el ensamblaje de elementos, el vertido de café, la limpieza de tazas y más:

Posibilidad de generar diferentes demos de nuevos brazos robóticos:

También hay datos de entrenamiento para tareas a largo plazo:

Los datos de escenarios del mundo real también están disponibles:

En particular, los investigadores compararon los datos generados por diferentes conjuntos de datos de origen. Sin embargo, descubrieron que los dos conjuntos de resultados eran comparables, lo que sugiere que "la calidad de los datos puede no ser tan importante en los mecanismos de datos a gran escala".

No solo eso, sino que los investigadores compararon los datos generados por 10 demostraciones humanas con 200 demostraciones humanas, y los resultados tampoco fueron muy diferentes. Por lo tanto, el documento también admite que se necesita más investigación sobre si más datos de presentación humana causarán redundancia y costos innecesarios de etiquetado de datos.

¿Por qué estás tan obsesionado con los datos sintéticos? Además de los limitados recursos de datos de origen mencionados al principio del artículo, la recopilación de datos es extremadamente costosa y requiere mucho tiempo, y con un sistema como MimicGen, es posible generar automáticamente conjuntos de datos ricos y a gran escala con solo una pequeña cantidad de datos, que abarcan múltiples escenarios, capacidades de objetos, brazos robóticos y tareas a largo plazo o de alta precisión, lo que lo convierte en una forma efectiva de "ampliar el poder y la economía del aprendizaje robótico".

"Los datos sintéticos proporcionarán el próximo billón de datos para nuestros modelos 'hambrientos'. "Una de las razones clave por las que la robótica se está quedando muy atrás de otros campos de la IA es la falta de datos: no se pueden obtener señales de control de Internet. "

"Estamos agotando rápidamente los datos de alta calidad del mundo real de la web, y la IA nacida de datos sintéticos será el camino a seguir".

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)