La última portada de la naturaleza: la IA derrotó al campeón mundial humano y estableció un récord para la carrera de drones más rápida

Autor: Yan Yimi, editor: Xue Jun

La inteligencia artificial (IA) ha vuelto a derrotar al campeón humano.

Esta vez, es en el ámbito de las carreras de drones.

El equipo de la Dra. Elia Kaufmann del Grupo de Robótica y Percepción de la Universidad de Zurich y su equipo de Intel diseñaron conjuntamente un sistema de conducción autónomo, Swift, que tiene la capacidad de volar drones en uno. Derrota a un oponente humano en un solo partido de campeonato uno contra uno.

Este importante resultado de investigación acaba de publicarse en el último número de Nature en forma de artículo de portada.

Figura | La portada del último número de Nature. (Fuente: Naturaleza)

En un artículo de noticias y opiniones publicado al mismo tiempo en Nature, el profesor Guido de Croon, investigador de la Universidad Tecnológica de Delft en los Países Bajos, escribió: "La investigación de Kaufmann et al. es un gran paso adelante para que los robóticos puedan superar la brecha de la realidad. Buen ejemplo. Aunque Swift se entrena utilizando una combinación inteligente de técnicas de aprendizaje de IA y algoritmos de ingeniería tradicionales, el sistema debería desarrollarse aún más en un entorno más realista y variado para desbloquear todo el potencial de esta tecnología".

No obstante, el equipo de investigación dice que la investigación marca un hito en la robótica móvil y la inteligencia artificial y puede inspirar el despliegue de soluciones híbridas basadas en el aprendizaje en otros sistemas físicos, como vehículos terrestres autónomos, vehículos aéreos y robots personales.

Entrenamiento inteligente que integra IA y algoritmos de ingeniería

Actualmente, los sistemas de inteligencia artificial (IA) basados en el aprendizaje por refuerzo profundo han superado a los campeones humanos en juegos como Atari, ajedrez, StarCraft y Gran Turismo. Sin embargo, todos estos logros tienen lugar en un entorno virtual, no en el mundo real.

Las carreras de drones son un desafío tanto para los pilotos experimentados como para la IA, pero lo son aún más para la IA. Porque en un entorno virtual los recursos son casi ilimitados, mientras que pasar al mundo real implica tener que utilizar recursos limitados. Esto es especialmente cierto en el caso de los drones, ya que los sensores y el equipo informático que sustituyen a los pilotos humanos deben transportarse por el aire.

Además, el mundo real es más impredecible que el mundo virtual. Si bien los drones de carreras simulados pueden seguir perfectamente trayectorias preprogramadas, un solo comando a un drone puede tener efectos múltiples e impredecibles, especialmente complejos para los drones entrenados con IA.

Los métodos tradicionales de aprendizaje de un extremo a otro son difíciles de transferir el mapeo del entorno virtual al mundo real, existe una brecha de realidad entre lo virtual y la realidad, y la brecha de realidad constituye uno de los principales desafíos en el campo de la robótica.

En este estudio, el sistema Swift logró un entrenamiento inteligente integrando la tecnología de aprendizaje de IA con algoritmos de ingeniería tradicionales. En primer lugar, el sistema procesa las imágenes tomadas por el dron desde la cámara a través de una red neuronal artificial para detectar con precisión las esquinas de la puerta. Luego se utiliza un software de visión binocular para calcular la velocidad del dron.

La innovación del sistema Swift radica en otra red neuronal artificial, que asigna el estado del dron a comandos para ajustar el empuje y la velocidad de rotación. Utilizando el aprendizaje por refuerzo, las recompensas obtenidas del entorno se optimizan mediante un proceso de prueba y error en simulación. En este algoritmo, el sistema utiliza aprendizaje por refuerzo, en lugar de aprendizaje de un extremo a otro, para cerrar la brecha entre la realidad y la simulación a través de la abstracción.

Dado que el estado está codificado en un nivel de abstracción más alto que la imagen original, el simulador de aprendizaje por refuerzo ya no necesita un entorno visual complejo. Esta optimización reduce la variación entre los sistemas simulados y reales y acelera la simulación, lo que permite que el sistema aprenda en aproximadamente 50 minutos.

Según el artículo, Swift consta de dos módulos clave: política de observación y política de control. Entre ellos, la política de observación consta de un estimador visual inercial y un detector de puerta, que puede convertir información visual e inercial de alta dimensión en codificación de baja dimensión específica de la tarea; la política de control está representada por un perceptrón de dos capas, que puede aceptar codificación de baja dimensión y traducirla en comandos de drones.

Supera la velocidad y el rendimiento de los pilotos humanos.

La pista para esta competencia fue diseñada por un piloto externo de FPV (perspectiva en primera persona) de clase mundial. La pista consta de siete puertas cuadradas, dispuestas en un espacio de 30 x 30 x 8 metros, formando un circuito de 75 metros de longitud.

Además, la pista presenta maniobras distintivas y desafiantes, incluido Split-S y más. Incluso si se produce una colisión, el piloto puede seguir corriendo mientras el avión pueda seguir volando. Si se produce una colisión y ninguno de los drones completa el recorrido, gana el drone más alejado.

Swift ha competido en múltiples carreras con jugadores como Alex Vanover (Campeón Mundial de la Drone Racing League 2019), Thomas Bitmatta (Campeón MultiGP 2019) y Marvin Schaepper (3 veces Campeón Suizo).

Entre ellos, Swift ganó 5 de 9 peleas con A. Vanover, 4 de 7 peleas con T. Bitmatta y 6 de 9 peleas con M. Schaepper.

Además, Swift falló un total de 10 veces, el 40% de las cuales se debieron a colisiones con oponentes, el 40% a colisiones con puertas y el 20% a volar más lento que los pilotos humanos.

**En general, Swift ganó la mayoría de las carreras contra todos los pilotos humanos. Además, Swift estableció el récord del tiempo de carrera más rápido, superando en medio segundo el mejor tiempo logrado por el piloto humano A. Vanover. **

Del análisis de datos se puede ver que Swift es más rápido que todos los pilotos humanos en general, especialmente en partes críticas como el despegue y los giros de emergencia. El tiempo de reacción de despegue del Swift es más corto, en promedio 120 milisegundos antes que el de un piloto humano. Además, el Swift acelera más, alcanzando velocidades más altas en la primera puerta.

Además, Swift exhibe maniobras más estrictas durante giros cerrados, posiblemente porque optimiza su trayectoria en escalas de tiempo más largas. Por el contrario, los pilotos humanos prefieren planificar acciones en plazos más cortos, teniendo en cuenta como máximo una posición de puerta en el futuro.

Además, **Swift logró la velocidad promedio más alta en toda la pista, encontró las líneas de carrera más cortas y logró mantener el avión volando cerca de sus límites. **En una contrarreloj que comparó a Swift con un campeón humano, el dron autónomo mostró tiempos de vuelta más consistentes, con media y varianza más bajas, mientras que el desempeño del piloto humano fue más individual, con media y varianza más altas.

El análisis exhaustivo muestra que el UAV autónomo Swift ha demostrado un excelente desempeño en la competencia, no solo en términos de velocidad, sino que también tiene características únicas en la estrategia de vuelo, lo que le permite mantener un alto nivel de desempeño durante toda la competencia.

No solo carreras de drones

Esta investigación explora las carreras de drones autónomos basadas en entradas de sensores ruidosas e incompletas del entorno físico, demostrando que un sistema de física autónomo logra un rendimiento de nivel de campeonato en carreras, a veces incluso superando a los campeones mundiales humanos. Destaca la importancia de que los robots logren un rendimiento de campeonato mundial en un popular deporte, logrando un gran hito para la robótica y la inteligencia.

Sin embargo, el sistema del estudio no fue entrenado para recuperarse de un accidente en comparación con los pilotos humanos. Esto limita la capacidad del sistema para continuar volando después de un impacto, mientras que un piloto humano puede continuar corriendo a pesar de los daños en el hardware.

Además, el sistema Swift es menos adaptable a los cambios ambientales que un piloto humano, ya que utiliza una cámara con una frecuencia de actualización más baja; si bien el método sobresale en carreras de drones autónomos, no es efectivo en otras situaciones del mundo real. La capacidad de generalizar entre sistemas y entornos no han sido completamente explorados.

Claramente, lo que Kaufmann y su equipo han logrado no se limita a las carreras de drones, ya que la tecnología puede encontrar uso en aplicaciones militares. Además, su tecnología puede hacer que los drones sean más fluidos, más rápidos y de mayor alcance, ayudando a los robots a utilizar recursos limitados de manera más eficiente en áreas como la conducción, la limpieza y la inspección.

Pero para lograr estos objetivos, el equipo de investigación aún necesita resolver muchos desafíos. Como dijo Croon en el artículo de revisión, "Para vencer a los pilotos humanos en cualquier entorno de carreras, el sistema debe ser capaz de hacer frente a perturbaciones externas como el viento, las condiciones de luz cambiantes y varias puertas que no están tan claramente definidas como otros entornos de carreras. Hombre-máquina y muchos otros factores."

Enlace de papel

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)