L’intelligence artificielle (IA) a une fois de plus vaincu le champion humain.
Cette fois, c’est dans le domaine des courses de drones.
L'équipe du Dr Elia Kaufmann du groupe Robotique et Perception de l'Université de Zurich et son équipe Intel ont conçu conjointement un système de conduite autonome - Swift, qui a la capacité de piloter des drones en un seul coup. match de championnat contre un.
Ce résultat de recherche à succès vient d’être publié en couverture du dernier numéro du magazine Nature.
Figure | La couverture du dernier numéro de Nature. (Source : Nature)
Dans un article News & Views publié simultanément dans Nature, le professeur Guido de Croon, chercheur à l'Université de technologie de Delft aux Pays-Bas, écrit : "Kaufmann et al. Bon exemple. Alors que Swift a été formé en utilisant une combinaison intelligente des techniques d'apprentissage de l'IA et des algorithmes d'ingénierie traditionnels, le système devrait être développé davantage dans un environnement plus réaliste et varié pour libérer tout le potentiel de cette technologie.
Néanmoins, l'équipe de recherche a déclaré que cette recherche marque une étape importante dans la robotique mobile et l'intelligence artificielle et pourrait inspirer le déploiement de solutions hybrides basées sur l'apprentissage dans d'autres systèmes physiques tels que les véhicules terrestres autonomes, les avions et les robots personnels.
Formation intelligente intégrant des algorithmes d'IA et d'ingénierie
Actuellement, les systèmes d'intelligence artificielle (IA) basés sur l'apprentissage par renforcement profond ont surpassé les champions humains dans des jeux tels que les jeux Atari, les échecs, StarCraft et Gran Turismo. Cependant, ces réalisations se déroulent toutes dans un environnement virtuel et non dans le monde réel.
Les courses de drones sont un défi à la fois pour les pilotes expérimentés et pour l’IA, mais elles sont encore plus difficiles pour l’IA. Parce que dans un environnement virtuel, les ressources sont presque illimitées, alors que passer au monde réel signifie devoir utiliser des ressources limitées. Cela est particulièrement vrai pour les drones, puisque les capteurs et les équipements informatiques qui remplacent les pilotes humains doivent être transportés dans les airs.
De plus, le monde réel est beaucoup plus imprévisible que le monde virtuel. Bien que les drones de course simulés puissent parfaitement se déplacer selon des trajectoires préprogrammées, une seule commande donnée à un drone peut avoir de multiples effets, et l'impact est difficile à prévoir, ce qui est particulièrement compliqué pour les drones entraînés via l'IA.
Les méthodes traditionnelles d'apprentissage de bout en bout sont difficiles à transférer la cartographie de l'environnement virtuel au monde réel, il existe un écart de réalité entre le virtuel et la réalité, et l'écart de réalité constitue l'un des principaux défis du domaine de la robotique.
Dans cette étude, le système Swift a réalisé une formation intelligente en intégrant la technologie d'apprentissage de l'IA aux algorithmes d'ingénierie traditionnels. Tout d’abord, le système traite les images capturées par le drone depuis la caméra via un réseau neuronal artificiel pour détecter avec précision les coins de la porte. Un logiciel de vision binoculaire est ensuite utilisé pour calculer la vitesse du drone.
L'innovation du système Swift réside dans un autre réseau neuronal artificiel, qui mappe l'état du drone aux commandes permettant d'ajuster la poussée et le taux de rotation. Grâce à l'apprentissage par renforcement, les récompenses obtenues de l'environnement sont optimisées grâce à un processus d'essais et d'erreurs en simulation. Dans cet algorithme, le système utilise l'apprentissage par renforcement plutôt que l'apprentissage de bout en bout, ce qui lui permet de combler le fossé entre la réalité et la simulation grâce à des concepts abstraits.
Puisque l’état est codé à un niveau d’abstraction plus élevé que l’image originale, le simulateur d’apprentissage par renforcement n’a plus besoin d’un environnement visuel complexe. Cette optimisation réduit la différence entre le système simulé et le système réel et augmente la vitesse de simulation, permettant au système de terminer l'apprentissage en environ 50 minutes.
Selon le document, Swift se compose de deux modules clés : la politique d'observation et la politique de contrôle. Parmi eux, la politique d'observation consiste en un estimateur inertiel visuel et un détecteur de porte, qui peuvent convertir des informations visuelles et inertielles de grande dimension en un codage de faible dimension spécifique à une tâche ; la politique de contrôle est représentée par un perceptron à deux couches, qui peut acceptez le codage de faible dimension et traduisez-le en commandes de drone.
Surpasser la vitesse et les performances des pilotes humains
La piste de cette compétition a été conçue par un pilote FPV (perspective à la première personne) externe de classe mondiale. La piste se compose de sept portes carrées, disposées dans un espace de 30 x 30 x 8 mètres, formant un circuit de 75 mètres de long.
De plus, la piste propose des manœuvres distinctives et difficiles, notamment Split-S et bien plus encore. Même en cas de collision, le pilote peut continuer à courir tant que l'avion peut continuer à voler. Si une collision se produit et qu’aucun des deux drones ne termine le parcours, le drone le plus éloigné gagne.
Swift a couru contre Alex Vanover (champion du monde de la Drone Racing League 2019), Thomas Bitmatta (champion MultiGP 2019) et Marvin Schaepper (3X champion de Suisse).
Parmi eux, Swift a remporté 5 combats sur 9 avec A. Vanover, 4 combats sur 7 avec T. Bitmatta et 6 combats sur 9 avec M. Schaepper.
De plus, Swift a perdu un total de 10 fois, 40 % à cause d'une collision avec des adversaires, 40 % à cause d'une collision avec des portes et 20 % à cause d'un vol plus lent que les pilotes humains.
**Dans l'ensemble, Swift a remporté la plupart des matchs contre tous les pilotes humains. De plus, Swift a établi un record du temps de course le plus rapide, battant d'une demi-seconde le meilleur temps du pilote humain A. Vanover. **
L'analyse des données montre que Swift est globalement plus rapide que tous les pilotes humains, en particulier dans les parties critiques telles que le décollage et les virages d'urgence. Le temps de réaction au décollage du Swift est plus court, en moyenne 120 millisecondes plus tôt que celui d'un pilote humain. De plus, la Swift accélère davantage, atteignant des vitesses plus élevées dès la première porte.
De plus, Swift présente des manœuvres plus serrées lors de virages serrés, peut-être parce qu'il optimise sa trajectoire sur des échelles de temps plus longues. En revanche, les pilotes humains préfèrent planifier leurs actions sur des délais plus courts, en tenant compte d’au plus une position de porte dans le futur.
De plus, **Swift a atteint la vitesse moyenne la plus élevée sur l'ensemble de la piste, a trouvé la ligne de course la plus courte et a réussi à maintenir le véhicule près de la limite. **Dans les épreuves contre la montre comparant Swift aux champions humains, les drones autonomes ont montré des temps au tour plus cohérents avec une moyenne et une variance plus faibles, tandis que les performances des pilotes humains étaient plus individualisées avec une moyenne et une variance plus élevées.
L'analyse complète montre que le drone autonome Swift a montré d'excellentes performances lors de la compétition, non seulement supérieur en vitesse, mais possède également des caractéristiques uniques en termes de stratégie de vol, lui permettant de maintenir un haut niveau de performance tout au long de la compétition.
Pas seulement des courses de drones
Cette étude explore les courses de drones autonomes basées sur des entrées sensorielles bruyantes et incomplètes provenant de l'environnement physique, démontrant qu'un système physique autonome atteint des performances de niveau championnat en course, surpassant parfois les champions du monde humains. sport, franchissant une étape majeure pour la robotique et l’intelligence.
Cependant, le système étudié n'a pas été formé pour la récupération après un crash par rapport aux pilotes humains. Cela limite la capacité du système à continuer à voler après l'impact, tandis que les pilotes humains peuvent continuer à courir avec du matériel endommagé.
De plus, le système Swift est moins adaptable aux changements environnementaux qu'un pilote humain, utilisant une caméra avec un taux de rafraîchissement inférieur ; bien que la méthode excelle dans les courses de drones autonomes, elle n'est pas efficace dans d'autres mondes réels. La capacité de généraliser à travers les systèmes et Les environnements n’ont pas été entièrement explorés.
De toute évidence, les réalisations de Kaufmann et de son équipe ne se limitent pas aux courses de drones, car la technologie pourrait être utilisée dans des applications militaires. De plus, leur technologie peut rendre les drones plus fluides, plus rapides et à plus longue portée, aidant ainsi les robots à utiliser plus efficacement des ressources limitées dans des domaines tels que la conduite, le nettoyage et l'inspection.
Mais pour atteindre ces objectifs, l’équipe de recherche doit encore relever de nombreux défis. Comme le dit Croon dans l'article de synthèse : « Pour battre les pilotes humains dans n'importe quel environnement de course, le système doit être capable de faire face aux perturbations externes telles que le vent, les conditions d'éclairage changeantes et diverses portes qui ne sont pas aussi clairement définies que d'autres environnements de course. Humain et machine et bien d’autres facteurs.
Lien papier
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Dernière couverture de Nature : IA a vaincu le champion du monde humain et établi un record de la course de drones la plus rapide
Auteur : Yan Yimi, éditeur : Academic Jun
L’intelligence artificielle (IA) a une fois de plus vaincu le champion humain.
Cette fois, c’est dans le domaine des courses de drones.
L'équipe du Dr Elia Kaufmann du groupe Robotique et Perception de l'Université de Zurich et son équipe Intel ont conçu conjointement un système de conduite autonome - Swift, qui a la capacité de piloter des drones en un seul coup. match de championnat contre un.
Ce résultat de recherche à succès vient d’être publié en couverture du dernier numéro du magazine Nature.
Dans un article News & Views publié simultanément dans Nature, le professeur Guido de Croon, chercheur à l'Université de technologie de Delft aux Pays-Bas, écrit : "Kaufmann et al. Bon exemple. Alors que Swift a été formé en utilisant une combinaison intelligente des techniques d'apprentissage de l'IA et des algorithmes d'ingénierie traditionnels, le système devrait être développé davantage dans un environnement plus réaliste et varié pour libérer tout le potentiel de cette technologie.
Néanmoins, l'équipe de recherche a déclaré que cette recherche marque une étape importante dans la robotique mobile et l'intelligence artificielle et pourrait inspirer le déploiement de solutions hybrides basées sur l'apprentissage dans d'autres systèmes physiques tels que les véhicules terrestres autonomes, les avions et les robots personnels.
Formation intelligente intégrant des algorithmes d'IA et d'ingénierie
Actuellement, les systèmes d'intelligence artificielle (IA) basés sur l'apprentissage par renforcement profond ont surpassé les champions humains dans des jeux tels que les jeux Atari, les échecs, StarCraft et Gran Turismo. Cependant, ces réalisations se déroulent toutes dans un environnement virtuel et non dans le monde réel.
Les courses de drones sont un défi à la fois pour les pilotes expérimentés et pour l’IA, mais elles sont encore plus difficiles pour l’IA. Parce que dans un environnement virtuel, les ressources sont presque illimitées, alors que passer au monde réel signifie devoir utiliser des ressources limitées. Cela est particulièrement vrai pour les drones, puisque les capteurs et les équipements informatiques qui remplacent les pilotes humains doivent être transportés dans les airs.
Les méthodes traditionnelles d'apprentissage de bout en bout sont difficiles à transférer la cartographie de l'environnement virtuel au monde réel, il existe un écart de réalité entre le virtuel et la réalité, et l'écart de réalité constitue l'un des principaux défis du domaine de la robotique.
Dans cette étude, le système Swift a réalisé une formation intelligente en intégrant la technologie d'apprentissage de l'IA aux algorithmes d'ingénierie traditionnels. Tout d’abord, le système traite les images capturées par le drone depuis la caméra via un réseau neuronal artificiel pour détecter avec précision les coins de la porte. Un logiciel de vision binoculaire est ensuite utilisé pour calculer la vitesse du drone.
Puisque l’état est codé à un niveau d’abstraction plus élevé que l’image originale, le simulateur d’apprentissage par renforcement n’a plus besoin d’un environnement visuel complexe. Cette optimisation réduit la différence entre le système simulé et le système réel et augmente la vitesse de simulation, permettant au système de terminer l'apprentissage en environ 50 minutes.
Surpasser la vitesse et les performances des pilotes humains
La piste de cette compétition a été conçue par un pilote FPV (perspective à la première personne) externe de classe mondiale. La piste se compose de sept portes carrées, disposées dans un espace de 30 x 30 x 8 mètres, formant un circuit de 75 mètres de long.
De plus, la piste propose des manœuvres distinctives et difficiles, notamment Split-S et bien plus encore. Même en cas de collision, le pilote peut continuer à courir tant que l'avion peut continuer à voler. Si une collision se produit et qu’aucun des deux drones ne termine le parcours, le drone le plus éloigné gagne.
Parmi eux, Swift a remporté 5 combats sur 9 avec A. Vanover, 4 combats sur 7 avec T. Bitmatta et 6 combats sur 9 avec M. Schaepper.
De plus, Swift a perdu un total de 10 fois, 40 % à cause d'une collision avec des adversaires, 40 % à cause d'une collision avec des portes et 20 % à cause d'un vol plus lent que les pilotes humains.
**Dans l'ensemble, Swift a remporté la plupart des matchs contre tous les pilotes humains. De plus, Swift a établi un record du temps de course le plus rapide, battant d'une demi-seconde le meilleur temps du pilote humain A. Vanover. **
L'analyse des données montre que Swift est globalement plus rapide que tous les pilotes humains, en particulier dans les parties critiques telles que le décollage et les virages d'urgence. Le temps de réaction au décollage du Swift est plus court, en moyenne 120 millisecondes plus tôt que celui d'un pilote humain. De plus, la Swift accélère davantage, atteignant des vitesses plus élevées dès la première porte.
De plus, Swift présente des manœuvres plus serrées lors de virages serrés, peut-être parce qu'il optimise sa trajectoire sur des échelles de temps plus longues. En revanche, les pilotes humains préfèrent planifier leurs actions sur des délais plus courts, en tenant compte d’au plus une position de porte dans le futur.
L'analyse complète montre que le drone autonome Swift a montré d'excellentes performances lors de la compétition, non seulement supérieur en vitesse, mais possède également des caractéristiques uniques en termes de stratégie de vol, lui permettant de maintenir un haut niveau de performance tout au long de la compétition.
Pas seulement des courses de drones
Cette étude explore les courses de drones autonomes basées sur des entrées sensorielles bruyantes et incomplètes provenant de l'environnement physique, démontrant qu'un système physique autonome atteint des performances de niveau championnat en course, surpassant parfois les champions du monde humains. sport, franchissant une étape majeure pour la robotique et l’intelligence.
Cependant, le système étudié n'a pas été formé pour la récupération après un crash par rapport aux pilotes humains. Cela limite la capacité du système à continuer à voler après l'impact, tandis que les pilotes humains peuvent continuer à courir avec du matériel endommagé.
De plus, le système Swift est moins adaptable aux changements environnementaux qu'un pilote humain, utilisant une caméra avec un taux de rafraîchissement inférieur ; bien que la méthode excelle dans les courses de drones autonomes, elle n'est pas efficace dans d'autres mondes réels. La capacité de généraliser à travers les systèmes et Les environnements n’ont pas été entièrement explorés.
Mais pour atteindre ces objectifs, l’équipe de recherche doit encore relever de nombreux défis. Comme le dit Croon dans l'article de synthèse : « Pour battre les pilotes humains dans n'importe quel environnement de course, le système doit être capable de faire face aux perturbations externes telles que le vent, les conditions d'éclairage changeantes et diverses portes qui ne sont pas aussi clairement définies que d'autres environnements de course. Humain et machine et bien d’autres facteurs.
Lien papier