A última capa da Nature: AI derrotou o campeão mundial humano e estabeleceu um recorde para as corridas de drones mais rápidas

Autor: Yan Yimi, editor: Xue Jun

A inteligência artificial (IA) derrotou mais uma vez o campeão humano.

Desta vez, é no domínio das corridas de drones.

A equipe da Dra. Elia Kaufmann do Grupo de Robótica e Percepção da Universidade de Zurique e sua equipe da Intel projetaram em conjunto um sistema de direção autônomo - Swift, que tem a capacidade de pilotar drones de uma só vez. Derrotar um oponente humano de uma só vez. uma partida do campeonato.

Este resultado de pesquisa de grande sucesso acaba de ser publicado como artigo de capa na última edição da revista Nature.

Foto | Capa da última edição da Nature. (Fonte: Natureza)

Em um artigo de notícias e opiniões publicado ao mesmo tempo na Nature, o professor Guido de Croon, pesquisador da Universidade de Tecnologia de Delft, na Holanda, escreveu: "A pesquisa de Kaufmann et al. é um grande passo em frente para os roboticistas superar a lacuna da realidade. Bom exemplo. Embora o Swift seja treinado usando uma combinação inteligente de técnicas de aprendizagem de IA e algoritmos de engenharia tradicionais, o sistema deve ser desenvolvido em um ambiente mais realista e variado para liberar todo o potencial desta tecnologia."

No entanto, a equipa de investigação afirmou que esta investigação marca um marco na robótica móvel e na inteligência das máquinas e pode inspirar a implantação de soluções híbridas baseadas na aprendizagem noutros sistemas físicos, como veículos terrestres autónomos, aeronaves e robôs pessoais.

Treinamento inteligente integrando IA e algoritmos de engenharia

Atualmente, os sistemas de inteligência artificial (IA) baseados na aprendizagem por reforço profundo superaram os campeões humanos em jogos como Atari, xadrez, StarCraft e Gran Turismo. No entanto, todas estas conquistas ocorrem num ambiente virtual e não no mundo real.

As corridas de drones são desafiadoras tanto para pilotos experientes quanto para IA, mas são ainda mais desafiadoras para IA. Porque em um ambiente virtual os recursos são quase ilimitados, enquanto mudar para o mundo real significa ter que usar recursos limitados. Isto é especialmente verdadeiro para os drones, onde os sensores e dispositivos de computação que substituem os pilotos humanos devem ser transportados para o ar.

Além disso, o mundo real é mais imprevisível que o mundo virtual. Embora os drones de corrida simulados possam viajar perfeitamente de acordo com trajetórias pré-programadas, um único comando emitido para um drone pode ter múltiplos efeitos, e o impacto é difícil de prever, o que é especialmente complicado para drones treinados através de IA.

Os métodos tradicionais de aprendizagem ponta a ponta são difíceis de transferir o mapeamento do ambiente virtual para o mundo real. Existe uma lacuna de realidade entre o virtual e a realidade, e a lacuna de realidade constitui um dos principais desafios no campo da robótica.

Neste estudo, o sistema Swift obteve treinamento inteligente integrando a tecnologia de aprendizagem de IA com algoritmos de engenharia tradicionais. Primeiro, o sistema processa as imagens captadas pelo drone da câmera por meio de uma rede neural artificial para detectar com precisão os cantos da porta. O software de visão binocular é então usado para calcular a velocidade do drone.

A inovação do sistema Swift é outra rede neural artificial que mapeia o status do drone para comandos para ajustar o impulso e a taxa de rotação. Use o aprendizado por reforço para otimizar as recompensas obtidas do ambiente por meio de um processo de tentativa e erro na simulação. Neste algoritmo, o sistema utiliza aprendizagem por reforço em vez de aprendizagem ponta a ponta, permitindo preencher a lacuna entre a realidade e a simulação por meio de conceitos abstratos.

Como o nível de abstração da codificação de estado é superior ao da imagem original, os simuladores de aprendizagem por reforço não requerem mais ambientes visuais complexos. Essa otimização reduz a diferença entre sistemas simulados e reais e aumenta a velocidade da simulação, permitindo que o sistema conclua o aprendizado em aproximadamente 50 minutos.

Segundo o artigo, o Swift consiste em dois módulos principais: política de observação e política de controle. Entre eles, a política de observação consiste em um estimador inercial visual e um detector de porta, que pode converter informações visuais e inerciais de alta dimensão em codificação de baixa dimensão específica da tarefa; a política de controle é representada por um perceptron de duas camadas, que pode aceite codificação de baixa dimensão e converta-a em comandos drone.

Supere a velocidade e o desempenho dos pilotos humanos

O percurso para esta competição foi desenhado por um piloto externo de FPV (perspectiva em primeira pessoa) de classe mundial. A pista é composta por sete portões quadrados dispostos em um espaço de 30×30×8 metros, formando uma pista de 75 metros de extensão.

Além disso, a pista apresenta manobras distintas e desafiadoras, incluindo Split-S e muito mais. Mesmo em caso de colisão, desde que a aeronave possa continuar a voar, o piloto ainda poderá continuar a corrida. Em caso de colisão e nenhum dos drones conseguir completar a pista, o drone com a maior distância vence.

Swift correu contra nomes como Alex Vanover (campeão mundial da Drone Racing League 2019), Thomas Bitmatta (campeão MultiGP 2019) e Marvin Schaepper (3X campeão suíço).

Entre eles, Swift venceu 5 das 9 lutas com A. Vanover, 4 das 7 lutas com T. Bitmatta e 6 das 9 lutas com M. Schaepper.

Além disso, o Swift falhou um total de 10 vezes, 40% das quais devido a colisões com oponentes, 40% devido a colisões com portas e 20% devido a voar mais devagar que os pilotos humanos.

**No geral, Swift venceu a maioria das corridas contra todos os pilotos humanos. Além disso, Swift estabeleceu o recorde de tempo de corrida mais rápido, batendo o melhor tempo alcançado pelo piloto humano A. Vanover por meio segundo. **

Pode-se observar pela análise dos dados que o Swift é mais rápido do que todos os pilotos humanos em geral, especialmente em partes críticas, como decolagem e curvas de emergência. O tempo de reação de decolagem do Swift é menor, em média 120 milissegundos mais cedo do que um piloto humano. Além disso, o Swift acelera mais, atingindo velocidades mais altas no primeiro portão.

Além disso, o Swift exibe manobras mais apertadas durante curvas fechadas, possivelmente porque otimiza sua trajetória em escalas de tempo mais longas. Em contraste, os pilotos humanos preferem planear ações em escalas de tempo mais curtas, tendo em conta no máximo uma posição de portão no futuro.

Além disso, **Swift alcançou a velocidade média mais alta na pista geral, encontrou as linhas de corrida mais curtas e manteve a aeronave voando perto de seus limites. **Em um contra-relógio comparando o Swift a um campeão humano, o drone autônomo apresentou tempos de volta mais consistentes, com média e variância menores, enquanto o desempenho do piloto humano foi mais individual, com média e variância maiores.

Uma análise abrangente mostra que o drone autônomo Swift demonstrou excelente desempenho na competição, não apenas superior em velocidade, mas também com características únicas na estratégia de voo, permitindo-lhe manter um alto nível de desempenho ao longo da competição.

Não apenas corridas de drones

Esta pesquisa explora corridas autônomas de drones com base em informações de detecção ruidosas e incompletas do ambiente físico, demonstrando um sistema de física autônomo alcançando desempenho de nível de campeonato em corridas, às vezes até superando campeões mundiais humanos. Destaca a importância de robôs alcançarem desempenho de campeonato mundial em um popular esporte, alcançando um marco importante para a robótica e a inteligência.

No entanto, o sistema no estudo não foi treinado para se recuperar de um acidente em comparação com pilotos humanos. Isto limita a capacidade do sistema de continuar voando após um impacto, enquanto um piloto humano pode continuar correndo apesar dos danos ao hardware.

Além disso, em comparação com pilotos humanos, o sistema Swift é menos adaptável às mudanças ambientais e utiliza uma taxa de atualização de câmera mais baixa; embora este método tenha um bom desempenho em corridas autônomas de drones, não é prático em outras realidades. Capacidades de generalização entre sistemas e ambientes ainda não foram totalmente explorados.

Claramente, o que Kaufmann e sua equipe alcançaram não se limita às corridas de drones, já que a tecnologia pode ser usada em aplicações militares. Além disso, a sua tecnologia pode tornar os drones mais suaves, rápidos e de maior alcance, ajudando os robôs a utilizar recursos limitados de forma mais eficiente em áreas como condução, limpeza e inspeção.

Mas para atingir estes objetivos, a equipa de investigação ainda precisa de resolver muitos desafios. Como Croon disse no artigo de revisão: “Para vencer os pilotos humanos em qualquer ambiente de corrida, o sistema deve ser capaz de lidar com perturbações externas, como vento, mudanças nas condições de luz e várias portas que não são tão claramente definidas como em outros ambientes de corrida. Humanos e máquinas e muitos outros fatores.”

Link de papel

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)