Estreia na transmissão ao vivo do Tesla FSD 12! Apenas um vídeo de intervenção em 45 minutos “alimenta” AI “driver”

Fonte: "Conselho Diário de Inovação em Ciência e Tecnologia"

Editor Zheng Yuanfang

Como prometido anteriormente, Musk usou um Modelo S equipado com HW3 para mostrar o Tesla FSD 12 beta ao vivo para o mundo exterior no fim de semana passado.

Nesta transmissão ao vivo de 45 minutos, Musk, que estava sentado ao volante e segurando o celular, interveio apenas uma vez no comportamento do veículo, escolhendo aquele com menos carros entre as duas faixas retas.

Musk disse que o FSD 12 pode ser usado offline em ambientes desconhecidos; se ocorrer alguma intervenção, o sistema irá gravar e enviar de volta à Tesla para análise.

Cerca de 20 minutos após o início da transmissão ao vivo, Musk fez a única intervenção para assumir todo o processo. Naquela época, o Model S tinha que seguir em frente, então parou e esperou o sinal vermelho. Mas quando a luz do sinal de mudança de direção à esquerda ficou verde, o veículo realmente seguiu o exemplo.Felizmente, Musk e os engenheiros ao lado o pararam a tempo.

Depois disso, Musk disse que iria “alimentar” mais vídeos de semáforos de conversão à esquerda para o FSD.

**▌Você pode "alimentar" a "direção de IA" alimentando o vídeo? **

Na verdade, nesta transmissão ao vivo, quando o veículo desacelerou na lombada e evitou o condutor da scooter, Musk enfatizou repetidamente que não há nenhuma linha de código correspondente no FSD 12, e o veículo está artificialmente configurado para realizar essas ações* * ——Ele não foi treinado para ler os sinais de trânsito, nem sabe o que é uma scooter. A conclusão desses comportamentos pelo FSD 12 é inteiramente o resultado de um grande número de treinamento em vídeo. Usando dados de treinamento em vídeo, a IA pode aprender a dirigir por conta própria, “fazendo coisas como humanos”.

Se o FSD não tomar as decisões corretas em um cenário específico, Tesla lança mais dados (principalmente vídeo) em seu treinamento de rede neural.

É claro que os dados mais medíocres e aleatórios não são suficientes, os dados alimentados na rede neural precisam ser cuidadosamente selecionados. Musk também enfatizou que dados de alta qualidade provenientes de excelentes condutores são a chave para treinar a condução autónoma da Tesla**.

"Uma grande quantidade de dados medíocres não melhora a direção e o gerenciamento de dados é bastante difícil. Temos muitos softwares que podem controlar quais dados o sistema seleciona e quais dados ele treina."

Para a Tesla, uma importante fonte de dados é a sua frota de carros de todo o mundo. Musk também revelou que a Tesla tem vários pilotos de teste FSD em todo o mundo, incluindo Nova Zelândia, Tailândia, Noruega, Japão, etc.

Desde 2020, a Tesla começou a mudar a tomada de decisões do piloto automático da lógica de programação para redes neurais e IA. Após três anos de desenvolvimento, também pode ser visto na transmissão ao vivo do FSD 12 de Musk que quase toda a tomada de decisão e processamento de cena foi transferida para a rede neural e IA de Tesla.

Existem mais de 300.000 linhas de código C++ na pilha de controle exclusiva do FSD 11 e apenas algumas linhas de código no 12. Musk também apontou antes que o controle do veículo (controle do veículo) é a última peça do quebra-cabeça do "quebra-cabeça Tesla FSD AI", que reduzirá o código C++ de mais de 300.000 linhas em cerca de 2 ordens de magnitude.

▌Controle de direção completo com IA de ponta a ponta

O Tesla FSD 12 é a sua atualização mais importante, proporcionando controle de condução completo por IA de ponta a ponta**.

Por que escolher a solução ponta a ponta? Quando Musk se conectou com a WholeMars antes da transmissão ao vivo, ele deu mais detalhes.

** "É assim que os humanos fazem isso", disse ele, "fótons entram, mãos e pés (controle) saem." - Os humanos dependem dos olhos e das redes neurais biológicas para dirigir. Para a direção autônoma, as câmeras e a IA da rede neural estão corretas O esquema geral de tomada de decisão**.

Embora seja difícil para a rede neural de IA explicar detalhes específicos, correspondentemente, os passageiros humanos não podem saber exatamente o que o motorista está pensando quando pegam um táxi e só podem ver a avaliação do motorista.

Os corretores apontaram que uma das principais diferenças entre a solução ponta a ponta e a anterior é que a arquitetura modular tradicional divide a direção inteligente em tarefas separadas, que são tratadas por modelos ou módulos especializados de IA, como percepção, previsão, planejamento, etc.; enquanto a IA de ponta a ponta é "integração de percepção e tomada de decisão", isto é, integração de "percepção" e "tomada de decisão" em um modelo.

Atualmente, a maior parte do treinamento de Tesla ainda precisa contar com a GPU da Nvidia, e o supercomputador Dojo de Tesla é usado como auxiliar. Desde este ano, a Tesla gastou US$ 2 bilhões em treinamento.

A Tesla ainda está trabalhando horas extras, preparando um novo cluster de poder de computação, incluindo 10.000 NVIDIA H100s, que deverá estar online nesta segunda-feira (28 de agosto). Vale ressaltar que o cluster usa Infiniband para transmissão de conexão. Musk disse francamente que Falta mais Infiniband do que GPU hoje.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)