Fuente: "Diario del Consejo de Innovación en Ciencia y Tecnología"
Editor Zheng Yuanfang
Como prometió anteriormente, Musk utilizó un Model S equipado con HW3 para mostrar la versión beta del Tesla FSD 12 en vivo al mundo exterior el fin de semana pasado.
En esta retransmisión en directo de 45 minutos, Musk, que estaba sentado al volante y sosteniendo su teléfono móvil, sólo intervino una vez en el comportamiento del vehículo, eligiendo el que tenía menos coches entre los dos carriles rectos.
Musk dijo que el FSD 12 se puede utilizar sin conexión en entornos desconocidos; si se produce alguna intervención, el sistema registrará y enviará de vuelta a Tesla para su análisis.
Unos 20 minutos después de que comenzara la transmisión en vivo, Musk hizo la única intervención para hacerse cargo de todo el proceso. En ese momento, el Model S tenía que seguir recto, por lo que se detuvo y esperó el semáforo en rojo. Pero cuando la luz del intermitente a la izquierda se puso verde, el vehículo hizo lo mismo y, afortunadamente, Musk y los ingenieros que estaban a un lado lo detuvieron a tiempo.
Después de eso, Musk dijo que "enviaría" más videos de semáforos girando a la izquierda al FSD.
**ݨPuedes "alimentar" al "controlador de IA" alimentando el video? **
De hecho, en esta transmisión en vivo, cuando el vehículo redujo la velocidad en el badén y evitó al conductor del scooter, Musk enfatizó repetidamente que no hay una línea de código correspondiente en FSD 12, y que el vehículo está configurado artificialmente para realizar estas acciones* * ——No ha sido capacitado para leer las señales de tránsito ni sabe qué es un scooter. La finalización de estos comportamientos por parte de FSD 12 es enteramente el resultado de una gran cantidad de capacitación en video. Utilizando datos de entrenamiento en vídeo, la IA puede aprender a conducir por sí sola, "haciendo cosas como los humanos".
Si el FSD no toma las decisiones correctas en un escenario particular, Tesla arroja más datos (principalmente videos) en el entrenamiento de su red neuronal.
Por supuesto, los datos más mediocres y aleatorios no son suficientes; los datos que se alimentan a la red neuronal deben seleccionarse cuidadosamente. Musk también enfatizó que los datos de alta calidad de conductores excelentes son la clave para entrenar la conducción autónoma de Tesla**.
"Una gran cantidad de datos mediocres no mejora la conducción y la gestión de datos es bastante difícil. Tenemos una gran cantidad de software que puede controlar qué datos selecciona el sistema y con qué datos entrena".
Para Tesla, una importante fuente de datos es su flota de coches de todo el mundo. Musk también reveló que Tesla tiene varios conductores de pruebas de FSD en todo el mundo, incluidos Nueva Zelanda, Tailandia, Noruega, Japón, etc.
Desde 2020, Tesla ha comenzado a trasladar la toma de decisiones del piloto automático de la lógica de programación a las redes neuronales y la inteligencia artificial. Después de tres años de desarrollo, en la transmisión en vivo del FSD 12 de Musk también se puede ver que casi toda la toma de decisiones y el procesamiento de escenas se han transferido a la red neuronal y la IA de Tesla.
Hay más de 300.000 líneas de código C++ en la pila de control exclusiva de FSD 11, y sólo unas pocas líneas de código en 12. Musk también señaló antes que el control de vehículos (control de vehículos) es la última pieza del rompecabezas del "rompecabezas Tesla FSD AI", que reducirá el código C ++ de más de 300.000 líneas en aproximadamente 2 órdenes de magnitud.
▌Control de conducción completo con IA de extremo a extremo
Tesla FSD 12 es su actualización más importante, ya que permite un control de conducción completo mediante IA de extremo a extremo**.
¿Por qué elegir la solución de un extremo a otro? Cuando Musk se conectó con WholeMars antes de la transmisión en vivo, dio más detalles.
** "Así es como lo hacen los humanos", dijo, "fotones adentro, manos y pies (control) afuera". - Los humanos dependen de los ojos y las redes neuronales biológicas para conducir. Para la conducción autónoma, las cámaras y la red neuronal AI son correctas. El esquema general de toma de decisiones**.
Aunque es difícil para la red neuronal de IA explicar los detalles específicos, en consecuencia, los pasajeros humanos no pueden saber exactamente qué piensa el conductor cuando toman un taxi y solo pueden ver la evaluación del conductor.
Brokers señalaron que una de las diferencias clave entre la solución de extremo a extremo y la anterior es que la arquitectura modular tradicional divide la conducción inteligente en tareas separadas, que son manejadas por modelos o módulos de IA especializados, como percepción, predicción, planificación, etc.; mientras que la IA de extremo a extremo es "integración de percepción y toma de decisiones", es decir, integrar "percepción" y "toma de decisiones" en un solo modelo.
En la actualidad, la mayor parte del entrenamiento de Tesla todavía necesita depender de la GPU de Nvidia, y la supercomputadora Dojo de Tesla se utiliza como auxiliar. Desde este año, Tesla ha gastado 2 mil millones de dólares en capacitación.
Tesla todavía está trabajando horas extras, preparando un nuevo grupo de potencia informática, que incluye 10.000 NVIDIA H100, que se espera que entre en funcionamiento este lunes (28 de agosto). Vale la pena mencionar que el clúster utiliza Infiniband para la transmisión de conexiones. Musk dijo con franqueza que ** Hoy en día, Infiniband es más deficiente que GPU **.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
¡Debut de transmisión en vivo de Tesla FSD 12! Sólo un vídeo de intervención en 45 minutos "alimenta" al "conductor" de la IA
Fuente: "Diario del Consejo de Innovación en Ciencia y Tecnología"
Editor Zheng Yuanfang
Como prometió anteriormente, Musk utilizó un Model S equipado con HW3 para mostrar la versión beta del Tesla FSD 12 en vivo al mundo exterior el fin de semana pasado.
En esta retransmisión en directo de 45 minutos, Musk, que estaba sentado al volante y sosteniendo su teléfono móvil, sólo intervino una vez en el comportamiento del vehículo, eligiendo el que tenía menos coches entre los dos carriles rectos.
Unos 20 minutos después de que comenzara la transmisión en vivo, Musk hizo la única intervención para hacerse cargo de todo el proceso. En ese momento, el Model S tenía que seguir recto, por lo que se detuvo y esperó el semáforo en rojo. Pero cuando la luz del intermitente a la izquierda se puso verde, el vehículo hizo lo mismo y, afortunadamente, Musk y los ingenieros que estaban a un lado lo detuvieron a tiempo.
**ݨPuedes "alimentar" al "controlador de IA" alimentando el video? **
De hecho, en esta transmisión en vivo, cuando el vehículo redujo la velocidad en el badén y evitó al conductor del scooter, Musk enfatizó repetidamente que no hay una línea de código correspondiente en FSD 12, y que el vehículo está configurado artificialmente para realizar estas acciones* * ——No ha sido capacitado para leer las señales de tránsito ni sabe qué es un scooter. La finalización de estos comportamientos por parte de FSD 12 es enteramente el resultado de una gran cantidad de capacitación en video. Utilizando datos de entrenamiento en vídeo, la IA puede aprender a conducir por sí sola, "haciendo cosas como los humanos".
Si el FSD no toma las decisiones correctas en un escenario particular, Tesla arroja más datos (principalmente videos) en el entrenamiento de su red neuronal.
Por supuesto, los datos más mediocres y aleatorios no son suficientes; los datos que se alimentan a la red neuronal deben seleccionarse cuidadosamente. Musk también enfatizó que los datos de alta calidad de conductores excelentes son la clave para entrenar la conducción autónoma de Tesla**.
"Una gran cantidad de datos mediocres no mejora la conducción y la gestión de datos es bastante difícil. Tenemos una gran cantidad de software que puede controlar qué datos selecciona el sistema y con qué datos entrena".
Para Tesla, una importante fuente de datos es su flota de coches de todo el mundo. Musk también reveló que Tesla tiene varios conductores de pruebas de FSD en todo el mundo, incluidos Nueva Zelanda, Tailandia, Noruega, Japón, etc.
Desde 2020, Tesla ha comenzado a trasladar la toma de decisiones del piloto automático de la lógica de programación a las redes neuronales y la inteligencia artificial. Después de tres años de desarrollo, en la transmisión en vivo del FSD 12 de Musk también se puede ver que casi toda la toma de decisiones y el procesamiento de escenas se han transferido a la red neuronal y la IA de Tesla.
Hay más de 300.000 líneas de código C++ en la pila de control exclusiva de FSD 11, y sólo unas pocas líneas de código en 12. Musk también señaló antes que el control de vehículos (control de vehículos) es la última pieza del rompecabezas del "rompecabezas Tesla FSD AI", que reducirá el código C ++ de más de 300.000 líneas en aproximadamente 2 órdenes de magnitud.
▌Control de conducción completo con IA de extremo a extremo
Tesla FSD 12 es su actualización más importante, ya que permite un control de conducción completo mediante IA de extremo a extremo**.
¿Por qué elegir la solución de un extremo a otro? Cuando Musk se conectó con WholeMars antes de la transmisión en vivo, dio más detalles.
** "Así es como lo hacen los humanos", dijo, "fotones adentro, manos y pies (control) afuera". - Los humanos dependen de los ojos y las redes neuronales biológicas para conducir. Para la conducción autónoma, las cámaras y la red neuronal AI son correctas. El esquema general de toma de decisiones**.
Aunque es difícil para la red neuronal de IA explicar los detalles específicos, en consecuencia, los pasajeros humanos no pueden saber exactamente qué piensa el conductor cuando toman un taxi y solo pueden ver la evaluación del conductor.
Brokers señalaron que una de las diferencias clave entre la solución de extremo a extremo y la anterior es que la arquitectura modular tradicional divide la conducción inteligente en tareas separadas, que son manejadas por modelos o módulos de IA especializados, como percepción, predicción, planificación, etc.; mientras que la IA de extremo a extremo es "integración de percepción y toma de decisiones", es decir, integrar "percepción" y "toma de decisiones" en un solo modelo.
En la actualidad, la mayor parte del entrenamiento de Tesla todavía necesita depender de la GPU de Nvidia, y la supercomputadora Dojo de Tesla se utiliza como auxiliar. Desde este año, Tesla ha gastado 2 mil millones de dólares en capacitación.
Tesla todavía está trabajando horas extras, preparando un nuevo grupo de potencia informática, que incluye 10.000 NVIDIA H100, que se espera que entre en funcionamiento este lunes (28 de agosto). Vale la pena mencionar que el clúster utiliza Infiniband para la transmisión de conexiones. Musk dijo con franqueza que ** Hoy en día, Infiniband es más deficiente que GPU **.