Debut siaran langsung Tesla FSD 12! Hanya satu video intervensi dalam 45 menit yang "memberi makan" AI "driver"

Sumber: "Badan Inovasi Sains dan Teknologi Setiap Hari"

Editor Zheng Yuanfang

Seperti yang dijanjikan sebelumnya, Musk menggunakan Model S yang dilengkapi HW3 untuk menampilkan Tesla FSD 12 beta secara langsung ke dunia luar akhir pekan lalu.

Dalam siaran langsung berdurasi 45 menit ini, Musk yang duduk di belakang kemudi sambil memegang ponsel hanya satu kali mengintervensi perilaku kendaraan.Pilih salah satu yang mobilnya lebih sedikit di antara dua jalur lurus.

Musk mengatakan bahwa FSD 12 dapat digunakan secara offline di lingkungan asing; jika terjadi intervensi, sistem akan mencatat dan mengirimkannya kembali ke Tesla untuk dianalisis.

Sekitar 20 menit setelah siaran langsung dimulai, Musk melakukan satu-satunya intervensi untuk mengambil alih seluruh proses. Saat itu Model S harus jalan lurus sehingga berhenti dan menunggu lampu merah. Namun saat lampu sein kiri berubah menjadi hijau, kendaraan justru mengikutinya.Untungnya, Musk dan para insinyur di sampingnya menghentikannya tepat waktu.

Setelah itu, Musk mengatakan bahwa dia akan "memasukkan" lebih banyak video lampu lalu lintas belok kiri ke FSD.

**▌Anda dapat "memberi makan" "pengemudi AI" dengan memberi makan videonya? **

Faktanya, dalam siaran langsung ini, ketika kendaraan melambat di tengah gundukan kecepatan dan menghindari pengendara skuter, Musk berulang kali menekankan bahwa tidak ada baris kode yang sesuai di FSD 12, dan kendaraan diatur secara artifisial untuk melakukan tindakan ini* * ——Ia belum dilatih cara membaca rambu-rambu jalan, juga tidak mengetahui apa itu skuter, Penyelesaian perilaku ini oleh FSD 12 sepenuhnya merupakan hasil dari sejumlah besar pelatihan video. Dengan menggunakan data pelatihan video, AI dapat belajar mengemudi sendiri, "melakukan hal-hal seperti manusia".

Jika FSD tidak membuat keputusan yang tepat dalam skenario tertentu, Tesla memasukkan lebih banyak data (terutama video) ke dalam pelatihan jaringan sarafnya.

Tentu saja, data yang paling biasa-biasa saja dan acak saja tidak cukup, data yang diumpankan ke jaringan saraf perlu dipilih dengan cermat. Musk juga menekankan bahwa data berkualitas tinggi dari pengemudi yang hebat adalah kunci untuk melatih mengemudi otonom Tesla**.

“Data biasa-biasa saja dalam jumlah besar tidak meningkatkan kualitas berkendara, dan pengelolaan data cukup sulit. Kami memiliki banyak perangkat lunak yang dapat mengontrol data apa yang dipilih sistem dan data apa yang dilatihnya.”

Bagi Tesla, sumber data utama adalah armada mobilnya dari seluruh dunia. Musk juga mengungkapkan bahwa Tesla memiliki beberapa test driver FSD di seluruh dunia, termasuk Selandia Baru, Thailand, Norwegia, Jepang, dll.

Sejak tahun 2020, Tesla mulai mengalihkan pengambilan keputusan Autopilot dari logika pemrograman ke jaringan saraf dan AI. Setelah tiga tahun pengembangan, terlihat juga dari siaran langsung Musk FSD 12 bahwa hampir seluruh pengambilan keputusan dan pemrosesan adegan telah ditransfer ke jaringan saraf dan AI Tesla.

Ada lebih dari 300.000 baris kode C++ di tumpukan kontrol eksklusif FSD 11, dan hanya beberapa baris kode di 12. Musk juga menunjukkan sebelumnya bahwa pengendalian kendaraan (kendaraan kontrol) adalah bagian terakhir dari teka-teki "Tesla FSD AI puzzle", yang akan mengurangi kode C++ lebih dari 300.000 baris sekitar 2 kali lipat.

▌Kontrol mengemudi menyeluruh AI penuh

Tesla FSD 12 adalah peningkatan terpentingnya, mewujudkan kontrol berkendara menyeluruh AI**.

Lalu mengapa memilih solusi end-to-end? Ketika Musk terhubung dengan WholeMars sebelum siaran langsung, dia memberikan rincian lebih lanjut.

** "Beginilah cara manusia melakukannya," katanya, "foton masuk, tangan dan kaki (kontrol) keluar." - Manusia mengandalkan mata dan jaringan saraf biologis untuk mengemudi. Untuk mengemudi secara otonom, kamera dan jaringan saraf AI sudah benar Skema pengambilan keputusan umum**.

Meskipun jaringan saraf AI sulit menjelaskan detail spesifiknya, penumpang manusia tidak dapat mengetahui secara pasti apa yang dipikirkan pengemudi saat naik taksi, dan hanya dapat melihat evaluasi pengemudi.

Broker menunjukkan bahwa salah satu perbedaan utama antara solusi end-to-end dan solusi sebelumnya adalah bahwa arsitektur modular tradisional membagi pengendaraan cerdas menjadi tugas-tugas terpisah, yang ditangani oleh model atau modul AI khusus, seperti persepsi, prediksi, perencanaan, dll.; sedangkan AI ujung ke ujung adalah "integrasi persepsi dan pengambilan keputusan", yaitu mengintegrasikan "persepsi" dan "pengambilan keputusan" ke dalam satu model.

Saat ini, sebagian besar pelatihan Tesla masih harus mengandalkan GPU Nvidia, dan superkomputer Dojo milik Tesla digunakan sebagai tambahan. Sejak tahun ini, Tesla telah menghabiskan $2 miliar untuk pelatihan.

Tesla masih bekerja lembur, mempersiapkan cluster daya komputasi baru, termasuk 10,000 NVIDIA H100, yang diperkirakan akan online Senin ini (28 Agustus). Perlu disebutkan bahwa cluster ini menggunakan Infiniband untuk transmisi koneksi Musk mengatakan terus terang bahwa Infiniband lebih kurang daripada GPU saat ini.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)