Дебют у прямому ефірі Tesla FSD 12! Лише одне відео втручання за 45 хвилин «нагодує» штучного інтелекту «водія»

2023-08-28 09:00:12

Джерело: "Science and Technology Innovation Board Daily"

Редактор Чжен Юаньфан

Як і було обіцяно раніше, минулих вихідних Маск використовував Model S, оснащену HW3, щоб показати бета-версію Tesla FSD 12 наживо зовнішньому світу.

У цьому 45-хвилинному прямому ефірі Маск, який сидів за кермом і тримав у руках мобільний телефон, лише один раз втрутився в поведінку транспортного засобу.Оберіть той, у якому менше машин серед двох прямих смуг.

Маск сказав, що FSD 12 можна використовувати в автономному режимі в незнайомому середовищі; якщо станеться будь-яке втручання, система запише і відправить назад Tesla для аналізу.

Приблизно через 20 хвилин після початку прямого ефіру Маск зробив єдине втручання, щоб узяти на себе весь процес. У цей час Model S мала їхати прямо, тому вона зупинилася і чекала на червоне світло. Але коли лівий покажчик повороту загорівся зеленим, автомобіль фактично пішов за ним.На щастя, Маск та інженери збоку вчасно зупинили його.

Після цього Маск заявив, що «годуватиме» FSD більше відео лівоповоротних світлофорів.

▌Ви можете "нагодувати" "AI водіння" за допомогою відео?

Фактично, під час цієї прямої трансляції, коли транспортний засіб сповільнився на лежачому поліцейському та уникнув скутериста, Маск неодноразово наголошував, що в FSD 12 немає рядка відповідного коду, і транспортний засіб штучно налаштований на такі дії* * ——Він не навчений читати дорожні знаки, а також не знає, що таке скутер, Виконання FSD 12 цих дій є повністю результатом великої кількості відеонавчань. Використовуючи навчальні відеодані, штучний інтелект може навчитися керувати самостійно, «роблячи речі як люди».

Якщо FSD не приймає правильного рішення в певному сценарії, Tesla кидає більше даних (головним чином відео) у навчання своєї нейронної мережі.

Звичайно, самих посередніх і випадкових даних недостатньо, дані, що подаються в нейронну мережу, потрібно ретельно відбирати. Маск також підкреслив, що високоякісні дані від чудових водіїв є ключем до навчання Tesla автономному водінню**.

«Велика кількість посередніх даних не покращує водіння, а керування даними досить складне. У нас є багато програмного забезпечення, яке може контролювати, які дані система вибирає та на яких даних тренується».

Для Tesla основним джерелом даних є її парк автомобілів з усього світу. Маск також повідомив, що Tesla має кілька тест-драйверів FSD по всьому світу, включаючи Нову Зеландію, Таїланд, Норвегію, Японію тощо.

З 2020 року Tesla почала переносити процес прийняття рішень на автопілоті з логіки програмування на нейронні мережі та ШІ. Після трьох років розробки також можна побачити з прямої трансляції FSD 12 Маска, що майже все прийняття рішень і обробка сцени було передано нейронній мережі Tesla та ШІ.

Є понад 300 000 рядків коду C++ в ексклюзивному контрольному стеку FSD 11 і лише кілька рядків коду в 12. Раніше Маск також зазначав, що керування транспортним засобом (контроль транспортного засобу) є останньою частиною головоломки «головоломки Tesla FSD AI», яка зменшить код C++ із понад 300 000 рядків приблизно на 2 порядки.

▌Повний наскрізний контроль водіння AI

Tesla FSD 12 є його найважливішим оновленням, яке реалізує повне наскрізне керування автомобілем **.

Щодо того, навіщо вибирати наскрізне рішення? Коли Маск підключився до WholeMars перед прямою трансляцією, він розповів більше деталей.

** «Ось як це роблять люди, — сказав він, — фотони входять, руки й ноги (контроль) виходять». — Люди покладаються на очі та біологічні нейронні мережі, щоб керувати автомобілем. Для автономного водіння правильні камери та нейронна мережа AI Загальна схема прийняття рішень**.

Хоча нейромережі штучного інтелекту важко пояснити конкретні деталі, відповідно, люди-пасажири не можуть точно знати, про що думає водій, коли вони їдуть на таксі, і можуть бачити лише оцінку водія.

Брокери відзначили, що одна з ключових відмінностей між наскрізним рішенням і попереднім полягає в тому, що традиційна модульна архітектура розділяє інтелектуальне водіння на окремі завдання, які виконуються спеціалізованими моделями або модулями ШІ, такими як сприйняття, прогнозування, планування тощо; тоді як наскрізний ШІ — це «інтеграція сприйняття та прийняття рішень», тобто інтеграція «сприйняття» та «прийняття рішень» в одну модель.

Наразі більшість тренувань Tesla все ще має покладатися на GPU Nvidia, а власний суперкомп’ютер Dojo Tesla використовується як допоміжний. З цього року Tesla витратила 2 мільярди доларів на навчання.

Tesla все ще працює понаднормово, готуючи новий кластер обчислювальної потужності, включаючи 10 000 NVIDIA H100, який, як очікується, буде запущено в Інтернет цього понеділка (28 серпня). Варто зазначити, що кластер використовує Infiniband для передачі з’єднання.Маск відверто сказав, що Infiniband сьогодні більше не вистачає, ніж GPU.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

1 лайків