テスラ FSD 12 ライブブロードキャストデビュー! 45分間に1回だけの介入ビデオ「フィード」AI「ドライバー」

2023-08-28 09:00:12

出典: 「科学技術イノベーション委員会日報」

編集者鄭源芳

以前の約束通り、マスク氏は先週末、HW3を搭載したモデルSを使用してテスラFSD 12のベータ版を対外向けにライブで披露した。

この 45 分間の生放送では、ハンドルの後ろに座って携帯電話を持っていたマスク氏が車両の挙動に介入したのは 1 回だけでした。2 つの直線車線のうち車の少ない方を選択してください。

マスク氏は、FSD 12は不慣れな環境でもオフラインで使用でき、介入が発生した場合はシステムが記録し、分析のためにテスラに送り返すと述べた。

生放送が始まってから約20分後、マスク氏は唯一の介入を行ってプロセス全体を引き継いだ。その時、モデルSは直進しなければならなかったので、停止して赤信号を待ちました。しかし、左折信号が青に変わると、車両は実際にこれに追随し、幸いにもマスク氏と側にいたエンジニアが時間内に停止させた。

その後、マスク氏は左折信号のビデオをFSDにさらに「提供」すると述べた。

▌ビデオをフィードすることで「AI ドライバー」に「フィード」できますか?

実際、この生放送で、車両が段差で速度を落とし、スクーターのライダーを避けたとき、マスク氏は、FSD 12 には対応するコード行がなく、車両はこれらの動作を行うように人為的に設定されていると繰り返し強調しました* * ——道路標識の読み方は訓練されておらず、スクーターが何なのかも知りません。 FSD 12 がこれらの動作を完成させたのは、完全に多数のビデオトレーニングの結果です。ビデオトレーニングデータを使用すると、AI は自ら運転し、「人間のように行動する」ことを学習できます。

FSD が特定のシナリオで正しい決定を下せなかった場合、テスラはより多くのデータ (主にビデオ) をニューラルネットワークトレーニングに投入します。

もちろん、最も平凡でランダムなデータだけでは十分ではなく、ニューラルネットワークに供給されるデータは慎重に選択する必要があります。マスク氏はまた、優秀なドライバーからの質の高いデータがテスラの自動運転**のトレーニングの鍵であると強調しました。

「平凡なデータが大量にあると運転は改善されません。また、データ管理は非常に困難です。システムがどのデータを選択し、どのデータに基づいてトレーニングするかを制御できるソフトウェアがたくさんあります。」

テスラにとって、主要なデータ源は世界中の自社車両です。マスク氏はまた、テスラがニュージーランド、タイ、ノルウェー、日本などを含む世界中に複数のFSDテストドライバーを抱えていることも明らかにした。

2020 年以降、テスラはオートパイロットの意思決定をプログラミングロジックからニューラルネットワークと AI に移行し始めました。 3年間の開発を経て、ほぼ全体の意思決定とシーン処理がテスラのニューラルネットワークとAIに移管されたことはマスク氏のFSD 12ライブブロードキャストからも分かる。

FSD 11 の排他制御スタックには 300,000 行を超える C++ コードがありますが、12 のコードはわずか数行です。マスク氏は以前、車両制御（車両制御）が「テスラFSD AIパズル」の最後のピースであり、これにより30万行以上のC++コードが約2桁削減されることも指摘していた。

▌フル AI エンドツーエンド運転制御

Tesla FSD 12 はその最も重要なアップグレードであり、フル AI によるエンドツーエンドの運転制御** を実現します。

なぜエンドツーエンドのソリューションを選択するのでしょうか?マスク氏が生放送の前にホールマーズと連絡を取ったとき、彼はさらに詳細を語った。

** 「これが人間のやり方だ」と彼は言った、「光子が入って、手と足（制御）が出る。」 - 人間は運転するために目と生物学的ニューラルネットワークに依存している。自動運転ではカメラとニューラルネットワークAIが正しい一般的な意思決定スキーム**。

AIのニューラルネットワークが具体的な内容を説明することは難しいが、それに対応して人間の乗客はタクシーに乗ったときにドライバーが何を考えているのかを正確に知ることができず、ドライバーの評価を見ることしかできない。

ブローカーらは、エンドツーエンドのソリューションと以前のソリューションの主な違いの 1 つは、従来のモジュラーアーキテクチャがインテリジェントな運転を個別のタスクに分割し、それらのタスクが認識、予測、認識などの特殊な AI モデルまたはモジュールによって処理されることであると指摘しました。一方、エンドツーエンド AI は「知覚と意思決定の統合」、つまり「知覚」と「意思決定」を 1 つのモデルに統合します。

現時点では、Tesla のトレーニングのほとんどは依然として Nvidia の GPU に依存する必要があり、Tesla 独自の Dojo スーパーコンピューターが補助的に使用されています。 今年以来、テスラはトレーニングに 20 億ドルを費やしてきました。

Tesla は依然として残業を続けており、10,000 台の NVIDIA H100 を含む新しいコンピューティングパワークラスターを準備しており、今週月曜日 (8 月 28 日) に稼働する予定です。クラスターが接続伝送に Infiniband を使用していることは言及に値しますが、マスク氏は、Infiniband は今日の GPU よりも不足していると率直に述べました。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

1 いいね