Nguồn: "Nhật báo Ban Đổi mới Khoa học và Công nghệ"
Biên tập viên Zheng Yuanfang
Như đã hứa trước đó, Musk đã sử dụng Model S được trang bị HW3 để giới thiệu trực tiếp Tesla FSD 12 beta với thế giới bên ngoài vào cuối tuần trước.
Trong buổi phát sóng trực tiếp kéo dài 45 phút này, Musk, người ngồi sau vô lăng và cầm điện thoại di động, chỉ can thiệp vào hành vi của phương tiện một lần, chọn làn có ít xe hơn giữa hai làn đường thẳng.
Musk cho biết FSD 12 có thể sử dụng offline ở môi trường xa lạ, nếu có bất kỳ sự can thiệp nào xảy ra, hệ thống sẽ ghi lại và gửi về Tesla để phân tích.
Khoảng 20 phút sau khi buổi phát sóng trực tiếp bắt đầu, Musk thực hiện sự can thiệp duy nhất để tiếp quản toàn bộ quá trình. Lúc đó, chiếc Model S phải đi thẳng nên dừng lại chờ đèn đỏ. Nhưng khi đèn xi nhan trái chuyển sang màu xanh thì chiếc xe đó thực sự đã đuổi theo, rất may là Musk và các kỹ sư ở bên đã dừng lại kịp thời.
Sau đó, Musk cho biết sẽ "đưa" thêm video về đèn giao thông rẽ trái cho FSD.
**▌Bạn có thể "nuôi" "lái xe AI" bằng cách cho ăn video? **
Trên thực tế, trong buổi phát sóng trực tiếp này, khi chiếc xe giảm tốc độ khi va chạm tốc độ và tránh người lái xe tay ga, Musk liên tục nhấn mạnh rằng không có dòng mã tương ứng nào trong FSD 12 và chiếc xe được thiết lập một cách giả tạo để thực hiện những hành động này* * ——Nó chưa được đào tạo cách đọc biển báo đường, cũng như không biết xe tay ga là gì, Việc FSD 12 hoàn thành các hành vi này hoàn toàn là kết quả của một số lượng lớn video đào tạo. Bằng cách sử dụng dữ liệu đào tạo qua video, AI có thể tự học lái xe, "làm những việc như con người".
Nếu FSD không đưa ra quyết định đúng đắn trong một tình huống cụ thể, Tesla sẽ đưa thêm dữ liệu (chủ yếu là video) vào quá trình đào tạo mạng lưới thần kinh của mình.
Tất nhiên, dữ liệu tầm thường và ngẫu nhiên nhất vẫn chưa đủ, dữ liệu được đưa vào mạng lưới thần kinh cần phải được lựa chọn cẩn thận. Musk cũng nhấn mạnh rằng dữ liệu chất lượng cao từ những tài xế xuất sắc là chìa khóa để đào tạo khả năng lái xe tự động của Tesla**.
"Một lượng lớn dữ liệu tầm thường không cải thiện việc lái xe và việc quản lý dữ liệu khá khó khăn. Chúng tôi có rất nhiều phần mềm có thể kiểm soát dữ liệu nào hệ thống chọn và dữ liệu nào nó đào tạo."
Đối với Tesla, nguồn dữ liệu chính là đội xe ô tô từ khắp nơi trên thế giới. Musk cũng tiết lộ rằng Tesla có nhiều tài xế thử nghiệm FSD trên khắp thế giới, bao gồm New Zealand, Thái Lan, Na Uy, Nhật Bản, v.v.
Kể từ năm 2020, Tesla đã bắt đầu chuyển việc ra quyết định của Autopilot từ logic lập trình sang mạng lưới thần kinh và AI. Sau ba năm phát triển, cũng có thể thấy từ chương trình phát sóng trực tiếp FSD 12 của Musk rằng gần như toàn bộ quá trình ra quyết định và xử lý cảnh đã được chuyển sang mạng thần kinh và AI của Tesla.
Có hơn 300.000 dòng mã C++ trong ngăn điều khiển độc quyền của FSD 11 và chỉ có một vài dòng mã trong 12. Musk cũng đã chỉ ra trước đó rằng việc điều khiển phương tiện (điều khiển phương tiện) là mảnh ghép cuối cùng trong “câu đố AI Tesla FSD”, sẽ giảm bớt mã C++ gồm hơn 300.000 dòng xuống khoảng 2 bậc độ lớn.
▌Kiểm soát lái xe toàn diện bằng AI
Tesla FSD 12 là bản nâng cấp quan trọng nhất của hãng, hiện thực hóa khả năng kiểm soát lái xe toàn diện bằng AI**.
Về lý do tại sao chọn giải pháp end-to-end? Khi Musk kết nối với WholeMars trước buổi phát sóng trực tiếp, anh ấy đã cung cấp thêm thông tin chi tiết.
** "Đây là cách con người làm," ông nói, "các photon vào, tay và chân (điều khiển) ra." - Con người dựa vào mắt và mạng lưới thần kinh sinh học để lái xe. Để lái xe tự động, camera và mạng lưới thần kinh AI là chính xác Sơ đồ ra quyết định chung**.
Mặc dù mạng nơ-ron AI rất khó giải thích các chi tiết cụ thể nhưng tương ứng, hành khách là con người không thể biết chính xác tài xế đang nghĩ gì khi đi taxi và chỉ có thể xem đánh giá của tài xế.
Các nhà môi giới chỉ ra rằng một trong những điểm khác biệt chính giữa giải pháp đầu cuối và giải pháp trước đó là kiến trúc mô-đun truyền thống chia việc lái xe thông minh thành các nhiệm vụ riêng biệt, được xử lý bởi các mô hình hoặc mô-đun AI chuyên dụng, chẳng hạn như nhận thức, dự đoán, lập kế hoạch, v.v.; trong khi AI đầu cuối là "sự tích hợp giữa nhận thức và ra quyết định", nghĩa là tích hợp "nhận thức" và "ra quyết định" vào một mô hình.
Hiện tại, phần lớn hoạt động đào tạo của Tesla vẫn phải dựa vào GPU của Nvidia và siêu máy tính Dojo của Tesla được sử dụng làm phụ trợ. Kể từ năm nay, Tesla đã chi 2 tỷ USD cho việc đào tạo.
Tesla vẫn đang làm việc ngoài giờ, chuẩn bị một cụm sức mạnh điện toán mới, bao gồm 10.000 NVIDIA H100, dự kiến sẽ đi vào hoạt động vào thứ Hai tuần này (28 tháng 8). Điều đáng nói là cụm này sử dụng Infiniband để truyền kết nối, Musk thẳng thắn nói rằng Infiniband ngày nay còn thiếu hơn GPU.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Buổi ra mắt phát sóng trực tiếp Tesla FSD 12! Chỉ 1 video can thiệp trong 45 phút “nuôi” “driver” AI
Nguồn: "Nhật báo Ban Đổi mới Khoa học và Công nghệ"
Biên tập viên Zheng Yuanfang
Như đã hứa trước đó, Musk đã sử dụng Model S được trang bị HW3 để giới thiệu trực tiếp Tesla FSD 12 beta với thế giới bên ngoài vào cuối tuần trước.
Trong buổi phát sóng trực tiếp kéo dài 45 phút này, Musk, người ngồi sau vô lăng và cầm điện thoại di động, chỉ can thiệp vào hành vi của phương tiện một lần, chọn làn có ít xe hơn giữa hai làn đường thẳng.
Khoảng 20 phút sau khi buổi phát sóng trực tiếp bắt đầu, Musk thực hiện sự can thiệp duy nhất để tiếp quản toàn bộ quá trình. Lúc đó, chiếc Model S phải đi thẳng nên dừng lại chờ đèn đỏ. Nhưng khi đèn xi nhan trái chuyển sang màu xanh thì chiếc xe đó thực sự đã đuổi theo, rất may là Musk và các kỹ sư ở bên đã dừng lại kịp thời.
**▌Bạn có thể "nuôi" "lái xe AI" bằng cách cho ăn video? **
Trên thực tế, trong buổi phát sóng trực tiếp này, khi chiếc xe giảm tốc độ khi va chạm tốc độ và tránh người lái xe tay ga, Musk liên tục nhấn mạnh rằng không có dòng mã tương ứng nào trong FSD 12 và chiếc xe được thiết lập một cách giả tạo để thực hiện những hành động này* * ——Nó chưa được đào tạo cách đọc biển báo đường, cũng như không biết xe tay ga là gì, Việc FSD 12 hoàn thành các hành vi này hoàn toàn là kết quả của một số lượng lớn video đào tạo. Bằng cách sử dụng dữ liệu đào tạo qua video, AI có thể tự học lái xe, "làm những việc như con người".
Nếu FSD không đưa ra quyết định đúng đắn trong một tình huống cụ thể, Tesla sẽ đưa thêm dữ liệu (chủ yếu là video) vào quá trình đào tạo mạng lưới thần kinh của mình.
Tất nhiên, dữ liệu tầm thường và ngẫu nhiên nhất vẫn chưa đủ, dữ liệu được đưa vào mạng lưới thần kinh cần phải được lựa chọn cẩn thận. Musk cũng nhấn mạnh rằng dữ liệu chất lượng cao từ những tài xế xuất sắc là chìa khóa để đào tạo khả năng lái xe tự động của Tesla**.
"Một lượng lớn dữ liệu tầm thường không cải thiện việc lái xe và việc quản lý dữ liệu khá khó khăn. Chúng tôi có rất nhiều phần mềm có thể kiểm soát dữ liệu nào hệ thống chọn và dữ liệu nào nó đào tạo."
Đối với Tesla, nguồn dữ liệu chính là đội xe ô tô từ khắp nơi trên thế giới. Musk cũng tiết lộ rằng Tesla có nhiều tài xế thử nghiệm FSD trên khắp thế giới, bao gồm New Zealand, Thái Lan, Na Uy, Nhật Bản, v.v.
Kể từ năm 2020, Tesla đã bắt đầu chuyển việc ra quyết định của Autopilot từ logic lập trình sang mạng lưới thần kinh và AI. Sau ba năm phát triển, cũng có thể thấy từ chương trình phát sóng trực tiếp FSD 12 của Musk rằng gần như toàn bộ quá trình ra quyết định và xử lý cảnh đã được chuyển sang mạng thần kinh và AI của Tesla.
Có hơn 300.000 dòng mã C++ trong ngăn điều khiển độc quyền của FSD 11 và chỉ có một vài dòng mã trong 12. Musk cũng đã chỉ ra trước đó rằng việc điều khiển phương tiện (điều khiển phương tiện) là mảnh ghép cuối cùng trong “câu đố AI Tesla FSD”, sẽ giảm bớt mã C++ gồm hơn 300.000 dòng xuống khoảng 2 bậc độ lớn.
▌Kiểm soát lái xe toàn diện bằng AI
Tesla FSD 12 là bản nâng cấp quan trọng nhất của hãng, hiện thực hóa khả năng kiểm soát lái xe toàn diện bằng AI**.
Về lý do tại sao chọn giải pháp end-to-end? Khi Musk kết nối với WholeMars trước buổi phát sóng trực tiếp, anh ấy đã cung cấp thêm thông tin chi tiết.
** "Đây là cách con người làm," ông nói, "các photon vào, tay và chân (điều khiển) ra." - Con người dựa vào mắt và mạng lưới thần kinh sinh học để lái xe. Để lái xe tự động, camera và mạng lưới thần kinh AI là chính xác Sơ đồ ra quyết định chung**.
Mặc dù mạng nơ-ron AI rất khó giải thích các chi tiết cụ thể nhưng tương ứng, hành khách là con người không thể biết chính xác tài xế đang nghĩ gì khi đi taxi và chỉ có thể xem đánh giá của tài xế.
Các nhà môi giới chỉ ra rằng một trong những điểm khác biệt chính giữa giải pháp đầu cuối và giải pháp trước đó là kiến trúc mô-đun truyền thống chia việc lái xe thông minh thành các nhiệm vụ riêng biệt, được xử lý bởi các mô hình hoặc mô-đun AI chuyên dụng, chẳng hạn như nhận thức, dự đoán, lập kế hoạch, v.v.; trong khi AI đầu cuối là "sự tích hợp giữa nhận thức và ra quyết định", nghĩa là tích hợp "nhận thức" và "ra quyết định" vào một mô hình.
Hiện tại, phần lớn hoạt động đào tạo của Tesla vẫn phải dựa vào GPU của Nvidia và siêu máy tính Dojo của Tesla được sử dụng làm phụ trợ. Kể từ năm nay, Tesla đã chi 2 tỷ USD cho việc đào tạo.
Tesla vẫn đang làm việc ngoài giờ, chuẩn bị một cụm sức mạnh điện toán mới, bao gồm 10.000 NVIDIA H100, dự kiến sẽ đi vào hoạt động vào thứ Hai tuần này (28 tháng 8). Điều đáng nói là cụm này sử dụng Infiniband để truyền kết nối, Musk thẳng thắn nói rằng Infiniband ngày nay còn thiếu hơn GPU.