Mühendislik Akademisi akademisyeni Zhang Yaqin: Ön eğitim ve üretken büyük modeller, otonom sürüş teknolojisi paradigmasında yeni değişiklikler getirecek

Görüntü kaynağı: Sınırsız AI tarafından oluşturuldu

GPT tarafından temsil edilen üretken büyük modellerin ortaya çıkması, yapay zeka teknolojisinde başka bir sıçrama yaptı ve yapay zeka teknolojisi, teknik paradigmayı ayrımcıdan üretkenliğe değiştirme sürecinden geçiyor. Generative, pre-training ve multi-modal gibi büyük model teknolojilerinin tanıtılmasıyla, otonom sürüş teknolojisinin olgunlaşması ve insansız olması için de olanak sağlıyor.

Dünyanın önde gelen yapay zeka araştırma kurumu Tsinghua Akıllı Endüstri Araştırma Enstitüsü'nden (AIR) ve önde gelen yerli otonom sürüş AI teknolojisi şirketinden Milli Zhixing, büyük modellerin teknik eğilimi ve uygulaması hakkında şaşırtıcı derecede tutarlı bir yargıya sahiptir. Aynı zamanda, iki taraf da veriye dayalı karar verme optimizasyonu yönünde derinlemesine araştırmalar gerçekleştirdi, ortaklaşa çok yönlü ve çok seviyeli endüstri-üniversite-araştırma derinlemesine işbirliğini teşvik etti ve otonom sürüş alanında AI teknolojisinin uygulanmasını hızlandırdı.

11 Ekim 2023 tarihinde Çin Mühendislik Akademisi akademisyeni, Tsinghua Üniversitesi profesörü ve Tsinghua Akıllı Endüstri Araştırma Enstitüsü (AIR) başkanı Zhang Yaqin, Milli Zhixing tarafından düzenlenen 9. HAOMO AI GÜNÜ'ne katılarak "Akıllı Sürüşün Yeni İlerlemesi - Büyük Model, Üretken Al ve Akıllı Sürüş" başlıklı bir açılış konuşması yaptı ve üretken yapay zeka büyük modellerinin otonom sürüş teknolojisine uygulanmasına ilişkin son düşüncelerini paylaştı. ve Tsinghua AIR'in Real2Sim2Real temel model platformunu ve otonom sürüş simülasyon platformunu oluşturmadaki en son başarılarını tanıttı.

Akademisyen Zhang Yaqin'in konuşmasının tam metni aşağıdadır:

Böyle güzel bir hava, böyle güzel bir yer, HAOMO AI DAY'e katıldığım için çok mutluyum ve ayrıca davet için Başkan Zhang Kai ve Weihao'ya teşekkür ediyorum.

Bugün dokuzuncu HAOMO AI GÜNÜ, her şeyden önce, Momo'yu 4 yıldan kısa bir sürede elde ettiği büyük başarılardan, özellikle de kendi yolunu çizdiğinden dolayı tebrik etmek istiyorum. Momo'nun otonom sürüşte üretken büyük model DriveGPT'yi ilk piyasaya süren kişi olduğu izlenimine sahibim ve hızla ölçeğe doğru ilerledi ve bu kadar kısa sürede otonom sürüş alanında lider olmayı başardı.

Bugün akıllı sürüşteki yeni ilerlemeden bahsetmek istiyorum, yıllardır aynı konuyu kullanıyorum, ancak her seferinde içeriğin tamamen farklı olduğunu göreceğim, özellikle son üretken yapay zeka çıktıktan sonra, otonom sürüşün büyük bir tanıtımı oldu.

Yeni "dört modernizasyondan" bahsediyoruz - ağ oluşturma, zeka, paylaşım ve elektrifikasyon, bunlardan en önemlisi iki modernizasyon - elektrifikasyon ve zeka. Elektrifikasyon yeni enerji olarak anlaşılabilir ve şimdi Çin, ister kullanıcı ölçeğinde olsun, ister ihracat ölçeğinde olsun, dünyanın ilk yarısı olan dünyanın en aktif ve en büyük yeni enerji pazarıdır. İkinci yarıdaki en önemli şey akıllı sürüş ve önümüzdeki 5-10 yıl içinde küresel rekabetin sıcak noktası ve hakim zirvesi otonom sürüş. Yapay zeka, otonom sürüşün temel teknoloji itici gücüdür ve başlangıcından bu yana HAOMO AI DAY şirketin teknoloji motoru olmuştur, bu nedenle HAOMO AI DAY çok önemlidir.

Neden bu kadar çok şirket akıllı sürüş yapıyor? Geleneksel otomobil üreticileri, yeni güçler, yüksek teknoloji işletmeleri de dahil olmak üzere otonom sürüş pazarına mı giriyor? Aslında, birçok teknik zorluk var, her şeyden önce, AI perspektifinden, otomatik sürüş oldukça karmaşıktır, çok fazla bilgi işlem gücü gerektirir, yeni algoritmalar, en zorlu AI dikey alan problemidir, ikincisi, otomatik sürüş aynı zamanda şu anda görülen konsantre zeka, uç zeka ve otonom zekanın kesişimidir. Az önce yayınlanan test videosunda, otonom sürüşün pek çok karmaşık senaryo ve değişiklikle karşı karşıya olduğunu ve gerçekten de birçok zorluk olduğunu görebilirsiniz.

Bununla birlikte, otonom sürüşün tamamen ulaşılabilir olduğunu düşünüyorum ve bazıları piyasa faktörleri ve bazıları piyasa dışı güçler olan bazı temel sorunlar var. Pazar faktörleri şunları içerir: Teknoloji uygulanabilir mi? Kullanıcıların gerçek ihtiyaçları var mı? Endüstriyel ekoloji ve iş modeli. Piyasa dışı faktörler de çok önemlidir ve sektördeki teknolojik atılımların yanı sıra devlet endüstrisi desteği ve politika ve düzenlemelerde atılımlar gerektirir.

Teknoloji açısından, başlangıçta birçok kişi sürücüsüz sürüşün mümkün olup olmadığı, özellikle de L4'ün üzerinde mümkün olup olmadığı hakkında konuşuyordu. Başından beri bunun mümkün olduğunu düşündüm. Son zamanlarda sürücüsüzün insanlı sürüşten yaklaşık 10 kat daha güvenli olduğuna dair bazı veriler gördüm ve geçen yıl 3 katından bahsediyordum ve bu yıl 10 katına ulaştı. Bu da teknolojik atılımın tamamlandığını gösteriyor. Ticarileştirme yol haritasında şu anda çeşitli yollar var, bazıları bisiklet zekasını kullanıyor, bazıları yol koordinasyonu ve kademeli, sıçramalı rotalar, açık kaynak, kapalı rotalar var, farklı şirketler farklı yol haritalarını araştırıyor, hangisinin tamamen doğru olduğunu söylemiyorum, endüstri otomatik sürüşü farklı şekillerde deniyor. Momo'nun ilerici olanı seçtiğini biliyorum ve bence her şey yolunda ve insanlar onu farklı şekillerde keşfediyor.

Son zamanlarda yapay zekada birçok yeni atılım oldu. Yeni algoritmaların, yeni çerçevelerin, özellikle eğitim öncesi, çok modlu, çok denetimli öğrenme ve büyük modellerin ana akım haline geldiğini görüyoruz. Transformer'dan önce ResNeT çok yaygın olarak kullanılan bir görüntü algoritması çerçevesiydi ve ResNeT'ten özellikle bahsetmemin nedeni, bu algoritma aslında Çin'deki genç Çinli bilim adamları tarafından yapılıyor, bu yüzden Çinli bilim adamları yapay zekaya büyük katkılar sağladılar. Yapay zekanın çekirdeğinin ağırlıklı olarak Avrupa'dan geldiğine ve temel teorinin oradan geldiğine dair birçok ifade duydum, ancak Çinli bilim adamları da yapay zeka alanında birçok katkı sağladılar.

Büyük modellerin teknik sınırlamaları aşması önemlidir. Son altı ya da yetmiş yılda, üç ana teori ortaya çıktı: Moore Yasası, von Neumann'ın mimarisi, Shannon'un üç yasası ve şimdi üç teori de kırılıyor. Herhangi bir atılım yoksa, yeni bir algılama yöntemi, yeni bir algılama yöntemi, yeni bir çip çerçevesi vb. dahil olmak üzere yeni bilgisayar mimarisinde bir atılım gerektiren büyük modelin elde edilmesi imkansızdır ve şimdi ana akım Transformer ve CNN evrişimli sinir ağları da farklıdır. Şu anda, dijital teknoloji endüstrisi esas olarak silikon gofret tabanlı hesaplamaya dayanmaktadır ve gelecekte biyolojik bilimler, optik hesaplama ve kuantum hesaplama olabilir.

Şu anda, büyük modellerin üretken yapay zekayı getirmesi çok önemlidir ve geçmişte yapay zeka, sınıflandırmadan, yani ayrımcı yapay zekadan bahsetti. Artık sahneler için yeni içerik fikirleri, veri fikirleri ve birçok yeni fikir üretmek mümkün. Şimdi biraz bu alandaki çalışmalarımdan bahsedeyim.

Büyük modeller yeni bir yöne gidiyor. Birincisi, sadece doğal dil, görüntüler, video değil, aynı zamanda tüm araçlardan yayılan sinyalleri, lidar ve diğer fiziksel algı ve biyosensör sinyallerini de algılayan çoklu modalitedir. GPT-4 modelinin çok modlu olduğunu, işlevinin çok güçlü olduğunu görüyorsunuz, ancak verimlilik çok düşük, kabaca insan beyninin hesaplama ve karar verme verimliliğinden en az 1000 kat daha düşük, bu yüzden hala yeni algoritmalara ihtiyaç var, 5 yıl içinde yeni algoritmalar olacağını düşünüyorum. İkincisi, uç bilgi işlem, cep telefonlarının, arabaların, robotların ve somutlaşmış zekanın ve fiziksel dünyanın kenarına çok karmaşık büyük modellerin nasıl yerleştirileceği de dahil olmak üzere görevleri otomatik olarak tamamlayabilen otonom zeka, bence otomatik sürüş en önemli somutlaşmış akıllı sahnedir. Gelecek, beyin-bilgisayar zekası aşamasıdır ve büyük model, biyoloji dünyasının, yaşam dünyasının nasıl kullanılacağı ve insanlarla beyinlerin nasıl daha iyi bağlanacağı ile yüzleşecektir.

Yeni teknoloji mimarileri, tıpkı yeni AI işletim sistemi gibi büyük modeller kullanacak, otonom sürüş veya yaşam bilimleri gibi diğer dikey modeller de dahil olmak üzere birçok dikey model olacak.

Baidu'dan emekli olduktan sonra kurduğum ve 3 yılda hızla gelişen yapay zeka endüstrisi araştırma enstitüsü olan Tsinghua Akıllı Endüstri Araştırma Enstitüsü'nden (AIR) kısaca bahsedeceğim ve ayrıca derin endüstriyel geçmişe ve derin akademik kazanımlara sahip bir grup bilim insanı ve kurumsal CTO bulduğum için şanslıyım. Şimdi yaklaşık 300 doktora sonrası araştırmacı ve öğrenci var ve otonom sürüş yönlerden biri, yaklaşık 100 kişi.

AIR Research hakkında her konuştuğumda, 25 yıl önce Microsoft Research Asia'yı kurmak için Çin'e döndüğüm zamanı düşünüyorum. Önümüzdeki ay, kendisi de oldukça başarılı olan Microsoft Research Asia'nın 25. yıldönümünü kutlayacak. Az önce bahsettiğim büyük model, Çin endüstrisi için bir araştırma enstitüsü kurma umuduyla Microsoft Research'te geliştirildi.

Çeşitli araştırmalarla uğraştığımızda, akıllı sürüş gibi geniş bir çerçeveye sahip olmayı umuyoruz, önce bazı teknik rotalar belirlemeliyiz. Öncelikle çok modlu algının çok önemli olduğunu düşünüyorum ve orijinalden çok ölçekli, çok boyutlu veriler çok önemli. Çünkü insansız sürüş, akıllı sürüş yapmak için robotların avantajı her şeyden önce daha fazla veriye ihtiyaç duymaktır, bu veri avantajı yine de ortadan kalkamaz, bu yüzden Musk'ın sadece kamera kullanın, daha fazla veri kaynağı kullanmamız gerekiyor demesine katılmıyorum. İkincisi, birçok otonom sürüş artık çok sayıda yüksek çözünürlüklü harita kullanacak, ancak geleceğin hafif haritalar olduğuna ve tamamen haritalara bağlı olamayacağına inanıyoruz.

Otonom sürüşün son güvenli ve güvenilir aşamaya ulaşması için uçtan uca ulaşılması gerekiyor, bu da çok zor, üretken yapay zeka, pekiştirmeli öğrenme, büyük dil modeli gibi daha ayrıntılı teknik faktörler var, iki platformumuz var: veri büyük model platformu, simülasyon platformu.

AIR ayrıca kendi temel otonom sürüş modelini önerdi. İlk olarak, model, gerçek dünya verileri ve simülasyon verileri dahil olmak üzere farklı verilerin nasıl elde edileceğini önermektedir. Veriler kontrollü bir boru hattından temizlenir ve daha sonra iki büyük modelden geçer: algı modeli, karar verme modeli, buluttaki bazı önemli yerlerde ve araç ucunda karar verme dahil, bazı modüller bilgi tabanlı, bazıları istatistiksel ve bazıları kural tabanlı modüllerdir.

İçinde özellikle "pekiştirmeli öğrenme" yi çıkardım, çünkü Baidu'dan beri pekiştirmeli öğrenmeyi kullanıyorum, ancak kullanımı zor. Otonom sürüş güvenliği çok önemli olduğu için kullanımı oldukça zor ama bence gerçekten daha yüksek güvenliğe ulaşabilmemizin tek yolu bu, pekiştirmeli öğrenme yeni şeyler öğrenebilir ve artık genelleme yöntemi öğrenmeyi pekiştirmeli öğrenmeye dayanıyor ve son zamanlarda birçok yeni gelişme oldu. Pekiştirmeli öğrenmenin birçok simülasyonda ve karar vermede nasıl kullanılacağı ve gerçek sürüş davranışında nasıl kullanılacağı. Soldaki model dikey büyük veri, modeli ayarlamak için pekiştirmeli öğrenmenin nasıl kullanılacağıdır.

Ayrıca, üretken yapay zeka simülasyon ve karar vermede nasıl kullanılabilir? Burada küçük bir örnek var, hem büyük modellerin hem de derin öğrenmenin şeffaflık sorunları var, biz de bu araştırmayı yaptık, neden bu kararı aldım? Sola, sağa dönün, fren yapın, bana ne gördüğümü ve neden bu kararı verdiğimi söyleyin, bu kararı nasıl vereceğime rehberlik edebilir. Bu, trafik ve yaya bilgileri de dahil olmak üzere anlamsal derinlik sahneleri oluşturmak için gerçek verileri, simülasyon verilerini, dikey modelleri ve büyük modelleri kullanmaktır.

Diğeri ise insan beyni ve makinenin kaynaşması, insanların nasıl araba kullandığını incelemeliyiz. İnsanlar bazen iyi kararlar verirler, bazen vermezler ve bu bilgileri sensörler aracılığıyla toplarlar. Bir yandan, uzun bir süre boyunca insanlar ve makineler birlikte sürmek zorunda ve sürücüsüz insanlar yavaş yavaş insan sürüşünü anlamalıdır. Öte yandan, algoritmanın verimliliğini artırmak için algoritmada model kullanılır.

Son olarak, pekiştirmeli öğrenmenin bilişsel karar verme sürecine nasıl uygulanacağı konusunda Milli ile derin bir teknik işbirliğine sahip olduğumuz için çok heyecanlıyız. Şu anda, pekiştirmeli öğrenmenin, işlev tanımı sorunları, politika belirsizliği dahil olmak üzere çevrimiçi veya çevrimdışı birçok sorunu var, bu yüzden bu tür birçok araştırma yaptık. Geçtiğimiz yıl boyunca, Uluslararası En İyi Konferans'ta birçok makale yayınlandı ve patentler de var ve en önemlisi arabalarda kullanılmaya başlandı ve lojistiği yeni gören araba bu algoritmaları kullanmaya başladı.

Özetlemek gerekirse, akıllı sürüş ve otomatik sürüşün farklı aşamalarına bakarsanız, başlangıçta daha çok lidar ve donanım tarafından yönlendirilir ve daha fazlası yapay kurallara dayanır. 2.0, yazılım ve algoritmalar tarafından yönlendirilir ve bu aşama, makine öğrenimine ve kurallara da dayanan daha fazla sensöre sahiptir. Şimdi 3.0 çağına kadar, büyük modeller tarafından yönlendiriliyor ve bu aşamada, uçtan uca algoritmalar kullanan birçok sensör var ve gerçek dünyada otomatik sürüşü daha büyük ölçüde sağlayabilen pekiştirmeli öğrenme de kullanılacak.

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)