Röportaj丨Büyük modellere inanmayın, bu aşamada yenilik hala "etkileşimli"

Görsel kaynağı: Unbounded AI tarafından oluşturuldu

**Kaynak:**AI Teknoloji İncelemesi

Yazar: Huang Nan; Editör: Chen Caixian

"The Wandering Earth"te "asi" olarak nitelendirilen MOSS, Tinder Projesi için özel olarak hazırlanmış bir dijital yaşamdır. Çok zekidir ve insan ahlakını, felsefesini, bilimini, sanatını ve diğer bilgilerini aşma yeteneğine sahiptir.En uygun çözümü bulup "en doğru" kararı en kısa sürede verebilmektedir.Mükemmel bir zekadır.

Günümüzde büyük model, teknolojik değişim için kullanılıyor ve "sanayi" ve "alan"ın sınırlı bir aralıkta uygulanması için neredeyse mutlak bir olasılık sağlıyor.Yeni AI ticarileştirme anlatısında, insanlar aktif veya pasif olarak kaynak rekabeti orta.

İnsanoğlunun aklını sonsuza kadar korumak bir lüks. Tıpkı bir yıkım ve yeniden doğuş tarihi deneyimleyen yosundan önceki insan uygarlığı gibi, bizim de acilen büyük ölçekli model iniş karnavalından teknik rasyonaliteye dönmemiz gerekiyor.

Bu silahlanma yarışında yer alan Terminus'un CTO'su Hua Xiansheng de büyük model ve durumu bozmanın cevabı hakkında kendi sakin düşüncesini verdi. Aşağıda, Hua Xiansheng ile AI Technology Review arasındaki konuşmanın dökümü yer almaktadır. AI Technology Review tarafından şu şekilde alıntılanmıştır:

1. Bakış açısı 1: Büyük modeller istihbaratın ortaya çıkışının sonu değil

Büyük modelin "akıllı ortaya çıkışından" sadece bir yıl sonra, fiziksel dünya ve bilgi üretim yöntemi, daha geniş bir kentsel alana haritalanan ve kaçınılmaz olarak yeni bir yenilik turunu beraberinde getirecek devrim niteliğinde değişikliklere uğradı. Bu bağlamda Hua Xiansheng, yapay zeka teknolojisi incelemelerinden bahsederken açık sözlü bir şekilde şunları söyledi: "Büyük model gerçekten büyük ilerleme kaydetmiş olsa da, büyük model hakkında batıl inançlara kapılmayın, onun da sınırlamaları var."

Hua Xiansheng'in hatırladığına göre, geçen yıl ChatGPT çıktıktan sonra buna çok dikkat etti ve ilk kez denedi. Gerçekten çok büyük bir atılım olduğu inkar edilemez.Bir yandan, yeteneğindeki önemli gelişmeye hayran kaldım, ama açıkçası, hayal ettiğimiz kadar güçlü olmadığını, yeterince iyi olmadığını da gördüm.

"Derin öğrenme ilk doğduğunda, herkes onun tüm sorunları çözebileceğini düşündü. Gerçek dünyada çeşitli sorunların modellerini oluşturmak için yeterince karmaşık bir model ve yeterli veri kullanabilirdi. Ancak gerçek savaşta, aslında derinlere inmesi gerekir. sorun. Günümüzün büyük modeli bu kuralı değiştirmedi, ** yine de sektörün sorunlarını çözmek için ilgili süreci, verileri vb. anlamak için alanın derinliklerine inmek gerekiyor.**" Hua Xiansheng'den bahsetti.

Bugün, Terminus'un süper akıllı kampüsünde, yumuşak robotlar, büyük ölçekli modeller çağında yosun benzeri varlıklar haline geldi. Parkın büyük ekranlarında gizleniyor ve parkla ilgili her şeyi biliyor, ona yol sorabilir, ihtiyacınız olan bilgileri alabilir ve işlemleri gerçekleştirmek için kullanabilirsiniz. İnsanların ve makinelerin bir arada bulunmasının arkasında, insanlar, IoT cihazları ve şehirler arasında yüksek derecede zeka elde etmek için büyük modellerin ve IoT donanımının anlamsal olarak hizalanması yatmaktadır.

Peki, AIoT büyük modelle buluştuğunda ne tür kıvılcımlarla çarpışacak? Hua Xiansheng kendi düşüncesini verdi: AI, AIoT'nin ruhudur ve IoT, "elleri ve ayakları" gibi algısı ve kontrolüdür ve elbette "bedeni" için fiziksel temeli, yani bilgi işlem güç kaynaklarını da içerir. .

LLM'nin (Büyük Dil Modeli) ortaya çıkışı, yapay zeka yeteneklerini daha genel bir hedefe bir adım daha yaklaştırdı: Birincisi, Büyük dil modeli doğrudan AIoT sisteminin etkileşimli arayüzü olarak kullanılabilir. İkincisi, AIoT verileri doğası gereği çok modludur.Çok modlu büyük modellerin, geçmişte "AI + kuralları" aracılığıyla çözülmesi gereken birçok sorunu çözmesi beklenmektedir.

Hua Xiansheng'in gözünde, AIoT büyük modelleri söz konusu olduğunda, iki ana yol var: Birincisi, AIo'nun geçmişte yaptıklarını büyük bir modelle yükseltmek ve çoğu insanın yaptığı gibi tekrar yapmak; Birincisi, AIoT'deki çok modlu heterojen verilerin gerçekten kullanıldığı** ve büyük modele yerleştirildiği, gerçek anlamda büyük ölçekli bir AIoT modeli. Hua Xiansheng, "Ancak, bu tür bir gerçek AIoT modeli yakında ortaya çıkabilir veya uzun zaman alabilir." Dedi.

AIoT endüstrisinde bu aşamada kullanılan büyük model, ona göre hala ilk teknik rotada, yani dil veya dil artı vizyona dayalı "sözde" AIoT büyük modeli.

"Sahte" AIoT büyük modelinin ortaya çıkmasından önce, AIoT cihazları arasındaki bağlantı ve işbirliği tamamen insan uzmanlar tarafından önceden tanımlanmış kurallara dayanıyordu. Bu kurallar sabittir, eksiktir ve kendi kendine gelişmez ve doğrudan anlaşılmayabilir ve takip edilemez. insanlar tarafından. talimat. Ancak büyük bir modelle, son derece çeşitli Bağlamlara (herhangi bir mevsim, zaman, karakter, talimat vb.) göre nesneler arasında otomatik ve dinamik olarak bağlantı ve koordinasyon kuralları oluşturarak uyarlanabilir, çeşitli, derinlemesine, entegre Akıllı sahne deneyimi sağlayabiliriz. insan talimatları ile.

Hua Xiansheng röportajda, "Hangi yol olursa olsun, en tipik küresel AIoT modeli henüz ortaya çıkmadı.**" dedi.

2. Bakış Açısı 2: Stereoskopik algı, hassas kontrol, AIoT büyük modellerin tarih öncesi gücünü açığa çıkarın

Gerçek bir AIoT modelinin sahip olması gereken yetenekler nelerdir? Hua Xiansheng, AIoT ile diğer endüstriler arasında iki büyük fark olduğuna inanıyor. Her şeyden önce, çok fazla heterojen veri vardır. Çok sayıda sensör, hava durumu, sıcaklık, nem, elektrik, yağış gibi çeşitli verileri toplar ve bilgi daha zengindir. İkincisi, IoT cihazları yalnızca algılama cihazları değil, aynı zamanda ayrıca çevreyi tersten kontrol eder. Daha zengin algı boyutları ve daha güçlü eylem gücü, AIoT modelinin sahip olması gereken özelliklerdir.

AIoT alanını güçlendirmek için sahneye geri dönersek, bunu yalnızca birçok sınırlaması olan genel bir modele güvenerek başarmak zordur. Bu nedenle, AIoT büyük modelinin birkaç özelliği karşılaması gerekir:

Birincisi, profesyonellik. Profesyonel olmalı ve alandaki daha profesyonel sorunları çözebilmelidir. Günümüzün büyük modelleri güçlü görünüyor, ancak parkta kullanılmak üzere yeterli alan uzmanlığına sahip değiller.

İkincisi, güvenilirlik. Modelin ilgilendiği sahneyi iyi anlaması gerekiyor, bir yandan yeni bilgiler sunarak yeterince anlaması gerekiyor, ikinci olarak da çıktı sonuçlarını "yanılsama" olmadan oldukça güvenilir kılmak için bazı kısıtlama yöntemlerine ihtiyacı var. " "ciddi saçmalıklardan".

Üçüncüsü, performans ve maliyet arasındaki denge. Eğitim maliyetleri açısından, özellikle büyük bir genel amaçlı model, sıradan bir başlangıç şirketi tarafından karşılanamaz; ikincisi, çıkarım sırasında, kullanıcı veya ziyaret sayısı çok fazlaysa, büyük modelin hizmeti de başarısız olacaktır. Bu nedenle, basitleştirilmiş bir model iyi bir seçimdir. Endişelerimi çözdüğü ve biraz sağduyuya sahip olduğu sürece, her şeyi bilen biri olmasına ihtiyacımız yok.

Dördüncüsü, ** sistem ** üzerinden geçer. Bu büyük model sadece bilgiye sahip olmakla kalmaz, aynı zamanda gerçek zamanlı bilgi elde etmek için parkın sistemiyle derinden bağlantılı olması gerekir ve yetkilendirme öncülünde parkı gerçek zamanlı olarak karşı kontrol edebilir.

Hua Xiansheng, son zamanlarda çok dikkat çeken somutlaştırılmış zeka teknolojisine atıfta bulunurken, röportajda şunları söyledi: Önerdiğimiz AIoT büyük modeli, mevcut büyük model teknolojisinin somutlaşmış halidir. AIoT cihazları, ellerimiz ve ayaklarımız kadar gözümüz ve kulağımızdır. Şu anda etkileşim ve sahne bağlantısına daha fazla odaklanıyoruz ve daha sonra algı ve kontrolü büyük modellerle değiştireceğiz. Özellikle, süper IoT cihazlarımız ve robotlarımızın kendileri, sorunsuz bir şekilde birleştirilmiş sunucu tarafı yetenekleri (IoT ve maketler) ve robot tarafı yetenekleri (algılama, planlama, harekete geçme ve etkileşim) tarafından desteklenen somutlaştırılmış zekanın tezahürleridir, ancak Terminus'un robotu somutlaştırılmış zeka, yalnızca robotun kendisinin doğrudan yeteneği değil, "makine-çevre işbirliğinin" somutlaşmış zekasıdır.

3. Bakış Açısı 3: İnişin zorluğu, AIoT büyük modelinin çok modlu mücadelesi

AIoT büyük modelinin uygulanmasındaki zorluklarla ilgili olarak Hua Xiansheng, zorlukların temel olarak birkaç yönü içerdiğine inanıyor.Yukarıda belirtilen profesyonellik, güvenilirlik, performans ve maliyet arasındaki denge ve sistem bağlantısına ek olarak, uygulama aynı zamanda gerçek -zaman performansı Çok daha yüksek olacaktır, çünkü gerçek çalışan bir AIoT sistemidir; ek olarak, yeteneklerdeki gelişimi yalnızca büyük modelin kendisinin güncellenmesi değil, aynı zamanda veri toplama, bellek yineleme vb. içerir. Genel olarak**, AIoT büyük modellerinin uygulanmasındaki en büyük zorluk multimodal**'de yatmaktadır.

Uzun vadede IoT verilerini AIoT modeline birleşik bir şekilde entegre etmek, belki de metin/resimleri merkeze almak ve diğer IoT verilerini merkezle hizalamak mümkündür. Ancak AIoT verilerinin heterojenliği ve çok yönlülüğü nedeniyle, farklı veri türlerinin entegrasyonu ve etkili kullanımı, veri temsili ve hizalama zorluklarının üstesinden gelmelidir.

Öncelikle veri gösterimi açısından çeşitli sensör verileri nasıl modellenmeli, dizi girişi olarak referans metin mi, matris girişi olarak referans görüntü mü kullanılmalı yoksa yeni bir modelleme formu mu? Bu konuda hem akademi hem de endüstri hala yetersiz.

Ek olarak, veri hizalama açısından, dil modeli dilden öğrenir ve insanların anlayabileceği bir dil oluşturur.Bununla birlikte, AIoT alanında, etiketsiz ve bilgi ek açıklamaları olmayan çok sayıda veri vardır ve bağlamlarının çoğu, açık semantiği yoktur. , Semantiği veri ile eşleştirmek imkansızdır, bu da ürettiği veri ve bilgileri anlaşılmaz hale getirir. AIoT verileri ile doğal dil arasında anlamsal uyum sağlamak için yeniden işlenmesi gerekir. bu verilerin anlamı.

4. Bakış Açısı 4: AGI'ye ulaşmanın tek yolu büyük modeller değildir, "model + sistem" doğru çözümdür

AIoT gibi çeşitli alanlarda AI'nın karşılaştığı zorluklarla karşı karşıya kalındığında, AGI'yi gerçek anlamda nasıl gerçekleştirebiliriz? Hua Xiansheng, şu anda üç olası yol olduğuna inanıyor:

  • İlk yol, büyük modelin sürekli evrimi ve ilerlemesidir, modelin boyutunu sürekli olarak artırır, AGI'ya ulaşmak için süper büyük bir model oluşturmak için veri miktarını ve modaliteyi artırır.
  • İkinci yol ise mevcut bağlantıcılığı yıkmak, insan beyninin veya insan kalbinin çalışma şekline yaklaştırmak için yeni model çerçeveler üzerinde çalışmak ve düşük güç öncülünde güçlü analiz, muhakeme, keşif ve inovasyon yeteneklerine sahip olmaktır. tüketim
  • Üçüncü yol, tarafımızdan önerilen "model + sistem" yöntemidir; çekirdek olarak büyük bir model sistemi olan ilk yoldan farklı olarak, burada bahsedilen sistem daha kapsamlıdır, büyük ve küçükün kaynaşması dahil modeller ve Evrim, modellerin ve kuralların kaynaşmasını, kural ve modellerin karşılıklı dönüşümünü vb. içerir. Sistem ve model füzyonu yöntemiyle, kendini sürekli büyütebilen daha karmaşık bir akıllı vücut inşa edeceğiz.

AIoT alanını örnek alan Hua Xiansheng, büyük dil modelinin kendisinin AIoT'nin bir uzantısı olduğunu ve ** büyük dil modelini güçlü anlama yeteneklerine sahip bir "beyin" olarak kullandığını ve ardından AIoT cihazlarını sistem aracılığıyla birbirine bağladığını söyledi. "gözler", "burun", "kulaklar", "eller" ve "ayaklar" ile eşleştirin, böylece daha güçlü zeka elde etmek için çoklu algılama, analiz, karar verme ve kontrol yeteneklerine sahip olur **. "Model + sistem" giderek daha fazla kullanıldığında ve daha fazla veri biriktiğinde, çok modlu ve heterojen verilerin "büyük birleştirme" AIoT modelini gerçekten gerçekleştirmek mümkündür.

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
  • Pin
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)