Alibaba, Baidu ve Huawei'ye sektördeki büyük modellerin "işlerini" kapmak için acele etmemelerini öneriyorum!

Orijinal: Yibi Yanyu

Kaynak: Data Ape

Büyük veri endüstrisi inovasyon hizmeti medyası

——Veriye odaklanma·İşi değiştirme

Son aylarda yerli büyük modeller alanında çok belirgin bir gelişme trendi, sektörde herkesin büyük modeller inşa etmek için bir araya gelmesi. Yalnızca çeşitli dikey alanlardaki şirketler çok sayıda büyük endüstri modeli piyasaya sürmekle kalmıyor, aynı zamanda Baidu, Alibaba, Huawei, Tencent ve JD.com gibi önde gelen devler de endüstrinin büyük modellerini temel odak noktası olarak görüyor.

Spesifik olarak bu üreticiler, stratejilerindeki büyük modellerin oranına göre iki kategoriye ayrılabilir:

Baidu, Alibaba, Tencent ve iFlytek genel büyük modellere ve sektördeki büyük modellere eşit derecede önem veriyor.

Bir yandan genel büyük modellere daha fazla önem veriyorlar ve genel büyük modelleri C-end kullanıcılarına açıyorlar. Baidu Wenxinyiyan ve iFlytek'ten iFlytek Spark, genel büyük modellerin uygulanmasını teşvik etmek için mobil uygulamalar bile yaptı.

Öte yandan büyük sanayi modellerine de büyük önem veriyorlar. Genellikle endüstri çözümleri şeklinde dışarıya ihraç edilir. 19 Eylül'de bile Baidu, doğrudan hastanelere, hastalara ve tıbbi cihaz şirketlerine hizmet veren, tıp endüstrisinin büyük bir modelini - Ruhsal Tıp Modeli - doğrudan başlattı.

Diğer kategori ise başından beri büyük ölçekli endüstriyel modellere odaklanan ve doğrudan endüstri uygulamalarına yönelen Huawei ve JD.com tarafından temsil ediliyor.

Huawei'nin Pangu modelinin başından beri sloganı "Şiir yazma, sadece bir şeyler yap." C-end uygulamalara pek sıcak bakmıyordu ve neredeyse tüm stratejik odak noktası sektördü.

JD.com'un Yanxi büyük modeli de buna benziyor.JD Cloud'un "sektörü daha iyi anlayan bir bulut" konseptine bağlı kalan JD.com, büyük modeller alanındaki endüstri uygulamalarına da odaklanıyor. Ayrıca JD Health, sektöre girişte öncü olan Jingyi Qianxun'un büyük bir modelini de piyasaya sürdü.

İster "her iki cepheye de eşit ilgi gösteren" Baidu, Alibaba, Tencent ve iFlytek, ister neredeyse "tek cephede savaşan" Huawei ve JD.com olsun, hepsi sektörün büyük modelini değerlendiriyor. askeri stratejistler için bir savaş alanı olarak.

Yazar bunun sorunlu olduğuna inanıyor. Bu teknoloji devleri genel büyük modellere odaklanmalı, endüstri uygulamalarını çeşitli endüstri alanlarındaki partnerlere bırakmalı, büyük modellerin sadece "altyapısını" oluşturmalı, üst katman uygulamalara dokunmamalı.

Bunu neden söylüyoruz Şimdi gelin artılarını ve eksilerini detaylı bir şekilde analiz edelim.

Devler genel büyük modellerin araştırılmasına ve geliştirilmesine odaklanmalı

Genel büyük modeller, tüm büyük model endüstrisinin temeli gibidir.Temelin sağlam olup olmadığı, binanın ne kadar yüksekte inşa edilebileceğini belirleyecektir. Peki mevcut temel sağlam mı?

Ne yazık ki, büyük modeller başlangıçta zekanın "ortaya çıkmasını" başarmış ve doğal dili anlama, içerik üretme ve mantıksal akıl yürütmede büyük ilerleme kaydetmiş olsa da, yeterince iyi değiller. Özellikle büyük modelleri ticari olarak çeşitli sektörlerde hayata geçirmek istiyorsak mevcut model yetenekleri yeterli değildir.

Burada bahsedilen yetenek yeterince güçlü değil ve spesifik olarak belirli bir büyük modele atıfta bulunmuyor.

Ticari alanda uygulanmak isteniyorsa, GPT-4'ün bile yeteneklerde hala önemli eksiklikleri var. Birkaç örneğe bakalım.

Arama motorları büyük modeller için önemli bir uygulama senaryosudur.Microsoft'un Bing'i, ChatGPT'ye erişimi nedeniyle orijinal anahtar kelime arama yöntemini değiştirerek büyük bir geri dönüş yaptı. Peki Bing'in ChatGPT yardımıyla gerçek performansı nedir?

Biz denedik ve dürüst olmak gerekirse oldukça hayal kırıklığı yarattı.

Aşağıda bir örnek var.Bing'in bugün (26 Eylül) büyük modeller ile ilgili haberleri aramasına izin verin. Verilen dört haber şunlardır. Tıkladıktan sonra 1. ve 3. maddelerin içerikleri aslında bir haber makalesinden geliyor ve bunlar ilk Haber 21 Şubat'ta yayımlandı, ikinci ve dördüncü maddeler de aynı haberin 27 Temmuz'da yayımlanan haberinden.

Yani verilen haber yanlış, bugünün haberini arıyoruz ama sonuç birkaç ay öncesinden memnun. Üstelik büyük modeller alanında önemli olayları da arıyoruz. Verilen dört cevap arasında iki rapor, bir haber analiz yazısı ve bir forum etkinliği var. Açıkçası rapor ve analiz yazıları önemli haber olayları değil, bu açıdan bakıldığında Bing'in sağladığı sonuçlar gereksinimleri tamamen karşılamıyor.

Yazar daha sonra daha fazlasını sordu ve verilen haber içeriğini sıralamak için bir tablo kullanmasını istedi. Sonuç olarak verdiği tabloda haber saati 26 Eylül olarak değişti ve spesifik saate gelindiğinde bunun saçmalık olduğu ortada.

Yazarın bir zamanlar Bing gibi yeni arama motorlarından yüksek beklentileri vardı ve bunları birçok kez denedi. Ancak genel his temelde kullanılamaz. Bu, ChatGPT'nin arama alanındaki gerçek performansıdır ve bir dereceye kadar büyük modellerin ulaşabileceği en yüksek seviyeyi temsil eder.

Baidu da benzer bir işlevi başlattı. Her zamanki web aramasına ek olarak, konuşmalar aracılığıyla da sorgulama yapabilirsiniz. Denemek için sabırsızlanıyorduk.

Bing ile karşılaştırıldığında, Baidu haber olaylarını daha iyi anlıyor. Bing birkaç rapor verirken, Baidu büyük model yayınlarına dayalı sonuçlar veriyor. Bu olayların haber değeri açıkça daha yüksek.

Ancak Baidu'nun sağladığı bu sonuçlar güvenilir mi? Benzer şekilde tablo halinde derlenmesine izin verip haber zamanı ve linkleri veriyoruz. Tüm zamanların 11 Mayıs'a ait olması elbette sorunlu, bizim istediğimiz 11 Mayıs'ın değil, 26 Eylül'ün haberi.

Üstelik tabloda verilen haber linkinde de sorun var, ilgili web sayfasını açınca direkt "404" döndürüyor. Tabii Microsoft'un Bing'inde de bu sorun var, verdiği haber linkleri ya açılmıyor ya da yok.

ChatGPT'ye dönecek olursak, önemli sınırlamalarından biri internete bağlanamaması ve verilerinin gerçek zamanlı olarak güncellenememesidir.GPT-3'ün eğitim veri seti Eylül 2021 itibarıyladır ve GPT'nin eğitim veri seti -4 Ocak 2022 itibariyle. Ay.

Üstelik ChatGPT, karmaşık veri hesaplama ve işlemede sıklıkla hata yapar. İddia edilen metin yükleme ve anlama yetenekleri de ideal değildir.

GPT-4'ün belge anlama yeteneklerini deneyelim. Loongson Zhongke'nin 2023 altı aylık raporunu yükledik ve basit bir SWOT analizi yapmasına izin vermeye çalıştık. Belgeyi yükledikten sonra ChatGPT, belgeyi ayrıştırmak için kod yazmaya başlıyor ve bu çok güçlü görünüyor.

Sonuç neydi?

Sonunda ChatGPT PDF belgesini ayrıştıramadı.Birkaç kez denedik ancak ayrıştırmayı başaramadık.

Bu büyük modellere güvenerek, bunları karmaşık endüstri senaryolarında uygulamak istiyorsanız, etkinin kesinlikle ideal olmayacağını ve bunların zaten piyasadaki en iyi genel büyük modeller olduğunu hayal edin.

Büyük modellerde bir miktar "zekanın ortaya çıktığı" ve yeteneklerinin niteliksel olarak iyileştirildiği doğrudur, ancak şu anda "küçük lotus sadece keskin kenarlarını gösteriyor" sürecinin başlangıç aşamasındadırlar. Büyük modellerin keşfi umut verici bir yön olduğundan, şimdi yapılacak en önemli şey, aileye zamanından önce bakmasına izin vermek yerine, bu potansiyel "çocuğu" hızlandırmak ve yetiştirmektir.

Tarihsel deneyime bakılırsa, her yapay zeka çılgınlığının ardından uzun bir sessizlik dönemi gelecektir.Bunun temel nedeni, insanların beklentilerinin ilk etapta çok yüksek tutulması ve beklentilerinin karşılanmadığını gördüklerinde hayal kırıklığına uğramalarıdır.

Benzer şekilde, eğer şimdi çeşitli sektörlerde büyük modelleri hayata geçirmek için acele edersek, yakında bir sorun dönemi yaşayacağız ve insanlar hızla büyük beklentilerden çılgın şikayetlere dönüşecekler.Bu tür iniş çıkışlar, sektörün sağlıklı gelişmesine yardımcı olmuyor. .

Bu nedenle Alibaba, Huawei, Baidu ve Tencent gibi teknoloji devlerinin temel görevi General Model'in "çocuğu"nu yetiştirmektir. Yetenekler gerçek anlamda geliştirildiği sürece, büyük ölçekli uygulama aslında çok hızlı olacaktır, bu nedenle şu ana kadar beklemeye gerek yok.

Büyük modeller alanında iyi bilinen bir zeka ortaya çıkma eğrisi vardır, yani modelin performansı parametre ölçeği ile doğrusal olarak ilişkili değildir. 20 milyar parametreli bir model, 10 milyar parametreli bir modelin iki katı kadar iyi değildir. parametreler.

Bu zekanın ortaya çıkma eğrisinde bir eşik var, şu anda bu eşik yaklaşık 100 milyar parametre. Bu eşikten önce modelin gösterdiği zeka seviyesi, parametre ölçeği arttıkça önemli ölçüde değişmiyor.20 milyar parametreli bir model, 2 milyar parametreli bir modelle hemen hemen aynı performansı gösteriyor. Ancak parametre ölçeği 100 milyar eşiğini aştığında modelin performansı katlanarak arttı.

Her ne kadar model boyutu her şeyi temsil etmese de, son on yıldaki yapay zeka geliştirme deneyiminden yola çıkarak, "niceliksel şiddet" genellikle temel bir yöndür. Daha büyük modeller, daha derin sinir ağları ve daha fazla veri, daha iyi performansa yol açacaktır.

Mevcut istihbarat ortaya çıkma eğrisine bakılırsa yüz milyarlarca parametre ölçeğinden sonra istihbarat darboğaz dönemine girecek. 500 milyar parametreli bir model ile 100 milyar parametreli bir model arasında "zeka" açısından ciddi bir fark olmayabilir. . Ancak bir sonraki "acil durum eşiğini" takip edeceksek şu anda en iyi yol parametre boyutunu genişletmeye devam etmektir. Belki parametre ölçeği on trilyonlara çıktıktan sonra bir sonraki ortaya çıkma eşiği başlayacak ve büyük modellerin yetenekleri yeni bir seviyeye ulaşacak.

Büyük model akıllı ortaya çıkma tahmini verileri maymun haritalaması

Elbette model skalası genişledikçe maliyet de ciddi oranda artacak, dolayısıyla bu ancak devlerin bir oyunu olabilir. Üstelik sadece model boyutunu genişletmek aşırı uyum sorunlarına da neden olacaktır. Bu nedenle, model ölçeğinin genişletilmesinin aynı zamanda model mimarisinin optimizasyonu ve ayarlanmasıyla da eşleştirilmesi gerekir.Bu, teknik yeteneklerin gerçek anlamda test edildiği yerdir.

Bir adım geriye gitmek gerekirse, günümüzün büyük modellerinin tümü Transformer mimarisini temel alıyor ve bu mimari, beş yıl önce birkaç Google araştırmacısı tarafından bir makalede önerildi. Peki Transformer mimarisi gerçekten en iyisi mi, daha iyi bir model mimarisi var mı? Bu soruların Huawei, Baidu, Alibaba, Tencent gibi teknoloji devleri tarafından yanıtlanması gerekiyor.

Büyük modellerin, parametre ölçeği ve model mimarisine ek olarak "illüzyon" sorunlarını, yorumlanabilirlik sorunlarını ve çok modlu sorunları da çözmesi gerekir. Bu sorunlar henüz tam olarak çözülebilmiş değil ve bu tüm sektörün karşılaştığı ortak bir sorun. Bu sorunları çözmenin anahtarı, endüstrideki büyük modellerden ziyade genel büyük modellerdeki temel teknolojik atılımlarda yatmaktadır.

Elbette bu temel sorunları gerçekten çözebilen kişi piyasa tarafından ödüllendirilecektir.

Aynı anda hakem ve oyuncu olmayın

Teknoloji devlerinin sektörün büyük modellerine dokunmamasının tavsiye edilmesinin nedeni, genel olarak büyük modellerin çözülemeyen sorununun yanı sıra, çok önemli bir neden de ortaklarla çıkar çatışmalarından kaçınmaktır.

Teknoloji devleri için ekolojik bir oyun oynuyorlar ve altyapının faydalarını paylaşıyorlar.

Büyük modeller alanında değer aktarım rotası genel büyük modeller - endüstri büyük modelleri - endüstri müşterileri olmalıdır. Endüstri büyük model aşamasında, Huawei, Baidu ve Alibaba gibi genel büyük model üreticileri ya endüstri büyük modellerini kendileri geliştirebilir ya da üçüncü taraf ortakların kendi genel büyük modellerine dayalı araştırma ve geliştirme yapmasına izin verebilir.

Büyük model endüstri uygulaması değer aktarım mekanizması veri maymun haritalaması

Genel büyük modeller teknik yetenekleri test ederken, endüstri büyük modelleri için teknik eşik çok yüksek değil.Temel unsurları veri ve sektör deneyimidir ve bu iki nokta teknoloji devlerinin eksiklikleridir. Finans, tıbbi bakım, üretim ve perakende gibi çeşitli sektörlerden yüksek kaliteli veri setleri toplamak ve çeşitli sektörlerin iş senaryolarını anlamak kesinlikle tek bir şirketin yapabileceği bir şey değil. ekosistemin tamamından binlerce veriyi kullanır ve bunu iş ortakları yapar.

Elbette Baidu, Huawei ve Tencent gibi genel büyük model üreticileri de her iki değer aktarım yolunu da işgal edebilir. Örneğin, tıp alanında Baidu, yalnızca hastanelere, hastalara ve tıbbi ekipman şirketlerine doğrudan hizmet vermek için kendi büyük ölçekli manevi tıp modelini kullanmakla kalmayıp, aynı zamanda dikey bir tıbbi büyük ölçekli model ortak sisteminin inşasını da teşvik edebilir.

Ancak bu durum iş dünyasında tabu olan "halkla kâr için rekabet etme" sorunuyla karşı karşıya kalacaktır.

Belirli bir büyük ölçekli tıbbi model şirketi A'nın, B şirketinin genel büyük ölçekli modelini temel aldığını, temel tıbbi verilerini B'ye açtığını ve büyük ölçekli bir tıbbi modeli eğittiğini hayal edin. Birkaç ay sonra A, B şirketinin de büyük bir tıbbi model başlattığını ve işlevlerinin kendisininkine benzer olduğunu keşfetti. Bir sektör müşterisi sipariş verdiğinde B Şirketinin de teklif verdiğini keşfetti ve ortağı aniden rakip haline geldi. Durum böyleyse, A Şirketi hâlâ B Şirketi ile işbirliği yapmaya istekli mi?

Bir ekosistemde ortakların ekosistem sahibine olan güveni altın kadar değerlidir. Ancak üst düzey uygulama ortakları, eko-sahibin kendisiyle çıkar çatışması yaşamayacağına veya işini çalmayacağına kesin olarak inandığında, işletmesini eko-sahibi tarafından oluşturulan platforma yerleştirirken kendinden emin hissedecektir.

Bu, bulut bilişim alanında IaaS satıcıları ile SaaS satıcıları arasındaki ilişkiye biraz benzer. Çin'deki birçok SaaS şirketinin Alibaba Cloud, Tencent Cloud, Baidu Cloud ve Huawei Cloud gibi bulut sağlayıcılarından tedirgin olmasının en kritik nedeni çıkar çatışmalarından korkmalarıdır. Şu anda IaaS bulut satıcılarının iş sınırları yeterince net değil, sadece IaaS ve PaaS ürünleri sağlamakla kalmıyor, aynı zamanda SaaS ortakları için en tabu olan birçok SaaS alanına da giriyorlar.

Çin İnternetinin ilk aşamalarında yatırımcıların yeni kurulan şirketlere yönelik meşhur bir iç araştırma sorusu vardı: Tencent aynı ürünü yapsaydı ne yapardınız?

Aynı şekilde, genel büyük model üreticileri bir uygulama ekosistemi oluşturmak istiyorsa, o zaman tıbbi bakım, finans, devlet işleri, üretim ve diğer alanlardaki endüstrinin büyük model üreticileri de "benim gibi bir şey yapar mısın?" diye soracaktır. gelecekte ne yapmalıyım?

Peki ne tür büyük model ekosistem daha makul? Bulut bilişim ekosisteminden öğrenebiliriz: Genel büyük model IaaS'ye, sektör büyük modeli ise SaaS'a eşdeğerdir.

Baidu, Huawei, Alibaba, Tencent, JD.com, ByteDance, iFlytek ve diğer önde gelen genel model üreticileri, genel büyük modellere (IaaS+PaaS) odaklanır ve sektördeki büyük modellere (SaaS) dokunmamaya çalışır.

Endüstride büyük modeller yapmasalar bile, temeldeki genel büyük model üreticilerinin yine de büyük modellerin endüstri uygulama paylarından pay alabileceklerine dikkat edilmelidir. SaaS uygulamalarının IaaS kaynaklarını tüketmesi ve IaaS için ödeme yapması gibi, üst katman endüstri modeli de alt katman genel modelinin yeteneklerini çağıracak ve çağrı sayısına ve kullanıma göre makul bir iş modeli oluşturulabilecektir.

Örneğin, Baidu büyük ölçekli tıbbi modeller yapmıyor ancak Wen Xinyiyan'ı temel alan 10 büyük ölçekli tıbbi model ortağı var ve her ortak 1.000 hastaneye hizmet veriyor. Her hastanenin yılda 1 milyon yuan ödediğini ve Baidu'nun bu 1 milyon yuan'ın %20'sini paylaştığını varsayalım. O zaman her büyük ölçekli tıbbi model şirketi yılda 1 milyar yuan kazanabilir ve Baidu'nun geliri 1 milyar*%20*10=2 milyar yuan olur. Bu şekilde Baidu'nun 10.000 hastaneye hizmet vermek yerine yalnızca 10 ortağa hizmet vermesi gerekiyor.

Benzer şekilde, başarılı bir endüstri büyük model ekosistemi inşa edilebilirse, büyük modellerin endüstriyel uygulaması da temeldeki genel büyük model üreticilerine on milyarlarca gelir getirebilir.

Baidu, Huawei, Tencent ve Alibaba gibi genel büyük model üreticilerinin sektördeki büyük model uygulamalarının getirilerini kaçırma konusunda endişelenmelerine gerek yok. Tıpkı bulut bilişim alanında olduğu gibi, hangi SaaS satıcısının geliri IaaS sağlayan Alibaba Cloud, Tencent Cloud ve Huawei Cloud'un geliriyle eşleşebilir?

Genel büyük modelin temelini atmaya odaklandığınız sürece, bir ev inşa etmek için tuğlaları zahmetli bir şekilde hareket ettirmek zorunda kalmadan "araziyi" satabilirsiniz. Tekrar gayrimenkul alanına dönelim: Vanke ve Evergrande gibi emlak geliştiricileri en kârlı olanlar mı? Arazi satmak elbette daha karlı ve daha kolaydır.

Dikey sektörlerdeki büyük model üreticileri için en ideal durumları, sektördeki büyük modellerin çapraz genel model dağıtımını gerçekleştirmek için SaaS bulutlar arası dağıtım stratejilerinden bilgi edinmek ve işleri bir genel model platformundan diğerine sorunsuz bir şekilde taşımaktır. Bu sayede tek bir platforma bağlı kalmaktan kurtulursunuz. Elbette sektörün büyük modelleri şu anda çok erken bir aşamada ve genel model dağıtımı hakkında konuşmak için henüz çok erken.

Büyük endüstri modellerinin modeller arası dağıtım modu veri maymun eşlemesi

Özetle Baidu, Huawei, Alibaba ve Tencent gibi teknoloji devlerinin endüstri büyük modellerinin uygulanmasından ziyade genel büyük modellerin araştırma ve geliştirmesine odaklanmaları öneriliyor.

Bir yandan genel amaçlı büyük modeller henüz yeterince iyi değil, modelin zeka düzeyinin yetersiz olması, halüsinasyon sorunları, yorumlanabilirliğin zayıf olması, multi-modal füzyon yeteneğinin zayıf olması, model eğitimi ve çıkarım maliyetinin yüksek olması gibi sorunlar hala ön planda. Teknoloji devlerinin bu sorunları çözmesi gerekiyor. Daha düşük seviyeli, daha zorlu bulmacalar. Büyük model sanayi uygulamasının temelleri ancak bu sorunlar çözüldüğünde sağlam olabilir.

Büyük model endüstrilerin uygulama aşamasında tamamlanması tamamen üst düzey dikey saha firmalarına bırakılabilmektedir. Her alanda rekabet eden yüzlerce hatta binlerce büyük ölçekli sanayi modeli firmanın bulunacağı öngörülebilir.Sonuçta onlarca firma hayatta kalacak ve en güçlü olanlar ayakta kalacaktır.Bu hayatta kalan firmalar nitelikli ortaklardır. Temeldeki genel büyük model üreticileri, sektör müşterilerine ortak hizmet verebilmek için ortaklarıyla birlikte bir ekosistem oluşturmalıdır.

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)