"Milli Takım" sona erer ve büyük model yeni bir enlem için "yuvarlanır"

Orijinal kaynak: One DU Finance

Görsel kaynağı: Unbounded AI‌ tarafından oluşturuldu

Büyük modelin rüzgarını yarım yıl estirdikten sonra nihayet yeni bir yöne sahip.

7 Temmuz'da 2023 Dünya Yapay Zeka Konferansı'nda (WAIC 2023), Ulusal Standartlar Komitesi'nin rehberliğinde Ulusal Yapay Zeka Standardizasyon Genel Grubu, ülkemin ilk büyük ölçekli model standardizasyon görev gücünün liderinin, Shanghai Yapay Zeka Laboratuvarı ve Baidu. , Huawei, Ali ve diğer işletmeler müştereken sorumludur. **

Dış dünya, seçilen "milli takım" kadrolarının ilk partisine şaşırmadı.Sonuçta, büyük modellerin geliştirilmesi, son derece güçlü teknik güce sahip oyuncular tarafından yönetilmelidir. Devletin statüsünü ve görevlerini netleştirmesinin ardından, yerli büyük ölçekli model pazarının rüzgar yönü yeni değişikliklere uğramaya başladı.

01 Yarım yıl boyunca Kasırga, sektör "milli takım"ı başlattı

Bu yılın başından beri, büyük model tüm yol boyunca yükseliyor ve hız, önceki herhangi bir teknolojinin geliştirme sürecini aştı. Bu yılın ilk çeyreğinde çeşitli oyuncular büyük modelin girişine akın edip hala "yapsam mı yapmasam mı" konusunu tartışırken, ikinci çeyrek itibariyle her oyuncu "nasıl yapılır" konusuna evrildi. yap".

Ve böyle canlı bir sahne, WAIC 2023'te bir doruk noktasına ulaştı. **Bu konferansa 400'den fazla firma katıldı ve 30'dan fazla büyük ölçekli model öne çıkanlara odaklandı.Fuar alanı 50.000 metrekareye ulaşarak yeni bir rekor kırdı. **

Bu hareketli konferansta birçok kişi önceden randevu almadığı için konferans sitesine giremedi. Sektör içinden kişilerin "yüksek standart" olarak nitelendirdiği konferansta internet ünlüsü Musk, Turing Ödülü devlerinden Yang Likun, Huawei'nin dönüşümlü başkanı Hu Houkun, Hong Kong Çin Üniversitesi'nden profesör Tang Xiaoge ve akademik ve girişimci çevreler Kodamanlar birbiri ardına ortaya çıktı.

Sergi salonunda, büyük ölçekli maket dönemi, üretken yapay zeka ve genel yapay zeka gibi altı ay öncesine kadar yabancı olan bu kelimeler artık sergi salonunun her yerinde görülebilen semboller haline geldi.

Elbette konferansta 30'dan fazla büyük ölçekli modelin oyuncuları dış dünyayı hayal kırıklığına uğratmadı ve büyük ölçekli modellere kendi cevaplarını verdi. Özellikle "milli takım" üyelerinin hareketleri dış dünyanın da ilgisini çekmiştir.

Örneğin, Çin'de All in yapay zekayı duyuran ilk üretici olarak Baidu, konferans alanındaki sergi salonu özellikle çekici. Elbette bu önemli olayda Baidu, doğal olarak daha fazla insanın deneyimleyebileceği "belediye binasının hazinesini" sergileyecek.Wenxin Yige adlı bu ürün, sergi salonuna giren izleyicilerin P resimlerinin özgürlüğünü fark etmesini sağlıyor.

Huawei, "dünyanın en hızlı AI eğitim kümesi" Atlas 900 PoD A2'yi siteye taşıdı. Huawei Başkan Yardımcısı Hu Houkun, Atlas 900'ü kullanarak insanların ImageNet veri seti üzerindeki tipik sinir ağı ResNet-50'nin eğitimini yalnızca 59,8 saniyede tamamlayabildiklerini, bunun da aynı doğrulukta ikinci sıraya göre %15 daha hızlı olduğunu söyledi. . "Bu, sprint alanının en üstündeki çizgiye ulaşmak ve ardından ikinci koşucunun bitiş çizgisine geldiğini görmeden önce bir şişe su içmekle eşdeğerdir." Kuşkusuz, Huawei'nin donanım tarafındaki temel bilgi işlem gücü gösterisi, endüstri profesyonellerini ve İzleyiciler şaşkına döndü Dikkatler, büyük modelin karmaşıklığından donanım tarafındaki rekabete kaydı.

Alibaba Cloud Forum'da, Alibaba Cloud'un "Tongyi Ailesi" bir AI boyama modeli "Tongyi Wanxiang" ekledi. Bu modelin insanlara grafik oluşturmada yardımcı olabileceği ve sanat tasarımı, e-ticaret, oyunlar ve gelecekte kültürel yaratım ve diğer uygulama senaryoları. Alibaba Cloud Intelligence Group'un CTO'su Zhou Jingren olay yerinde bunun Alibaba Cloud'un büyük modelinin çok modlu yeteneği tam olarak kavraması için önemli bir adım olduğunu ve bu yeteneğin gelecekte kademeli olarak endüstri müşterilerine açılacağını söyledi.

"Para, insan, teknoloji ve sahneler" büyük üreticilerin büyük ölçekli modeller yapmada doğuştan gelen avantajlarıdır. Aynı zamanda birçok start-up'ın doldurması zor bir boşluktur. Hatta bazıları doğrudan işaret etmiştir. Çin'in büyük ölçekli modellerinin indiği noktada , yalnızca BAT+Huawei+Tencent olmak üzere beş büyük üretici arasında yer alacak.

Ama devler ne yapacak? Bundan sonra nereye gideceği büyük bir soru.

02 Kavramları ve duyguları terk eden devler iniş sahnesine odaklandı

Bu yılki yapay zeka konferansında, büyük model hak edilmiş bir üst sınıf haline geldi.

Ali Tongyi, Baidu Wenxin, Huawei Pangu ve diğer milli takımlar sert güçlerini gösterdiler.Aynı zamanda Xunfei Xinghuo, Shangtang Rixin ve Netease Fuxi gibi 30'dan fazla dikey büyük ölçekli model ivmesini kaybetmedi. kendi alanlarında.

Ancak olay yerindeki duruma bakılırsa, büyük ve boş, hikaye anlatma ve duygusal konuşma uygulamalarını bırakmış görünüyorlar ve bunun yerine iniş senaryoları ve vakaları hakkında konuşmaya odaklanmaya başladılar. Büyük modellerin ilerlemesinin tek yolu bu ve bir sonraki aşamanın en önemli özelliği olması da çok muhtemel.

Konferansta Huawei Cloud Pangu Büyük Model 3.0'ın resmi olarak piyasaya sürülmesi sektörden birçok kişinin ilgisini çekti. Sektörü daha da etkileyen şey, Huawei'nin yönetici direktörü ve Huawei Cloud'un CEO'su Zhang Ping'an'ın söylediği şeydi: Pangu modeli çok meşgul, bir şeyler yapmakla meşgul ve şiir yazmaya vakti yok. Ve şiir yazmak, tam da son altı ayda büyük modeli piyasaya süren oyuncuların en çok yapmayı sevdikleri şey.

Zhang Ping'an'ın görüşüne göre Huawei, dil modeli düzeyine odaklanmak yerine Pangu modelinin finans, devlet işleri, madencilik, meteoroloji vb. gibi çeşitli sektörlere yardımcı olabileceğini umuyor. Onun açıklamasına göre, Pangu büyük modeli şu an itibariyle meteoroloji, tıbbi araştırma ve geliştirme ve elektrik enerjisi alanlarında uygulandı ve yüz milyarlarca parametreye sahip çok sayıda büyük model sağladı.

Baidu ayrıca sahneyi uygulamaya koydu. Erken bir oyuncu olarak Baidu, Wenxin büyük modelini dört yıl önce piyasaya sürdü, ancak endüstri o zamanlar büyük modele yeterince ilgi göstermedi, bu yüzden çok fazla ses getirmedi. Ancak Baidu için Wenxin büyük modeli, endüstrinin bir adım önünde olan gelişmiş bir düzendir. Bu ileriye dönük ürün de günümüzde çok şey kazanmıştır.

WAIC 2023 sitesinde Baidu Baş Teknoloji Sorumlusu Wang Haifeng, Baidu'nun Wenxin büyük modelinin 3.5 sürümüne yükseltildiğini, önceki sürümle karşılaştırıldığında etkinin %50 iyileştirildiğini, eğitim hızının iki katına çıkarıldığını ve muhakeme hızı 30 kat arttırıldı. Maliyet açısından geçmişe göre %10’a düştü.

"Çin'in büyük ölçekli model ekolojisinin refahını teşvik etmeyi birincil hedef olarak alın ve büyük ölçekli yeni kurulan şirketlere çok yönlü hizmetler sağlayın." Alibaba Cloud CTO'su Zhou Jingren öyle söyledi. Açıkçası, bu, Alibaba Cloud tarafından önerilen MaaS (Hizmet Olarak Model) konseptini devam ettiriyor.

Büyük modeller alanına en son giren Tencent, son 20 gündür sürekli hamleler yapıyor. 19 Haziran'da Tencent, büyük modeller hakkındaki düşüncelerini ilk kez kamuya açıkladı; 26 Haziran'da kendi geliştirdiği Xingmai yüksek performanslı bilgi işlem ağını ilk kez açıkladı; 7 Temmuz'da WAIC 2023'te Tencent'in başkan yardımcısı Cloud ve Tencent Cloud Intelligence'dan sorumlu kişi Wu Yunsheng, Tencent'in büyük modellerin uygulanmasındaki yenilikçi başarılarını açıkladı ve Tencent Cloud'un sektördeki büyük model yeteneklerinin finansal risk kontrolü, etkileşimli çeviri ve dijital akıllı müşteri gibi senaryolara uygulandığını söyledi. akıllı uygulamaların verimliliğini artıran hizmet.

Elbette, alt bölümlere ayrılmış alanlardaki büyük modeller de güçlü canlılık gösterir. Megvii Technology'nin kurucu ortağı ve CTO'su Tang Wenbin, medyaya verdiği bir röportajda şunları söyledi: "Uygulama uygulaması, büyük modellerin değerini ölçmek için tek kriterdir. Megvii Technology, görsel büyük modellerden genel çok modlu büyük modellere geçecek ."

**Senaryoların uygulanmasına odaklanın ve kurumsal kullanıcılara, mevcut büyük ölçekli model oyuncularının odak noktası haline gelen, maliyeti azaltan ve verimliliği artıran çözümleri etkin bir şekilde sağlayın. **Gelecekte, büyük ölçekli modeller şimdiden "yap ya da yapma"dan "nasıl yapılacağına" geçti. Ve bu, megamodel savaşlarında bir sonraki adım.

03 Gelecek için savaşa katılın, önce bu dört soruyu yanıtlayın

Büyük modeller çok popüler olsa da, başlangıçtan pazara daha gidilecek çok yol var. Bu süreçte birçok zorluk ortaya çıktı.

Ancak, 1DU Finance and Economics'in görüşüne göre, en büyük model için gelecekteki rekabet muhtemelen dört enlemde başlayacak. Yani: teknoloji, yetenek, sermaye ve ticarileşme. **

**İlk önce teknik seviyeye bakın. ** Yapay zekanın şu anda en ileri teknolojilerden biri olduğuna şüphe yok.Teknik düzeyde ihtiyaç duyduğu birikimi kısa sürede telafi etmesi mümkün değil. "Büyük" bilgi işlem gücü, "büyük" veri ve "büyük" modeller şu anda büyük modellerin temel özellikleridir ve bunlar aynı zamanda büyük modellerin sanayileşmesi için de zorluklardır. Şu anda, veri ölçeği büyük olmasına rağmen, veri kalitesi eşit değil. İkincisi, modelin boyutu büyüktür ve eğitim zorluğu daha yüksektir Üçüncüsü, hesaplama gücü ölçeğinin büyük olması ve donanım performansı gereksinimlerinin daha yüksek olmasıdır.

Bu aynı zamanda **'nın onu desteklemek için yeterli kaynağa sahip olmadığı anlamına gelir, bu nedenle bu kadar süper güçlü bir ekip oluşturmak zordur. **1DU Finance and Economics ile iletişimde bahsedilen bir pazarlama bulutu kurucusu: "Mart ayında endüstrinin büyük ölçekli modeline yatırım yapıldığından beri, toplam sermaye yatırımı çok büyük oldu, hatta şirketin büyük ölçekli kuruluşunun toplamını bile aştı. Ancak, yapılırsa şirketin önümüzdeki on yıldaki gelişimi için kesinlikle bir güvence olacağını da belirtti.

Bundan önce, sektördeki birçok kişi "büyük modellerin büyük üreticilerin para yakmak için bir oyun olduğunu" öne sürdü. Bu ifade sebepsiz değildir.

Büyük modeller çok popüler olmasına rağmen, sermaye küresel ölçekte teknolojik toparlanmanın hızına ayak uyduramadı. Araştırma şirketi PitchBook'a göre, küresel risk sermayesi fonlaması bu yılın ilk altı ayında neredeyse yarı yarıya düşerek %48 düşerek 173,9 milyar $'a gerilerken, anlaşma sayısı da %19 düştü.

Çin'de bu yılın haziran sonu itibarıyla bir düzineden fazla büyük ölçekli model start-up şirketi finansman sağladı.Finansman miktarını açıklayan şirketler arasında en büyük finansman ölçeğine MiniMax sahip.Bu yılın haziran ayında , Tencent'ten Seri A'da 250 milyon ABD Dolarından fazla finansman aldı; Yıllar önce, Meituan tarafından satın alınmadan önce, ayrıca 230 milyon ABD Doları tutarında bir melek+ finansman turu aldı.

Büyük üreticilerin yatırımlarına bakalım.Önceden Titanium Media'nın istatistikleri sorunu açıklayabilir.2022'de Huawei'nin Ar-Ge harcamalarına yaptığı yatırım 161.5 milyar yuan olacak ve Çin'in en büyük Ar-Ge yatırımı yapan şirketi olacak ve onu Tencent takip edecek. düşük değil ancak 61.4 milyar yuan seviyesinde kaldı Ali 55.5 milyar yuan Ar-Ge harcaması ile üçüncü sırada yer aldı. Kamuoyuna verilen bilgilere göre, yapay zekanın ilk oyuncularından biri olan Baidu, son on yılda yapay zeka alanına 100 milyar yuan'dan fazla yatırım yaptı. Bu tür yatırım standartları, açıkçası sıradan işletmelerle karşılaştırılamaz.

Teknoloji ve sermaye ile, büyük fabrikalar yetenekler için nispeten daha çekici. Bu yılın başında her şirket çılgın bir yetenek yarışması başlattı. Baidu, AI büyük ölçekli model algoritma mühendislerini aylık 25-40K maaşla işe alıyor ve daha cömert olan Ali, aylık 40-70K maaşla büyük ölçekli model eğitimi ve algoritma mühendislerini işe alıyor.

Bir işe alım platformunda "büyük model" anahtar kelimesini arattığınızda, bazı şirketlerin 2023 mezunlarına aylık 15-25 bin maaş vermeye istekli olduğunu göreceksiniz. Aynı zamanda, bazı dikey yol şirketleri de bu yarışma turuna katıldı. Örneğin, bir ticaret şirketi, maaş aralığı 25-50K olan bir tıbbi büyük ölçekli model ürün yöneticisini işe aldı ve bir oyun şirketi, büyük ölçekli bir dil modeli için bir algoritma mühendisi işe aldı ve ayrıca 50K'ya kadar bir maaş verdi. China Telecom'un işe aldığı büyük bir model platform ürün müdürünün yıllık maaşı bile 840.000'e ulaşabiliyor.

Gelgitle birlikte yükselen yetenekler, teknoloji ve sermaye, büyük modellerin oyuncularını bir an önce karaya çıkarmaya ve ticarileştirmeye teşvik ediyor.Ne de olsa iş kanunlarına göre, sonunda bu girdilerin iade edilmesi gerekiyor. değerli olmak için.

Ancak, büyük modellerin iniş maliyeti de büyük oyuncuların aşması gereken bir engeldir. Sektördeki bazı kişiler bir zamanlar büyük bir modeli eğitmenin maliyetinin son derece yüksek olduğunu, 2-120 milyon ABD dolarına ulaştığını tahmin etmişti. Bu aynı zamanda AI büyük modellerinin ticarileştirilmesinin maliyet muhasebesine geri dönmesi gerekebileceği anlamına gelir.

Çözüm

Büyük modele şu andan itibaren bakıldığında, genel durum 1998'deki İnternet'e çok benziyor. Henüz emekleme aşamasındaydı, birçok balonu ve harika fırsatları vardı. Bu durumda, gerçek güce sahip iyi bir şirket gelecekte daha iyi büyüyecek ve daha büyük bir değere sahip olacaktır. **

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
  • Pin
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)