Büyük Modellerin Yapacak Kişilere İhtiyacı Var

Orijinal: Wu Xianzhi Wen Yehao

Editör: Wang Pan

Kaynak: Foton Gezegeni

Resim kaynağı: Unbounded AI‌ tarafından oluşturulmuştur

Yerli büyük ölçekli savaş modeli, bir zamanlar birçok şüpheyle örtülmüştü. JD.com ve Tencent'in birbiri ardına yerlerine oturmasıyla bu karmaşık oyun daha da netleşiyor.

Baidu ve Ali, Çin'deki ilk büyük ölçekli model oyuncu grubu olarak, "önden başlarken" erken trafiği kazandı. Tersine, Tencent ve JD.com biraz sonra başlamış olsalar da, sektöre ilişkin anlayışlarını derinleştirmek için büyük ölçekli model yolunu derinlemesine inceleyebiliyorlar.

Bu nedenle, büyük ölçekli modelleri nispeten geç piyasaya süren bazı büyük üreticiler, halkı körü körüne takip etmediler ve genel amaçlı büyük ölçekli modellere yatırım yaptılar. Örneğin, Huawei'nin büyük modeli daha önce pratiklikten bahsetmişti ve JD.com, sektördeki ve tedarik zincirindeki derin birikimi sayesinde daha ileri görüşlü ve daha hedefli bir yol seçmişti.JD Bulut Zirvesi (JDD Konferansı) ile aynı zamanda, endüstri odaklı bir JD Yanxi modeli piyasaya sürüldü.

Genel amaçlı büyük ölçekli modellerin mevcut çağında, JD.com tarafından başlatılan Yanxi büyük ölçekli modeli ve endüstriyel değer yaratma yolu, yalnızca büyük ölçekli bir model iş emri oluşturmak için mükemmel bir girişim değil, aynı zamanda tüm endüstri için yeni düşünce ve yön. Büyük modellerin ticarileştirilmesinin durgun sularında, inişe daha yakın olan endüstriyel büyük modeller, büyük modeller için gelecekteki rekabette muhtemelen başı çekecek ve göz ardı edilemeyecek yeni bir güç haline gelecektir.

Büyük model, ne "hikaye" ne de "oyuncak"

Teknolojik ardıllığın her dalgası genellikle çok fazla tortu taşır.

Çiplerden, robotlara ve ilk yıllardaki yapay zekaya kadar, her dalgada her zaman gizli amaçları olan, teknoloji ve pazarlamayı birbirine karıştıran ve başlangıçta net olan yolu daha da çamurlu hale getiren bazı oyuncular vardır. Aynı durum bu aşamada yerli büyük ölçekli model pistler için de geçerli.

Pistin bir tarafında oyuncular büyük modelin teknik bağlamını anlamaya çalışırken, iniş yönünü bulmaya çalışırken, diğer tarafta teknoloji alanıyla hiç ilgisi olmayan firmalar bile sahayı terk ediyor. Birbiri ardına eğitim Sözde "büyük model" ürünler - Şu anki "her şey büyük bir model olabilir" durumunun iki yıl önce "her şey bir metaverse olabilir" anlamına geldiğini itiraf etmeliyim.

Açıkçası, sözde "büyük model" eşanlamlı hale geldiğinde, gerçek değer yaratmak yerine kendi "hikaye anlatma" çekiciliğine hizmet ettiğinde, o zaman yalnızca metaverse'nin kaderine gidebilme olasılığı yüksektir. Ve bu, teknolojiyi dürüstçe inceleyen oyuncular için de geçerlidir. Ne de olsa, teknolojinin kendisinin doğrudan değer yaratması zordur - büyük modelin sonu, genel büyük modelin kendisini eğitmek değil, teknolojinin değer üretmesine izin vermek ve ardından olgun ticarileştirmeyi gerçekleştirmektir.

Bu nedenle, kovalayan hayranların görünüşte komik olan operasyonları, aslında büyük model pisti için bir uyandırma çağrısı gibi geldi. Ne de olsa AIGC'yi ateşleyen ChatGPT, oyuncuların büyük modele bakışını ince bir şekilde etkileyerek birçok oyuncunun genel büyük modele koşmasına ve ChatGPT'nin çeşitli "varyantlarını" başlatmasına neden oldu.

Nesnel olarak konuşursak, genel amaçlı büyük modelin değeri vardır, ancak rekabet boyutunun giderek daha şiddetli hale geldiği şu anda genel amaçlı büyük ölçekli model sorunsuz değildir:

Bir yandan tek bir sahaya akın eden oyuncular bir yandan da "tekrar tekrar çark yapma" durumuna düşme ihtimalleri çok yüksek.Yerli ve yabancı dolu savaş alanından sıyrılmanın zor olduğu düşünülebilir. teknoloji devleri.

Öte yandan, genel amaçlı büyük bir model, tüketim ve ödeme ayrımının tipik bir ürünüdür ve dikkatli olmazsanız bir "oyuncak" haline gelecektir.

Basit bir örnek vermek gerekirse, geniş bir C-end kullanıcısı soru sorabilir, hatta evren ve gökyüzünü tartışabilir, ancak sıradan kullanıcıların büyük çoğunluğunun aslında üretkenlik talepleri yoktur.Kısa süreli yoğun bir deneyimden sonra, Gelişen teknolojilerin tazeliğini çabuk hissedin.Kayıp, uzun süre kullanma gücü olmayabilir.

Buna dayanarak, mevcut genel amaçlı büyük ölçekli model, bazı içerik endüstrileri ve kuruluşlarında maliyet azaltma ve verimlilik artışı dışında, içerik oluşturma verimliliğini belirli bir dereceye kadar artırabilse bile, henüz olgun ve gelişmiş bir model geliştirmemiştir. tekrarlanabilir iş modeli Genel büyük ölçekli model pisti giderek daha kalabalık hale geldikçe, oyuncuların ticari genişleme açısından birçok zorlukla karşı karşıya kalacağı öngörülebilir.

Son tahlilde, artık "tekillik" geldiğine göre, büyük modeller yalnızca teknolojinin ardıllığında bir kilometre taşı değil, aynı zamanda geleceği şekillendirmek için de önemli bir itici güç. Bu mantığa göre, bu aşamadaki büyük ölçekli model savaş, kesinlikle kısa mesafeli bir yarış değil, sistematik bir projedir. Oyuncular döngüden geçmek ve sona ulaşmak istiyorlarsa, teknik düzeyde tek bir atılım noktasına güvenemezler, aynı zamanda teknik yön, sahne uygulaması ve iş modeli gibi birçok boyutu aynı anda düşünmeleri gerekir. .

Endüstriyel büyük ölçekli modeller, "Yüz Model Savaşında" yeni bir cephe

1997'de "Deep Blue" satranç ustası Garry Kasparov'u mağlup ettiğinde, "AlphaGo" Go çemberine girdi ve ardından görsel sistem AI ve otomatik sürüşe kadar, AI geçmişte birçok heyecan verici evrim turu yaşadı. Uygulama patlamasının eşiğinde duruyor ama dallarla dolu çiçek tomurcukları uzun süredir çiçek açamıyor.

Bunun temel nedeni teknolojinin henüz endüstride derin bir uygulama oluşturmamış olmasıdır.Sonuçta teknolojik ilerlemenin sonu laboratuvarda değil, "gerçek dünyaya" dalmaktır.

Bu mantığı izleyerek, günümüzün genel amaçlı büyük ölçekli model yollarına bakıldığında, gerçek iş senaryolarında kök salmak ve gerçek değer yaratmak için daha gidilecek çok yol var.

Jingdong Group'un CEO'su Xu Ran, JDD konferansında, büyük modelin kendisinin endüstriyel değeri gerçekleştirmek için bir araç olduğunu, bir amaç olmadığını, büyük modellerin gerçek değerinin endüstriyel uygulamalarda gerçekleştirilmesi gerektiğini söyledi.

Yani büyük model amaç değil, uygulama amaçtır.

Mevcut büyük model üreticileri, genellikle model parametrelerini büyük modellerin kalitesi için test standardı olarak görmektedir. Herkesin bildiği gibi, ticari uygulama düzeyinde, büyük parametreler aynı zamanda yüksek maliyetlere karşılık gelir ve ayrıca uzun karşılık gelme süresi ve zayıf eşzamanlılık gibi sorunlar da vardır.

Basit bir örnek, bazı "parametre canavarları" bir soruyu cevaplamak için iki veya üç sente mal oluyor ve 5-10 saniye beklemek zorundalar Cevap ne kadar doğru olursa olsun, büyük ölçekli ticarileştirme elde etmek zordur. Ayrıca mevcut genel amaçlı büyük modelin doğruluk oranı %85 civarında olup, bu sıradan kullanıcılar için yeterli olabilir ancak ciddi iş senaryolarında bu hatanın işletme üzerinde göz ardı edilemeyecek bir etkisi olması muhtemeldir.

Uygulama sorunuyla ilgili olarak, JD.com'un çeşitli iş kollarının teknik liderleri, insanların GPT'den gelen uydurma bir cevaba güleceğini, ancak gerçek başvuru sürecinde uygulandığında herhangi bir sapmanın büyük kayıplara yol açacağını belirtti.

JD Keşif Araştırma Enstitüsü Dekanı ve JD Technology'nin Akıllı Servis ve Ürün Departmanı Başkanı Dr. He Xiaodong, bir keresinde kişisel olarak oldukça temsili bir deneyim yaşadı. "Büyük bir model 143'ün karekökünü verir ve verilen cevap 11,5'tir (aslında yaklaşık olarak 11,96'ya eşittir). Gerçek bir uygulama senaryosunda kullanılırsa bu cevap çok büyük kayıplar getirir."

Teknik alanda, model parametreleri ve doğruluğu önemlidir, ancak iş dünyasında kilit nokta, büyük modelin kendisinin kullanımının kolay ve kararlı olmasıdır. Bu bakımdan, alt bölümlere ayrılmış sanayilerle yakından ilgili olan sanayi modelinin kuşkusuz doğal avantajları vardır.

Ancak büyük ölçekli bir endüstriyel model geliştirmek kolay değil. Hepimizin bildiği gibi, eğitim verileri büyük model öğrenmenin temelidir ve aynı zamanda büyük modellerin genelleme yeteneğini ve uygulama senaryolarını da belirler. Bu nedenle, teknik düzeyde atılımlara ek olarak, büyük endüstriyel modellerin geliştirilmesi için ilk elden senaryolar ve sektörden veriler de aynı derecede önemlidir.

JD.com'u örnek alırsak, endüstri için büyük ölçekli bir model başlatmasının nedeni, büyük ölçüde güçlü endüstriyel genlerinden kaynaklanmaktadır. Sonuçta, büyük yerli üreticiler arasında, tüketici pazarını ve tedarik zincirinin iki ucunu birbirine bağlayan JD.com, aynı sektörle güçlü bir bağa sahiptir ve büyük miktarda yüksek kaliteli veriye sahiptir.

Yanxi büyük modeli eğitildiğinde, dijital istihbarat tedarik zincirinin genel verilerinin %70'inin ve orijinal verilerinin %30'unun entegre edildiği bildirilmektedir. JD.com'un tamamen parametrelere vurgu yapmadığı ve kasıtlı olarak "hikaye" anlatmadığı, ancak "ayarlama" düzeyine odaklandığı ve sektörle yüksek oranda entegre olan büyük bir model oluşturmayı amaçladığı görülmektedir.

Büyük ölçekli endüstriyel model, büyük ölçekli model parkurunun büyük ölçekli ticarileştirilmesi yolunda önemli bir adım haline gelebilir ve yavaş yavaş mantığını anlayan oyuncular yavaş yavaş arabaya biniyor.

Son zamanlarda uzun süredir kendini geri çeken Tencent, kendi büyük ölçekli endüstri modelini çıkardı; genel amaçlı büyük ölçekli modellerin bayrağını yüksek tutan Baidu, ulaşımı kapsayan büyük ölçekli endüstri modellerini de piyasaya sürdü. , enerji ve diğer alanlar. Devler boyutlarını büyütürken, ticarileşmeye yaklaşan büyük ölçekli endüstriyel modellerin "Yüz Model Savaşı"nda yeni bir cephe haline geldiğini görmek zor değil.

Dar bir yolda buluş, "sahneyi" alan kazanır

İster genel amaçlı bir model, ister endüstriyel bir model olsun, yeni bir iş düzeninin inşası "sahnelerden" kaçamaz.

Başka bir deyişle, uygulama için, belirsiz teknik terimler ve göz kamaştırıcı ticari PPT'lerin hepsi havada birer kaledir.Sadece büyük modellerin yeteneğini gerçekten sahneye uygulayarak ve gerçek değer üreterek bir erdemli döngü açılabilir.

Hayatın her kesiminde AIGC'ye olan talebin patladığı şu anda, büyük modeller için sözde uygulama senaryolarını bulmak zor değil. Ancak, büyük modellerin büyük ölçekli inişine uygun bir sahne bulmak ve ticarileştirme yolunda ilerlemek istiyorsanız, birçok dolambaçlı yollardan geçmeniz gerekebilir.

Bu mantığı izleyerek, zaten büyük modeli sunmuş olan oyuncular sürekli olarak çeşitli alt bölümlerde kendi dayanaklarını bulmaya çalışıyorlar:

Baidu, yıllık üniversite giriş sınavının en önemli noktalarını ele geçirdi ve yapay zeka gönüllü asistanlarını piyasaya sürdü. tüketici elektroniği alanında büyük modellerin uygulamalarını keşfedin Genişletme kapasitesi.

Büyük endüstriyel modeller geliştiren JD.com, "büyük modellerin değeri = algoritma × bilgi işlem gücü × veri × endüstriyel kalınlığın karesi” formülünü ortaya koyuyor ve sözde “endüstriyel kalınlık” sadece belirli sahnelerle yığılıyor. .olmak

Yol ne olursa olsun, büyük ölçekli model oyuncular "Vaat Edilmiş Topraklar"a ulaşmadan ve hatta "Kızıldeniz"i geçmeden önce denemeye ve hata yapmaya devam etmek zorundadır.

Büyük modelleri indirmenin zorluğuyla karşı karşıya kalan bazı oyuncular, şirketlerin kendi büyük modellerini oluşturmalarına yardımcı olmak için "su satıcısı" rolünü oynamayı seçer. Bununla birlikte, oyun tarzında her zaman pragmatik olan JD.com, "üç adımlı" bir strateji önerdi, yani önce genel amaçlı büyük bir model oluşturun, ardından senaryoları ve uygulamaları dahili olarak keşfedin ve ardından kademeli olarak açın. kendini bir test alanı olarak kullanırken, aynı zamanda kendi kendini geliştirmektedir.Büyük ölçekli model ürünlerin gerçek değer yaratmasını sağlamak için deneme yanılma maliyetini özetleyin.

JD.com içinde, büyük modelin yalnızca dijital pazarlama, operasyon süreci optimizasyonu ve müşteri hizmetleri gibi ortak uygulama senaryolarına yerleştirilmediği, aynı zamanda perakende, lojistik, finans gibi birçok dikey senaryoya da genişletildiği bildiriliyor. ve sağlık.

Lojistik alanını örnek olarak alan JD.com, bu karmaşık sistem mühendisliği karşısında birden fazla keşif yolu keşfetti: yapay zeka tahmini gibi zengin yerel algoritmalara ek olarak 5 yıldır geliştirilen tedarik zinciri ürünü Jinghui. Açık ekolojik teknoloji sayesinde operasyon optimizasyonu, yalnızca heterojen sistemlerin algoritmaları ve verileriyle iyi iletişim kurmakla kalmaz, aynı zamanda büyük modellerin desteğiyle satış tahmini, envanter, tedarik ve ikmal planlaması açısından daha anlamlı olabilir. AIGC'nin geniş uygulaması sayesinde, etkileşimli tedarik zinciri kontrol kulesi, kullanıcıların tedarik zinciri sorunlarını hızlı bir şekilde bulmasına ve çözmesine yardımcı olabilir.

Fon yönetimi senaryosunda JD Finance'in “akıllı baz seçimi” ürünü devreye alınmıştır. Geleneksel fon taraması, işlemlerin başarı oranını doğrudan etkileyen, anlaşılması maliyetli ve çalıştırılması külfetli bir işlemdir. JD.com, büyük modellerin yardımıyla amaç eşleştirme, algoritma oluşturma, niyet tanıma ve çoklu diyalog turları bağlantılarını optimize ederek yaygın tarama sorularının doğruluk oranını %90'a ulaştırdı ve müşteri deneyimini ve işlem verimliliğini etkili bir şekilde iyileştirdi. Bu ürün gelecekte finans kurumlarına da tam anlamıyla hizmet edecektir.

JD.com'un "üç adım" stratejisinin ilk sonuçlara ulaştığı ve lojistik ve finans gibi dikey sektörlerin dokusuna yavaş yavaş nüfuz ettiği görülmektedir. Strateji kademeli olarak hayata geçirilirken, JD.com'un iniş senaryoları ve yüksek kaliteli veriler toplamaya devam edeceği ve böylece büyük ölçekli endüstriyel modellerin ticari inişine yönelik çarkı çevireceği öngörülebilir.

Son tahlilde, görünüşte karmaşık olan büyük ölçekli savaş modeli, temel bir soruna, yani teknolojinin fiziki endüstriye gerçek değeri nasıl getirebileceğine dönmelidir. Bu aşamada, farklı yollara sahip oyuncular, bu uzun maratondaki soruların cevaplarını ancak kademeli olarak keşfedebilir ve uygulayabilir.

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
  • Pin
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)