Görüntü kaynağı: Sınırsız AI tarafından oluşturuldu
100 modelin savaşı yoğunlaşıyor, ancak birçok uygulayıcının büyük modeller hakkında giderek daha fazla sorusu var.
Temel büyük modeller alanında, Tencent, Alibaba, Baidu ve diğer İnternet devleri akın etti ve Alibaba, Baidu, iFLYTEK ve diğer büyük üreticiler, geçen ay büyük model ürünlerinin en son sürümlerini art arda piyasaya sürdü ve teknik yetenekleri de büyük ölçüde geliştirildi; Startup'lar aynı anda yeni sürümü yineliyor, aynı zamanda "çılgın" finansman, Zhipu AI kısa süre önce bu yıl toplam 2,5 milyar yuan finansman aldığını duyurdu, yaklaşık yarım yıl Baichuan Intelligence 350 milyon ABD doları finansman aldı, bu girişimlerin yatırımcıları arasında Tencent, Alibaba, Meituan ve diğer İnternet devleri de var.
Çin'in gerçekten bu kadar çok temel modele ihtiyacı var mı? Tüm temel büyük model şirketleri, teknik parametreleri "yuvarlama" konusunda deli oluyor, ancak pazarın ne tür bir büyük modele ihtiyacı var? Canlı ve kaotik savaş durumunda, bu sorular giderek daha fazla insan tarafından gündeme getiriliyor.
Bu soruyu cevaplamak için öncelikle temel büyük modelin Çin pazarında nasıl para kazandığını anlamalıyız. İnsanların büyük bir çoğunluğunun büyük bir çoğunluğunun büyük çoğunluğu chatbotlar olsa da, birçok kullanıcı bilgi ararken ve doküman düzenlerken bu ürünleri kullanmaya başlasa da, ilgili şirketlerin bu C-end ürünlerden para kazanması zorlaşıyor ve hatta kullanıcı ölçeği ne kadar büyükse o kadar çok işletme para kaybediyor. **Şu anda, temel büyük modellerin ticarileştirilmesi için en pragmatik yön hala B tarafındadır ve istikrarlı ticari gelir elde etmek için maliyetleri düşürmek ve verimliliği artırmak için perakende, finans, üretim ve diğer alanlardaki işletmelere hizmet vermektedir. **
Temel büyük modeller için yalnızca üç tür ihtiyaç vardır: ** İlgili büyük model özelliklerini elde etmek için doğrudan büyük model API'sini çağırın; Büyük modele dayanarak, ikincil geliştirme gerçek iş doğrultusunda gerçekleştirilir; Büyük modellere dayalı yapay zeka uygulamaları geliştirin. **Bu gereksinimler, temel büyük model platformunun teknik özelliklerini ve ayrıca kurumsal hizmet yeteneklerini test eder.
Hizmet yetenekleri açısından bakıldığında, büyük ölçekli model girişimleri ve İnternet devleri sıfırdan başlamak zorundadır ve hiç kimsenin doğuştan gelen bir avantajı yoktur. Müşteri ihtiyaçları hakkında daha hızlı bilgi edinebilen, istikrarlı ve güvenilir hizmetler sunabilen platformlar öne çıkabilir.
Büyük modeller "üflenmez"
ChatGPT'nin sınır noktası olarak popülaritesi ile yerli büyük modellerin gelişimi iki gün sürdü.
ChatGPT popüler hale gelmeden önce, büyük modellerin teknoloji ve hizmet yetenekleri pazar tarafından geniş çapta kabul görmediği için temel büyük modellerin araştırma ve geliştirmesiyle yalnızca az sayıda yerli şirket uğraşıyordu ve bu şirketler esas olarak teknoloji araştırma ve geliştirmeye ve hizmet yeteneklerinin birikimine odaklanıyor. ChatGPT popüler hale geldiğinde, çok sayıda yatırımcı ve uygulayıcı akın etti ve büyük modeller yeni bir çıkış noktası haline geldi.
Sıcak piyasanın, teknolojiye girmeyen, ancak teknoloji ve hizmet yeteneklerinden bağımsız olarak hikayeler anlatan, kavramları yutturan, önce hikayeyi gökyüzüne anlatan ve bu şekilde sermaye piyasasının ve müşterilerin tanınmasını sağlayan spekülatörlere yol açması kolaydır. Büyük bir model uygulayıcısı şaka bir şekilde Tiger Sniff'e, Çin'deki birçok büyük model şirketinin kendileri ile GPT-4 arasındaki boşluğun sadece birkaç ay olduğunu iddia ettiğini ve bunun nedeninin GPT-2 temelinde açık kaynak kodlu bazı eğitimler yapmış olmaları ve hikayeler anlatmak için ortaya çıkmaları olduğunu söyledi.
Aslında, büyük modellerin teknik yeteneklerinin evrimi birkaç ay boyunca eğitim alarak elde edilemez, çünkü bu karmaşık bir sistemdir ve büyük bir ölçeğe sahip olmak çok önemlidir ve belirli bir ölçek olmadan daha akıllı bir evrim üretmek imkansızdır. Ancak, büyük modellerin eğitim ölçeğini artırmak çok zaman ve tekrarlanan hata ayıklama gerektirir. Büyük modellerin eğitim parametrelerinde hata ayıklayan teknisyenler bu zorluğu anlar: kimse size ne yapacağınızı söylemez, kendi başınıza çözmeniz gerekir ve bu süreçte çözülmesi zaman alan her türlü beklenmedik durum ortaya çıkar.
Çin'de, teknik yeteneklere gerçekten güvenen temel büyük modeller, ChatGPT popüler hale gelmeden önce eğitildi, o zamanlar büyük model herkes tarafından iyi bilinmiyordu ve birçok kişi büyük modeli anlamıyordu ve iyimser değildi ve büyük modele yatırım yapmakta ısrar eden şirketler yeni teknolojiden çok emindi.
Örneğin, 2020'de KLCII, ilk ultra büyük ölçekli önceden eğitilmiş model araştırma projesi olan Wudao'yu başlattı ve 2.0 sürümü dünyanın en büyük trilyon düzeyindeki modeli oldu. Bu yılki yükseltmeden sonra, "Wudao" dil, vizyon ve çok modluluk gibi temel büyük modelleri kapsıyor ve tam açık kaynak aşamasına girdi.
Zhipu AI ayrıca 2020'de bir GLM ön eğitim mimarisi geliştirdi ve ayrıca on milyarlarca parametreye sahip bir GLM-10B modelini eğitti. 27 Ekim'de Zhipu AI, önceki nesle kıyasla performansını, çıkarım yeteneğini ve bağlam kapasitesini büyük ölçüde geliştiren, kendi geliştirdiği üçüncü nesil diyalog modeli ChatGLM3'ü piyasaya sürdü. ChatGLM2 ile karşılaştırıldığında ChatGLM3, Çin'deki 44 Çince ve İngilizce genel veri kümesi arasında ilk sırada yer aldı. Bunlar arasında MMLU %36, C %33, GSM8K %179 ve BBH %126 arttı.
Buna ek olarak, işlevler açısından, Zhipu AI tarafından piyasaya sürülen bir dizi yerel olarak geliştirilmiş büyük model (ChatGLM, CodeGeeX, WebGLM, CogVLM, vb.), aynı zamanda Çin'deki en eksiksiz kıyaslama OpenAI serisi büyük modellerdir ve üretken AI asistanı "Zhipu Qingyan" için geçerlidir.
Büyük modeller yapan bu ilk şirket grubu, konseptler üzerinde spekülasyon yapan ve rüzgarı kovalayan şirketlerden temelde farklıdır. Büyük ölçekli model teknolojisi henüz patlamadığında ve piyasa henüz bu kadar değişken olmadığında, temel büyük ölçekli modelin teknik değerini ve iş mantığını anladıkları için buna dahil oluyorlar. Bu fark, büyük modelin popülaritesinden sonra da çok belirgindir, birçok şirket trafik ve güncellik uğruna C-end ürünlerine dahil olurken, Zhipu AI gibi en eski şirketler daha çok kurumsal hizmetler alanına odaklanmıştır ve tüm Ar-Ge yetenekleri ve hizmet yetenekleri de bu fikir etrafında ortaya konmuştur ve gerçekçi bir şekilde birikmekte ve müşteriler için değer yaratma yönünde gelişmektedir.
**Büyük modelin karmaşıklığı, daha uzun süre teknoloji ve hizmet yetenekleri biriktiren işletmelerin daha güçlü bir avantaja sahip olduğunu belirler. Piyasada giderek daha fazla insan büyük modellerin karmaşıklığının ve büyük modellerin evrimi için gereken sürenin farkına vardığında, kavramları kızartmak için hikaye anlatımına güvenen büyük model şirketlerin hayatta kalmak için daha az yeri olacak ve teknoloji ve hizmet yeteneklerini ciddi şekilde biriktiren şirketler ilk rekabet dalgasının testine dayanabilir.
Müreffeh bir ekolojinin büyük modeli yok, gelecek yok
** Büyük modellerin ticarileştirilmesi sürecinde, toplumun katı ihtiyaçları olan uygulama senaryolarına girebilen, erdemli bir kendi kendine hematopoez döngüsü oluşturan ilk kişi olacaktır. **
Genel büyük model daha geniş bir uygulama yelpazesine sahiptir, ancak dikey alanlardaki belirli sorunları çözecek kadar uzmanlaşmamıştır. Dikey büyük modeller, etki alanına özgü sorunları çözme konusunda daha güçlü bir yeteneğe sahiptir, ancak hizmetlerin kapsamı çok sınırlıdır, bu da birçok dikey büyük modelin maliyet ve iş avantajları arasında bir denge kurmasını zorlaştırır ve geliştirme alanı sınırlıdır.
Büyük modellerin uygulanmasının son noktası, yaşamda ve üretimde kullanılması, iş ve yaşamdaki pratik sorunları çözmesi ve iş verimliliğini ve üretkenliğini artırmasıdır. Mevcut genel modelin ve dikey modelin avantaj ve dezavantajlarına dayanarak, modelin mevcut ticarileştirme sürecinde daha uygun bir fikir, teknoloji ve hizmet yeteneklerinin perakende, finans, üretim ve diğer alanlara açık kaynak haline getirilmesi ve genel model ve ilgili alanlardaki işletmelerin uygulama senaryoları oluşturmak için birlikte çalışmasıdır. **
Veri, bilgi işlem gücü ve senaryolar gibi sınırlamalara tabi olarak, gerçekten açık kaynak üzerinden çalışabilecek çok fazla büyük model yoktur. Aynı zamanda, temel teknoloji üssü olarak, büyük modelin rolü PC ve cep telefonu işletim sistemlerine çok benzer ve "büyük ağacın altında, tek bir inç çim değil" gibi rekabetçi bir model sunacaktır, yani bir veya iki teknik üs endüstride baskın bir konuma sahiptir ve tüm uygulama geliştiricileri bu iki teknik temele dayanarak geliştirmelidir. Kaide modeli gelişen bir ekoloji oluşturamazsa, sürdürülebilir kalkınma yeteneği olmayacaktır.
PC ve cep telefonu işletim sistemlerinin gelişim geçmişine bakılırsa, ilk hamle avantajı çok önemlidir. Windows, PC pazarına hakim olduğunda ve iOS ve Android, cep telefonu alanında iki dünyaya bölündüğünde, diğer işletim sistemlerinin geri dönüş için yer açması zordur.
Aynı eğilim büyük modeller alanında da gözlenmektedir. Büyük modeller, müreffeh bir yapay zeka uygulama ekosisteminin kapılarını açar ve kişisel ve kurumsal veriler, yetenekler veya uygulamalar hızla yapay zeka eklentileri haline gelebilir, bu da büyük modellerin yeteneklerini geliştirir ve büyük modelleri daha pratik ve kullanımı kolay hale getirir.
Şu anda, Baidu, iFLYTEK ve diğer dev şirketler ekolojik inşaata kendini adamıştır, Baidu akıllı bulut Qianfan büyük model platformu 2.0 aylık aktif işletmeler, finans, eğitim, üretim, enerji, devlet işleri, ulaşım ve diğer sektörlerde 400'den fazla senaryoyu kapsayan, iFLYTEK'in Spark büyük model platform geliştirici ölçeği 700.000'i aştı.
Büyük modeller alanında uzun süredir biriken bazı girişimler de ilk yengeç yiyenlerdir. Şu anda Zhipu AI, medya, SaaS, eğitim ve ofis gibi birden çok senaryoyu kapsayan bir ekosistem oluşturmak için 1.000'den fazla müşteriye ve 100'den fazla iş ortağına sahiptir. Örneğin, WPS'nin sunum içeriği için akıllı belge oluşturma ve basın bültenleri yazma yeteneklerinin arkasında, destek olarak Zhipu AI'nın teknik yeteneği vardır.
Çeşitli büyük ölçekli model platformların ekolojik rekabetinde, platformun en önemli testi, ortaklara getirdiği değer ve ortaklarla birlikte büyüyebilme yeteneğidir. Ofis senaryosu söz konusu olduğunda, sunumların içerik üretimi, makale içeriğinin yazılması ve stilin yeniden yazılması, büyük model platformunun doğruluk ve akıl yürütme yetenekleri için çok yüksek gereksinimlere sahiptir ve yalnızca belirli bir teknik seviyeye ulaşmış büyük model bu uygulamaları destekleme yeteneğine sahip olabilir ve büyük model platformunun da gerçek uygulamalardaki kullanıcıların geri bildirimlerine göre hataları ve yinelemeleri düzeltmesi gerekir.
**İster dev bir şirket ister start-up bir şirket olsun, sermaye ve kaynak gücü ne kadar güçlü olursa olsun, sıfırdan adım adım biriktirmek ve yinelemek gerekir. Bu nedenle, büyük model platformlar için bir ekosistem oluşturma sürecinde, zaman avantajı çok önemlidir. Bu aynı zamanda ilk hamle avantajlarına sahip start-up'ların ve daha güçlü finansal kaynaklara sahip İnternet devlerinin eşit düzeyde rekabet edebilmesinin nedenidir.
**100 model savaşı, Çin pazarı için kim daha uygun? **
100 modelli savaşın muharebe durumu her ne kadar canlı ve kaotik olsa da arkasındaki rekabetin yönü çok açık ve teknik ve hizmet kabiliyetleri ile büyük model platformun ekosistem inşa etme kabiliyeti rekabetin yönünü doğrudan belirliyor.
Bu yeteneklerin inşası birikmesi zaman alır ve bunları bir gecede elde etmek zordur, ancak bunları zamanla biriktirmek yeterli değildir. İlk hamle avantajı, erken eylemin getirdiği zaman farkına ek olarak, pazar talebini doğru bir şekilde algılama, yani doğru bir strateji boyunca sağlam ve hızlı hareket etme yeteneğine de sahiptir, stratejik salınım ve dolambaçlı yollar, erken eylemin biriktirdiği tüm zaman avantajlarını kolayca tüketebilir.
Giderek daha fazla sayıda büyük model platform odaklarını ekolojik yapıya kaydırdığında, ekolojik rekabette platformun stratejik olarak belirlenmesi ve yürütülmesi giderek daha önemli hale gelecektir. **Birkaç platform, süper platformlara niteliksel değişimi tamamladığında, rekabet ortamı temel olarak belirlenir.
Büyük ve karmaşık iç pazarda, B-end hizmet şirketleri stratejik dalgalanmalara ve sapmalara eğilimlidir. Bir yandan, işletmelerin iç pazardaki bölgeleri ve iş ölçekleri farklıdır ve büyük modellerin kurumsal zeka için değerinin algılanması oldukça farklıdır ve yatırım yapmak istedikleri kaynaklar ve maliyetler de farklıdır, bu nedenle standart bir çözüm bulmak zordur; Öte yandan, farklı alanlardaki işletmelerin büyük model yetenekleri için farklı ihtiyaçları vardır ve hatta aynı alandaki farklı işletmelerin büyük modeller için farklı ihtiyaçları vardır.
Böyle bir ortamda, OpenAI'nin ticarileştirme planıyla karşılaştırıldığında, yerli büyük ölçekli model platformların ticarileştirilmesi ayrıntılara daha fazla dikkat edilmesini gerektiriyor. Bazı platformların ticarileştirme fikirlerinde böyle bir eğilim görüyoruz.
Örneğin, ortak açık platform API hizmetlerine ek olarak, Zhipu AI ayrıca iki çözüm sunar: bulut özelleştirme ve yerel özelleştirme. **Bulut özelleştirmesi, işletmelerin daha güçlü güvenlikle özel verilere dayalı kendi büyük modellerini oluşturmalarına yardımcı olabilirken, yerel özelleştirme Çin pazarında benzersiz bir çözümdür, daha güçlü bir model sağlamanın yanı sıra, çeşitli senaryoları ve ihtiyaçları karşılamak için eksiksiz bir model matrisi de sağlar. **
Zhipu AI, makale oluşturma, akıllı müşteri hizmetleri ve veri açıklaması gibi farklı müşteri ihtiyaçlarının yanı sıra büyük, orta ve küçük işletmelerin ölçeğine yanıt olarak, müşterilerin kendi ihtiyaçlarına göre özgürce birleştirebilecekleri farklı çözümler sunar. Bu daha ayrıntılı ve esnek hizmet modeli, aynı zamanda Çin pazarına ilişkin uzun vadeli doğru içgörülere dayanmaktadır.
Dış ortamın belirsizliği karşısında, Zhipu AI, büyük model hizmetlerini daha güvenli ve güvenilir hale getirmek için farklı kullanıcı türleri ve farklı çip türleri için farklı seviyelerde sertifikasyon ve test sağlamak üzere yerli donanım üreticileri ve çip üreticileriyle işbirliği yaparak yerli bir çip adaptasyon planı da başlattı. Şu anda ChatGLM serisi, Ascend, Shenwei Supercomputer, Haiguang DCU, Haifeike, Muxi Xiyun, Computing Technology, Tiantian Zhixin, Cambrian, Moore Threads, Baidu Kunlun Core, Lingxi Technology, Great Wall Chaoyun dahil olmak üzere 10'dan fazla yerli donanım ekosistemini destekledi ve aynı anda piyasaya sürülen cep telefonu konuşlandırılabilir son test modeli ChatGLM3-1.5B ve 3B, Xiaomi, vivo, Samsung ve diğer cep telefonlarını ve araç platformlarını destekliyor.
100 model savaşındaki savaş ne kadar şiddetli olursa, görünüşte göze çarpmayan bu detaylar o kadar önemlidir, çünkü bu detaylar dış ortakların tanınma derecesini belirler ve ayrıca farklı senaryolarda büyük modellerin iniş hızını etkiler. Büyük bir modeli basitçe piyasaya sürme eşiği, pazarın hayal ettiği kadar yüksek değildir, ancak yinelemeye ve rekabet engelleri oluşturmaya devam etmek için yüksek kaliteli veri senaryolarına sahip olmak mümkündür ve yüksek kaliteli veri senaryolarının anahtarı dış ortaklarda yatmaktadır - daha fazla iş ortağının seçmeye istekli olduğu platform, bu iş döngüsünde çalışmayı kolaylaştırır.
Bu yarışmada birçok uygulayıcı, kazananın daha güçlü kaynaklara ve finansal yeteneklere sahip dev şirket olması gerektiğine inanıyor, ancak öyle değil. Hem yeni başlayanların hem de devlerin hileleri yürümesi ve ayrıntıların altına inmesi gerekiyor ve kısayol yok. Finansmana gelince, belirleyici savaşın kökü bu değil, çünkü temel rekabet gücüne sahip girişimler para sıkıntısı çekmeyecek - Zhipu AI, büyük ölçekli model girişimlerden en yüksek miktarda finansman almış olsa bile, oyuna girmek isteyen daha fazla yeni yatırımcı var.
Başka bir açıdan düşünürseniz, aslında, sermaye piyasası, Çinli işletmelerin kaide modeli için kimin daha uygun olduğu konusunda ayaklarıyla oy kullanıyor.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Büyük modeller devlerin evcil hayvanı değildir
Makale kaynağı: Tiger Sniff
Yazar: Creek
Temel büyük modeller alanında, Tencent, Alibaba, Baidu ve diğer İnternet devleri akın etti ve Alibaba, Baidu, iFLYTEK ve diğer büyük üreticiler, geçen ay büyük model ürünlerinin en son sürümlerini art arda piyasaya sürdü ve teknik yetenekleri de büyük ölçüde geliştirildi; Startup'lar aynı anda yeni sürümü yineliyor, aynı zamanda "çılgın" finansman, Zhipu AI kısa süre önce bu yıl toplam 2,5 milyar yuan finansman aldığını duyurdu, yaklaşık yarım yıl Baichuan Intelligence 350 milyon ABD doları finansman aldı, bu girişimlerin yatırımcıları arasında Tencent, Alibaba, Meituan ve diğer İnternet devleri de var.
Çin'in gerçekten bu kadar çok temel modele ihtiyacı var mı? Tüm temel büyük model şirketleri, teknik parametreleri "yuvarlama" konusunda deli oluyor, ancak pazarın ne tür bir büyük modele ihtiyacı var? Canlı ve kaotik savaş durumunda, bu sorular giderek daha fazla insan tarafından gündeme getiriliyor.
Bu soruyu cevaplamak için öncelikle temel büyük modelin Çin pazarında nasıl para kazandığını anlamalıyız. İnsanların büyük bir çoğunluğunun büyük bir çoğunluğunun büyük çoğunluğu chatbotlar olsa da, birçok kullanıcı bilgi ararken ve doküman düzenlerken bu ürünleri kullanmaya başlasa da, ilgili şirketlerin bu C-end ürünlerden para kazanması zorlaşıyor ve hatta kullanıcı ölçeği ne kadar büyükse o kadar çok işletme para kaybediyor. **Şu anda, temel büyük modellerin ticarileştirilmesi için en pragmatik yön hala B tarafındadır ve istikrarlı ticari gelir elde etmek için maliyetleri düşürmek ve verimliliği artırmak için perakende, finans, üretim ve diğer alanlardaki işletmelere hizmet vermektedir. **
Temel büyük modeller için yalnızca üç tür ihtiyaç vardır: ** İlgili büyük model özelliklerini elde etmek için doğrudan büyük model API'sini çağırın; Büyük modele dayanarak, ikincil geliştirme gerçek iş doğrultusunda gerçekleştirilir; Büyük modellere dayalı yapay zeka uygulamaları geliştirin. **Bu gereksinimler, temel büyük model platformunun teknik özelliklerini ve ayrıca kurumsal hizmet yeteneklerini test eder.
Hizmet yetenekleri açısından bakıldığında, büyük ölçekli model girişimleri ve İnternet devleri sıfırdan başlamak zorundadır ve hiç kimsenin doğuştan gelen bir avantajı yoktur. Müşteri ihtiyaçları hakkında daha hızlı bilgi edinebilen, istikrarlı ve güvenilir hizmetler sunabilen platformlar öne çıkabilir.
Büyük modeller "üflenmez"
ChatGPT'nin sınır noktası olarak popülaritesi ile yerli büyük modellerin gelişimi iki gün sürdü.
ChatGPT popüler hale gelmeden önce, büyük modellerin teknoloji ve hizmet yetenekleri pazar tarafından geniş çapta kabul görmediği için temel büyük modellerin araştırma ve geliştirmesiyle yalnızca az sayıda yerli şirket uğraşıyordu ve bu şirketler esas olarak teknoloji araştırma ve geliştirmeye ve hizmet yeteneklerinin birikimine odaklanıyor. ChatGPT popüler hale geldiğinde, çok sayıda yatırımcı ve uygulayıcı akın etti ve büyük modeller yeni bir çıkış noktası haline geldi.
Sıcak piyasanın, teknolojiye girmeyen, ancak teknoloji ve hizmet yeteneklerinden bağımsız olarak hikayeler anlatan, kavramları yutturan, önce hikayeyi gökyüzüne anlatan ve bu şekilde sermaye piyasasının ve müşterilerin tanınmasını sağlayan spekülatörlere yol açması kolaydır. Büyük bir model uygulayıcısı şaka bir şekilde Tiger Sniff'e, Çin'deki birçok büyük model şirketinin kendileri ile GPT-4 arasındaki boşluğun sadece birkaç ay olduğunu iddia ettiğini ve bunun nedeninin GPT-2 temelinde açık kaynak kodlu bazı eğitimler yapmış olmaları ve hikayeler anlatmak için ortaya çıkmaları olduğunu söyledi.
Aslında, büyük modellerin teknik yeteneklerinin evrimi birkaç ay boyunca eğitim alarak elde edilemez, çünkü bu karmaşık bir sistemdir ve büyük bir ölçeğe sahip olmak çok önemlidir ve belirli bir ölçek olmadan daha akıllı bir evrim üretmek imkansızdır. Ancak, büyük modellerin eğitim ölçeğini artırmak çok zaman ve tekrarlanan hata ayıklama gerektirir. Büyük modellerin eğitim parametrelerinde hata ayıklayan teknisyenler bu zorluğu anlar: kimse size ne yapacağınızı söylemez, kendi başınıza çözmeniz gerekir ve bu süreçte çözülmesi zaman alan her türlü beklenmedik durum ortaya çıkar.
Çin'de, teknik yeteneklere gerçekten güvenen temel büyük modeller, ChatGPT popüler hale gelmeden önce eğitildi, o zamanlar büyük model herkes tarafından iyi bilinmiyordu ve birçok kişi büyük modeli anlamıyordu ve iyimser değildi ve büyük modele yatırım yapmakta ısrar eden şirketler yeni teknolojiden çok emindi.
Örneğin, 2020'de KLCII, ilk ultra büyük ölçekli önceden eğitilmiş model araştırma projesi olan Wudao'yu başlattı ve 2.0 sürümü dünyanın en büyük trilyon düzeyindeki modeli oldu. Bu yılki yükseltmeden sonra, "Wudao" dil, vizyon ve çok modluluk gibi temel büyük modelleri kapsıyor ve tam açık kaynak aşamasına girdi.
Zhipu AI ayrıca 2020'de bir GLM ön eğitim mimarisi geliştirdi ve ayrıca on milyarlarca parametreye sahip bir GLM-10B modelini eğitti. 27 Ekim'de Zhipu AI, önceki nesle kıyasla performansını, çıkarım yeteneğini ve bağlam kapasitesini büyük ölçüde geliştiren, kendi geliştirdiği üçüncü nesil diyalog modeli ChatGLM3'ü piyasaya sürdü. ChatGLM2 ile karşılaştırıldığında ChatGLM3, Çin'deki 44 Çince ve İngilizce genel veri kümesi arasında ilk sırada yer aldı. Bunlar arasında MMLU %36, C %33, GSM8K %179 ve BBH %126 arttı.
Buna ek olarak, işlevler açısından, Zhipu AI tarafından piyasaya sürülen bir dizi yerel olarak geliştirilmiş büyük model (ChatGLM, CodeGeeX, WebGLM, CogVLM, vb.), aynı zamanda Çin'deki en eksiksiz kıyaslama OpenAI serisi büyük modellerdir ve üretken AI asistanı "Zhipu Qingyan" için geçerlidir.
**Büyük modelin karmaşıklığı, daha uzun süre teknoloji ve hizmet yetenekleri biriktiren işletmelerin daha güçlü bir avantaja sahip olduğunu belirler. Piyasada giderek daha fazla insan büyük modellerin karmaşıklığının ve büyük modellerin evrimi için gereken sürenin farkına vardığında, kavramları kızartmak için hikaye anlatımına güvenen büyük model şirketlerin hayatta kalmak için daha az yeri olacak ve teknoloji ve hizmet yeteneklerini ciddi şekilde biriktiren şirketler ilk rekabet dalgasının testine dayanabilir.
Müreffeh bir ekolojinin büyük modeli yok, gelecek yok
** Büyük modellerin ticarileştirilmesi sürecinde, toplumun katı ihtiyaçları olan uygulama senaryolarına girebilen, erdemli bir kendi kendine hematopoez döngüsü oluşturan ilk kişi olacaktır. **
Genel büyük model daha geniş bir uygulama yelpazesine sahiptir, ancak dikey alanlardaki belirli sorunları çözecek kadar uzmanlaşmamıştır. Dikey büyük modeller, etki alanına özgü sorunları çözme konusunda daha güçlü bir yeteneğe sahiptir, ancak hizmetlerin kapsamı çok sınırlıdır, bu da birçok dikey büyük modelin maliyet ve iş avantajları arasında bir denge kurmasını zorlaştırır ve geliştirme alanı sınırlıdır.
Büyük modellerin uygulanmasının son noktası, yaşamda ve üretimde kullanılması, iş ve yaşamdaki pratik sorunları çözmesi ve iş verimliliğini ve üretkenliğini artırmasıdır. Mevcut genel modelin ve dikey modelin avantaj ve dezavantajlarına dayanarak, modelin mevcut ticarileştirme sürecinde daha uygun bir fikir, teknoloji ve hizmet yeteneklerinin perakende, finans, üretim ve diğer alanlara açık kaynak haline getirilmesi ve genel model ve ilgili alanlardaki işletmelerin uygulama senaryoları oluşturmak için birlikte çalışmasıdır. **
Veri, bilgi işlem gücü ve senaryolar gibi sınırlamalara tabi olarak, gerçekten açık kaynak üzerinden çalışabilecek çok fazla büyük model yoktur. Aynı zamanda, temel teknoloji üssü olarak, büyük modelin rolü PC ve cep telefonu işletim sistemlerine çok benzer ve "büyük ağacın altında, tek bir inç çim değil" gibi rekabetçi bir model sunacaktır, yani bir veya iki teknik üs endüstride baskın bir konuma sahiptir ve tüm uygulama geliştiricileri bu iki teknik temele dayanarak geliştirmelidir. Kaide modeli gelişen bir ekoloji oluşturamazsa, sürdürülebilir kalkınma yeteneği olmayacaktır.
PC ve cep telefonu işletim sistemlerinin gelişim geçmişine bakılırsa, ilk hamle avantajı çok önemlidir. Windows, PC pazarına hakim olduğunda ve iOS ve Android, cep telefonu alanında iki dünyaya bölündüğünde, diğer işletim sistemlerinin geri dönüş için yer açması zordur.
Aynı eğilim büyük modeller alanında da gözlenmektedir. Büyük modeller, müreffeh bir yapay zeka uygulama ekosisteminin kapılarını açar ve kişisel ve kurumsal veriler, yetenekler veya uygulamalar hızla yapay zeka eklentileri haline gelebilir, bu da büyük modellerin yeteneklerini geliştirir ve büyük modelleri daha pratik ve kullanımı kolay hale getirir.
Şu anda, Baidu, iFLYTEK ve diğer dev şirketler ekolojik inşaata kendini adamıştır, Baidu akıllı bulut Qianfan büyük model platformu 2.0 aylık aktif işletmeler, finans, eğitim, üretim, enerji, devlet işleri, ulaşım ve diğer sektörlerde 400'den fazla senaryoyu kapsayan, iFLYTEK'in Spark büyük model platform geliştirici ölçeği 700.000'i aştı.
Büyük modeller alanında uzun süredir biriken bazı girişimler de ilk yengeç yiyenlerdir. Şu anda Zhipu AI, medya, SaaS, eğitim ve ofis gibi birden çok senaryoyu kapsayan bir ekosistem oluşturmak için 1.000'den fazla müşteriye ve 100'den fazla iş ortağına sahiptir. Örneğin, WPS'nin sunum içeriği için akıllı belge oluşturma ve basın bültenleri yazma yeteneklerinin arkasında, destek olarak Zhipu AI'nın teknik yeteneği vardır.
**İster dev bir şirket ister start-up bir şirket olsun, sermaye ve kaynak gücü ne kadar güçlü olursa olsun, sıfırdan adım adım biriktirmek ve yinelemek gerekir. Bu nedenle, büyük model platformlar için bir ekosistem oluşturma sürecinde, zaman avantajı çok önemlidir. Bu aynı zamanda ilk hamle avantajlarına sahip start-up'ların ve daha güçlü finansal kaynaklara sahip İnternet devlerinin eşit düzeyde rekabet edebilmesinin nedenidir.
**100 model savaşı, Çin pazarı için kim daha uygun? **
100 modelli savaşın muharebe durumu her ne kadar canlı ve kaotik olsa da arkasındaki rekabetin yönü çok açık ve teknik ve hizmet kabiliyetleri ile büyük model platformun ekosistem inşa etme kabiliyeti rekabetin yönünü doğrudan belirliyor.
Bu yeteneklerin inşası birikmesi zaman alır ve bunları bir gecede elde etmek zordur, ancak bunları zamanla biriktirmek yeterli değildir. İlk hamle avantajı, erken eylemin getirdiği zaman farkına ek olarak, pazar talebini doğru bir şekilde algılama, yani doğru bir strateji boyunca sağlam ve hızlı hareket etme yeteneğine de sahiptir, stratejik salınım ve dolambaçlı yollar, erken eylemin biriktirdiği tüm zaman avantajlarını kolayca tüketebilir.
Giderek daha fazla sayıda büyük model platform odaklarını ekolojik yapıya kaydırdığında, ekolojik rekabette platformun stratejik olarak belirlenmesi ve yürütülmesi giderek daha önemli hale gelecektir. **Birkaç platform, süper platformlara niteliksel değişimi tamamladığında, rekabet ortamı temel olarak belirlenir.
Büyük ve karmaşık iç pazarda, B-end hizmet şirketleri stratejik dalgalanmalara ve sapmalara eğilimlidir. Bir yandan, işletmelerin iç pazardaki bölgeleri ve iş ölçekleri farklıdır ve büyük modellerin kurumsal zeka için değerinin algılanması oldukça farklıdır ve yatırım yapmak istedikleri kaynaklar ve maliyetler de farklıdır, bu nedenle standart bir çözüm bulmak zordur; Öte yandan, farklı alanlardaki işletmelerin büyük model yetenekleri için farklı ihtiyaçları vardır ve hatta aynı alandaki farklı işletmelerin büyük modeller için farklı ihtiyaçları vardır.
Böyle bir ortamda, OpenAI'nin ticarileştirme planıyla karşılaştırıldığında, yerli büyük ölçekli model platformların ticarileştirilmesi ayrıntılara daha fazla dikkat edilmesini gerektiriyor. Bazı platformların ticarileştirme fikirlerinde böyle bir eğilim görüyoruz.
Örneğin, ortak açık platform API hizmetlerine ek olarak, Zhipu AI ayrıca iki çözüm sunar: bulut özelleştirme ve yerel özelleştirme. **Bulut özelleştirmesi, işletmelerin daha güçlü güvenlikle özel verilere dayalı kendi büyük modellerini oluşturmalarına yardımcı olabilirken, yerel özelleştirme Çin pazarında benzersiz bir çözümdür, daha güçlü bir model sağlamanın yanı sıra, çeşitli senaryoları ve ihtiyaçları karşılamak için eksiksiz bir model matrisi de sağlar. **
Dış ortamın belirsizliği karşısında, Zhipu AI, büyük model hizmetlerini daha güvenli ve güvenilir hale getirmek için farklı kullanıcı türleri ve farklı çip türleri için farklı seviyelerde sertifikasyon ve test sağlamak üzere yerli donanım üreticileri ve çip üreticileriyle işbirliği yaparak yerli bir çip adaptasyon planı da başlattı. Şu anda ChatGLM serisi, Ascend, Shenwei Supercomputer, Haiguang DCU, Haifeike, Muxi Xiyun, Computing Technology, Tiantian Zhixin, Cambrian, Moore Threads, Baidu Kunlun Core, Lingxi Technology, Great Wall Chaoyun dahil olmak üzere 10'dan fazla yerli donanım ekosistemini destekledi ve aynı anda piyasaya sürülen cep telefonu konuşlandırılabilir son test modeli ChatGLM3-1.5B ve 3B, Xiaomi, vivo, Samsung ve diğer cep telefonlarını ve araç platformlarını destekliyor.
100 model savaşındaki savaş ne kadar şiddetli olursa, görünüşte göze çarpmayan bu detaylar o kadar önemlidir, çünkü bu detaylar dış ortakların tanınma derecesini belirler ve ayrıca farklı senaryolarda büyük modellerin iniş hızını etkiler. Büyük bir modeli basitçe piyasaya sürme eşiği, pazarın hayal ettiği kadar yüksek değildir, ancak yinelemeye ve rekabet engelleri oluşturmaya devam etmek için yüksek kaliteli veri senaryolarına sahip olmak mümkündür ve yüksek kaliteli veri senaryolarının anahtarı dış ortaklarda yatmaktadır - daha fazla iş ortağının seçmeye istekli olduğu platform, bu iş döngüsünde çalışmayı kolaylaştırır.
Bu yarışmada birçok uygulayıcı, kazananın daha güçlü kaynaklara ve finansal yeteneklere sahip dev şirket olması gerektiğine inanıyor, ancak öyle değil. Hem yeni başlayanların hem de devlerin hileleri yürümesi ve ayrıntıların altına inmesi gerekiyor ve kısayol yok. Finansmana gelince, belirleyici savaşın kökü bu değil, çünkü temel rekabet gücüne sahip girişimler para sıkıntısı çekmeyecek - Zhipu AI, büyük ölçekli model girişimlerden en yüksek miktarda finansman almış olsa bile, oyuna girmek isteyen daha fazla yeni yatırımcı var.
Başka bir açıdan düşünürseniz, aslında, sermaye piyasası, Çinli işletmelerin kaide modeli için kimin daha uygun olduğu konusunda ayaklarıyla oy kullanıyor.