Baichuan VS Zhipu, Çin'in OpenAI'si kimdir?

Question

*Makale kaynağı: Işık Konisi Zekası**Metin: Hao Xin**Editör: Liu Yuqi*Haziran ayı başlarında, yabancı medya "Çin'in OpenAI'si kimdir" diye bir işkence yayınladı ve büyük model girişimcilik dalgasını deneyimledikten sonra büyük dalgalar kuma koştu ve sonunda sadece birkaç kişi kaldı.Tsinghua Üniversitesi'nin dışındaki birkaç kavşak noktasındaki Xaar Binası, yıldız girişimci Wang Xiaochuan'ın Baichuan Zekasıdır ve Sohu Ağ Binası, akademi tarafından gönderilen bilgelik spektrumu AI'dır. Piyasanın testinden geçtikten sonra, en umut verici iki aday oldular.İki bina için savaş sessizce başlamış gibi görünüyor.** Finansman açısından bakıldığında, Zhipu AI ve Baichuan Intelligent bu yıl çok sayıda büyük ölçekli finansman turunu tamamladı. **![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-7e2e2823fa-dd1a6f-69ad2a) (Işık Konisi Akıllı Haritalama: Kamuya açık bilgilere göre düzenlenmiştir)Bu yıl, Zhipu AI'nın kümülatif toplam finansman tutarı 2,5 milyar yuan'ı aştı ve Baichuan Smart'ın toplam finansman tutarı 350 milyon ABD dolarına (yaklaşık 2,3 milyar yuan) ulaştı. Kamuya açık bilgilere göre, **Zhipu AI'nın en son değerlemesi, 10 milyar yuan'dan fazla değerleme ile en hızlı yerli şirketlerden biri olan en yüksek veya 15 milyar yuan'ı aştı; ** En son finansman turundan sonra, Baichuan Intelligent 1 milyar ABD dolarından (yaklaşık 6,6 milyar yuan) fazla değere sahip oldu.Takım kompozisyonu açısından bakıldığında, Zhipu AI ve Baichuan Intelligent Master aynı evden çıkıyor ve Zhipu AI başkanı Wang Shaolan ve Sogou'nun kurucusu Wang Xiaochuan, Tsinghua Departmanının girişimci ekipleri.**Teknolojik yetişme hızı açısından bakıldığında, ikisi de birbirinden ayırt edilemez. **Zhipu AI'nın GLM-130B'si çıkar çıkmaz GPT-3'ü yendi ve yeni piyasaya sürülen Baichuan 2, tüm boyutlarıyla Llama 2'nin önünde yer alarak Çin'in açık kaynak ekosisteminin gelişimine öncülük ediyor.Tüm göstergeler, Zhipu AI ve Baichuan Intelligence'ın Çin'in büyük model pistinin "karanlık atları" haline geldiğini gösteriyor ve şiddetli rekabet altında, geyik kim öldü?  ## **OpenAI'ye İnananlar: Bilgelik Yapay Zekası**  Zhipu AI ve OpenAI arasındaki ilişki, Zhipu AI CEO'su Zhang Peng tarafından kalbinde gerçek "AI büyük dil modelinin ilk yılı" olarak kabul edilen 2020 yılına kadar izlenebilir.Zhipu AI ve OpenAI arasındaki ilişki, Zhipu AI CEO'su Zhang Peng tarafından kalbinde gerçek "AI büyük dil modelinin ilk yılı" olarak kabul edilen 2020 yılına kadar izlenebilir.Zhipu AI'nın yıldönümünde, neşeli atmosferde, zaman zaman GPT-3'ün doğuşunun getirdiği bazı endişelerin kokusunu alabilirsiniz. 175 milyar parametreye ulaşan GPT-3, tam anlamıyla ilk büyük dil modelidir.O zamanlar, Zhang Peng sadece GPT-3'ün ortaya çıkma yeteneği karşısında şok olmakla kalmadı, aynı zamanda o zaman mı yoksa şimdi mi "takip edip etmeme" düşüncesine de düştü, hepsi ultra büyük ölçekli parametre büyük model yönünde son derece riskli bir şey. Tartıldıktan sonra Zhipu AI, OpenAI'yi ölçüt olarak almaya ve ultra büyük ölçekli ön eğitim modellerinin geliştirilmesine yatırım yapmaya karar verdi.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-e41f17dbae-dd1a6f-69ad2a) (Işık Konisi Akıllı Haritalama: Kamuya açık bilgilere göre düzenlenmiştir)**Teknoloji yolu seçimi açısından Zhipu AI, OpenAI ile aynı bağımsız düşünceye sahiptir. **O zamanlar, BERT, GPT ve T5 gibi birkaç büyük model ön eğitim çerçevesi vardı. Üç yolun eğitim hedefi, model yapısı, eğitim veri kaynağı ve model boyutu açısından kendi avantajları ve dezavantajları vardır.Büyük model eğitim süreci bir İngilizce sınavıyla karşılaştırılırsa, BERT, kelimeler ve cümleler arasındaki ilişki yoluyla sorular sormakta ve sınava anlama yoluyla girmekte iyidir ve inceleme materyalleri çoğunlukla ders kitaplarından ve Wikipedia'dan gelir; GPT, soruları yapmak için bir sonraki kelimeyi tahmin etmede, çok sayıda yazma pratiği yoluyla sınava hazırlanmada iyidir ve inceleme materyalleri çoğunlukla çeşitli web sayfalarından gelir; T5, soruları resmileştirme, önce soruları Çince'ye çevirme ve ardından soruları çözme ve gözden geçirirken sadece ders kitabını okumakla kalmayıp aynı zamanda çok sayıda soru bankasını fırçalama stratejisini benimser.Hepimizin bildiği gibi, Google BERT'yi seçti, OpenAI GPT'yi seçti ve Zhipu AI körü körüne takip etmedi, ** bu iki rotaya dayanarak önerilen GLM (Genel Dil Modeli) algoritma çerçevesi. Çerçeve aslında BERT ve GPT'nin "devam ederken ve boşlukları doldururken anlaşılabilen" tamamlayıcı avantaj ve dezavantajlarını gerçekleştirir. **Böylece GLM, Zhipu AI'nın OpenAI'yi takip etmesi için en büyük güven haline geldi ve bu çerçevede GLM-130B, ChatGLM-6B ve ChatGLM2-6B gibi GLM serisi modeller art arda büyütüldü. Deneysel veriler, GLM serisi büyük modellerin dil anlama doğruluğu, çıkarım hızı, bellek oranı ve büyük model uyarlama uygulaması açısından GPT'den üstün olduğunu göstermektedir.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-dc70c8e5d7-dd1a6f-69ad2a) (Kaynak: İnternet)OpenAI şu anda yurtdışında temel model hizmetleri sağlayabilen en eksiksiz kurumdur ve ticarileştirilmesi temel olarak iki kategoriye ayrılmaktadır, biri API toplama ücretleri, diğeri ise ChatGPT abonelik ücretleridir. Ticarileştirme açısından, Zhipu AI da genel fikri takip eder ve yerli büyük modellerin nispeten olgun ticarileştirilmesine sahip işletmelerin kademesinde yer alır.Optik koni akıllı taramaya göre, Çinli işletmelerin inişiyle birleştiğinde, **Zhipu AI'nın iş modeli, API toplama ücreti ve özelleştirme ücreti moduna ayrılmıştır. **Sağlanan genel model türleri, büyük dil modelleri, süper antropomorfik büyük modeller, vektör büyük modeller ve büyük kod modelleridir ve standart fiyatlandırma, bulut özel fiyatlandırma ve yerel özel fiyatlandırma dahil olmak üzere her büyük model seçeneğinin altındadır. OpenAI ile karşılaştırıldığında, Zhapu AI, ses ve görüntü büyük model hizmetlerinin sağlanmasından yoksundur, ancak Çin'in dijital insan, akıllı NPC ve diğer endüstrilerinin ihtiyaçlarını da karşılayan süper antropomorfik büyük modeller ekler.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-d5dc94c153-dd1a6f-69ad2a) (Işık Konisi Akıllı Haritalama: Kamuya açık bilgilere göre düzenlenmiştir)Light Cone Intelligence, geliştiriciden "şu anda Baidu Wenxin Qianfan platformunun özelliklerinin mükemmel olduğunu, Tongyi Qianwen'in özelliklerinin esnek olduğunu ve Zhipu AI'nın piyasadaki ana akım üreticiler arasında en ucuz API ücretlerine sahip şirketlerden biri olduğunu" öğrendi.ChaGLM-Pro ücreti 0,01 yuan/bin jetondur ve 18 yuan verilir ve ChaGLM-Lite ücreti 0,002 yuan/bin jetona düşürülür. Referans olarak, OpenAI GPT-3.5 0,014 yuan/bin jeton, Ali Tongyi Qianwen-turbo 0,012 yuan/bin jeton ve Baidu Wenxin One Word emie-bot-turbo 0,008 yuan/bin jeton alıyor.Zhang Peng'in dediği gibi, Zhipu AI, OpenAI'yi hedef alarak "artık OpenAI'yi takip etmeme" konusunda yeni bir aşamadan geçiyor.Ürün işi açısından, yalnızca ChatGPT'nin yükseltilmesine ve inşasına odaklanan OpenAI'nin aksine, Zhipu AI üç taraftan saldırmayı seçti.Resmi web sitesine göre, Zhipu AI'nın mevcut işi, büyük model MaaS platformu, AMiner teknoloji istihbarat platformu ve bilişsel dijital insan olmak üzere temel olarak üç bloğa ayrılmıştır. Sonuç olarak, büyük model ürünler, AMiner ürünleri ve dijital insan ürünleri olmak üzere üç ana AI ürün matrisi oluşturulmuştur. Bunlar arasında büyük model ürünler sadece temel diyalog robotlarını değil, aynı zamanda programlama, yazma, boyama sarkıt robot bölümünü de kapsamaktadır.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-0bf9c101e1-dd1a6f-69ad2a) (Kaynak: Zhipu AI resmi web sitesi)Aynı zamanda Zhipu AI, yatırım yoluyla uygulama tarafını keşfetmeye devam ediyor. Şimdiye kadar Zhipu AI, Lingxin Intelligence ve Painting Wall Intelligence'a yatırım yaptı ve bu yıl Eylül ayında Lingxin Intelligent varlıklarını tekrar artırdı.Lingxin Intelligence, Tsinghua Üniversitesi Bilgisayar Bilimleri Bölümü'nden de kuluçkaya yatırılmıştır, ancak bölüm homolog olmasına rağmen, Lingxin Intelligence uygulamaya daha yatkındır ve onun tarafından geliştirilen AiU ilgi etkileşimli topluluğu, Zhipu AI'ya dayalı süper antropomorfik büyük bir modeldir. Ürünlerinin geliştirme fikri yabancı Karakter AI'sına benzer, farklı kişiliklere ve karakterlere sahip AI karakterleri oluşturarak, onlarla etkileşime girerek ve sohbet ederek, C-end uygulamalarına daha yatkındır ve eğlencenin niteliklerini vurgular.  ## ** OpenAI'den LIama'ya geçiş: Baichuan Intelligence**  Light Cone Intelligence, OpenAI ile karşılaştırıldığında Baichuan Intelligence'ın Llama'ya daha çok benzediğini buldu.** Her şeyden önce, orijinal teknoloji ve deneyime dayanarak, sürüm ve yineleme hızı çok hızlıdır. **Kuruluşundan yarım yıl sonra, Baichuan Intelligent art arda dört açık kaynaklı ticari baichuan-7B/13B, Baichuan2-7B/13B modelini ve Baichuan-53B ve Baichuan2-53B'nin iki kapalı kaynaklı büyük modelini piyasaya sürdü. Baichuan2-53B API arayüzünün 25 Eylül'de açılmasından itibaren, son 168 gün içinde Baichuan Intelligent, ortalama ay hızında büyük bir model yayınladı.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-e27cb1a5a0-dd1a6f-69ad2a) (Işık Konisi Akıllı Haritalama: Kamuya açık bilgilere göre düzenlenmiştir)Meta, AI konumunu geri kazanmak için LLama2'ye güveniyor ve Baichuan Intelligent, Baichuan2 serisi açık kaynaklı modellerle LLama2'yi yenmesiyle ünlü.Test sonuçlarına göre, Baichuan2-7B-Base ve Baichuan2-13B-Base, MMLU, CMMLU, GSM8K, vb. gibi çeşitli yetkili değerlendirme kriterlerinde LLaMA2'den üstündür ve performansları da aynı parametrelerin büyük miktarlarına sahip diğer modellere kıyasla çok parlaktır ve performansları LLaMA2 ve aynı boyuttaki diğer modellerin rakiplerinden önemli ölçüde daha iyidir.Gerçekler, Baichuan akıllı büyük modelinin gerçekten de testten geçtiğini kanıtladı. Resmi verilere göre Baichuan, açık kaynak topluluğunda 5 milyondan fazla ve ayda 3 milyondan fazla kez indirildi.Light Cone Intelligent, Baichuan akıllı serisi modelinin, Çin ve yabancı açık kaynak modelleri arasında hala rekabetçi olan 110.000'den fazla Hugging Face açık kaynak topluluğunda en yüksek indirme sayısına sahip olduğunu buldu.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-d6975a90e4-dd1a6f-69ad2a) (Kaynak: Hugging Face resmi web sitesi)Açık kaynağının avantajlara sahip olmasının nedeni aynı zamanda güçlü uyumluluğuyla da ilgilidir, Baichuan Intelligent, tüm büyük model tabanı yapısının Meta'nın LLAMA'sının yapısına daha yakın olduğunu kamuoyuna tanıttı, bu nedenle açık kaynak tasarımından işletmeler ve üreticiler için çok kolay.**"Açık kaynaktan sonra, ekoloji LLaMA etrafında inşa edilecek ve yabancı ülkelerde LLaMA'yı teşvik etmek için takip eden birçok açık kaynak projesi var, bu yüzden yapımız LLaMA'ya daha yakın." Wang Xiaochuan dedi.Optik koni zekasına göre, Baichuan Akıllı, Baichuan modelinin farklı modülleri ile LLAMA modeli ve Baichuan modelinin farklı modülleri arasında rastgele geçişi destekleyebilen mimari tasarımda çalışırken takılabilirliği benimser, örneğin LLAMA ile bir modeli eğitmek gibi, değişiklik yapılmadan, model kullanım için doğrudan Baichuan'a konulabilir. Bu aynı zamanda çoğu İnternet üreticisinin neden Baichuan modelini kullandığını ve bulut satıcılarının Baichuan serisi modelini tanıttığını da açıklıyor.Tarihin kat ettiği yol hem geçmişe hem de geleceğe çıkıyor ve Wang Xiaochuan'ın büyük model girişimciliği de böyle.Sogou'nun kurucusunun kimliğine ve arama teknolojisi deneyimine dayanarak, girişimciliğin ilk günlerinde Wang Xiaochuan birçok kişinin değerlendirmesini aldı, "Xiaochuan, büyük modeller için en uygun olanıdır."** Arama deneyiminde ve çerçevelerinde büyük modeller oluşturmak, Baichuan Intelligence'ın arka plan rengi haline geldi. **Baichuan Intelligent Technology'nin kurucu ortağı Chen Weipeng, bir keresinde arama Ar-Ge'sinin büyük model geliştirme ile birçok benzerliği olduğunu söyledi: "Baichuan Intelligent, arama deneyimini hızlı bir şekilde büyük modellerin araştırılmasına ve geliştirilmesine aktarıyor, bu da bir 'roket oluşturma' sistematik projesine benziyor, karmaşık sistemleri söküyor, ekip işbirliğini teşvik ediyor ve süreç değerlendirmesi yoluyla ekip etkinliğini artırıyor."Wang Xiaochuan basın toplantısında da konuştu: "Baichuan Intelligence daha önce bir arama genine sahip olduğu için, doğal olarak trilyonlarca web sayfasının ortasından en iyi sayfaları nasıl seçeceğini biliyor, bu da tekilleştirilebilir ve çöpe atılabilir." Baichuan Intelligent, veri işlemede önceki aramaların deneyiminden de yararlanıyor ve yüz milyarlarca verinin temizlenmesini ve tekilleştirilmesini bir saat içinde tamamlayabiliyor."Büyük model aramasının özü Baichuan-53B'de canlı bir şekilde sergileniyor. Baichuan Intelligent, büyük modellerin "yanılsaması" sorunuyla uğraşırken, arama teknolojisinin çökelmesiyle birlikte bilgi edinme, veri kalitesi iyileştirme ve arama geliştirmede optimizasyonlar yaptı.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-e8c8a50de0-dd1a6f-69ad2a) Veri kalitesini iyileştirme açısından, Baichuan Intelligent'ın temel fikri "her zaman en iyisini almak", düşük kaliteli ve yüksek kaliteli verileri standart olarak sınıflandırmak ve Baichuan2-53B'nin ön eğitim için her zaman yüksek kaliteli veriler kullanmasını sağlamaktır; Bilgi edinme açısından, Baichuan2-53B, kullanıcı talimatlarının derinlemesine anlaşılması, sorgu terimlerinin aranmasını doğru bir şekilde yönlendirmesi ve son olarak model sonuç üretiminin güvenilirliğini optimize etmek için büyük dil modeli teknolojisini birleştirmesi yoluyla talimat amacı anlama, akıllı arama ve sonuç geliştirme gibi temel bileşenler dahil olmak üzere birden fazla modülü yükseltti.Açık kaynak ile başlamasına rağmen, Baichuan Intelligent ticarileşme yolunu keşfetmeye başladı. Resmi bilgilere göre, Baichuan Intelligence'ın amacı "Çin'deki en iyi büyük model tabanını inşa etmek" ve dikey boyutun amacı arama, çoklu modalite, eğitim, tıp ve diğer alanlarda geliştirmek.Bugünün ticarileştirilmesi Baichuan2-53B'de yoğunlaşmıştır ve resmi web sitesi, modelin API çağrısının zamana dayalı bir şarj standardını benimsediğini göstermektedir. 0:00-8:00 0,01 yuan/bin jeton ücretlendirir, 8:00-24:00 0,02 yuan/bin jeton alır, buna karşılık gündüz ücret fiyatı geceden daha yüksektir.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-4543fd2d4b-dd1a6f-69ad2a) (Kaynak: Baichuan Intelligent resmi web sitesi)  ## **Bitiş**  Çin'in OpenAI'sinin kim olduğunu tartışmak, büyük model geliştirmenin ilk günlerinde pek mantıklı değil. Zhipu AI ve Baichuan Intelligent gibi birçok girişim, OpenAI'nin ayak izlerini körü körüne takip etmenin tavsiye edilmediğini fark etti, örneğin Zhipu AI, "Çin GPT'si yapmamanın" teknik yolunu netleştirdi. Dahası, açık kaynağın popüler hale geldiği ve bir kuşatma oluşturduğu bir zamanda, OpenAI'nin mutlak teknolojik üstünlüğü kırılmaz görünmüyor.Zhipu AI, Baichuan Intelligent, süper uygulamaların daha geniş bir pazar olduğunu, aynı zamanda Çin'in büyük model işletmelerinin konfor bölgesinin artık yerinde kalmadığını belirtti, örneğin, Zhipu AI'ya yakın bir kişi bir keresinde medyaya haberi verdi, Zhipu AI ekibi, bilgi ve inovasyon pazarını hedefleyen 2B rotasını kesin olarak belirledi ve 5 ay içinde, sonraki 2B iş rezervi insan gücü için ekibi 200'den 500 kişiye hızla genişletti.Ticarileştirme yolunda Baichuan Intelligent, Llama2'nin açık kaynak ekolojisine atıfta bulunmayı seçti ve ayrıca küçük adımlarla yinelemeye başladı.Çıplak gözle görülebilir ki, sadece yarım yıl içinde Baichuan Intelligent ve Zhipu AI, teknolojinin sahipsiz topraklarından geçti ve endüstriyel iniş için ticarileştirme aşamasına geldi. AI 1.0'ın girişimcilik patlamasıyla karşılaştırıldığında, teknoloji cilalama süresi 3 yıl (2016-2019) kadar uzundur ve tam da ticari inişteki engel nedeniyle çok sayıda AI şirketi 2022'de toplu olarak düşecek ve şafaktan önce düşecek.Bir önceki aşamanın derslerinden ders alarak, aynı zamanda büyük model teknolojisinin çok yönlülüğü iniş için daha uygun olduğu için, Baichuan Intelligence ve Zhipu AI tarafından temsil edilen girişimler, bir sonraki aşama için teknoloji, ürün ve yetenek rezervleri hazırlamak için birlikler ve atlar yetiştiriyor.Ancak ilk silah sesleri sadece maratonda duyuldu ve sonucun çok erken olduğunu söylemek için henüz çok erkendi. Ancak en azından parkurun ilk aşaması çözüldü ve hedef netleştikten sonra rekabet daha da sabırlı ve azimli. Bu, Baichuan Intelligence, Zhipu AI veya OpenAI için aynıdır.