OpenAI tehlikede

2023-08-08 05:47:48

Üretildi | Tiger Sniff Teknoloji Grubu Yazar | Qi Jian Editör | Liao Ying

Görsel kaynağı: Unbounded AI‌ tarafından oluşturuldu

7 Ağustos'ta, başka bir yerel AI start-up şirketi kendi açık kaynaklı ve ücretsiz ticari AI modelini piyasaya sürdü: XVERSE-13B. Yuanxiang XVERSE adlı şirket, Tencent'in eski başkan yardımcısı ve Tencent AI laboratuvarının kurucusu Yao Xing tarafından kuruldu.

Meta, açık kaynaklı LLaMA 2 serisi büyük ölçekli modelleri Temmuz ayında ücretsiz ticari kullanım için piyasaya sürdüğünden beri, AI büyük ölçekli model pazarında yeni bir "açık kaynak" dalgası şekilleniyor.

2 Ağustos'ta, Baidu'ya bağlı bir AI büyük ölçekli model platformu olan Wenxin Qianfan, LLaMA2'nin tüm açık kaynaklı modellerine erişimi duyurdu.Platformda çağrılabilecek büyük ölçekli modellerin sayısı 33'e yükseldi. 3 Wenxin modeli dışında kalan 30 modelin tamamı açık kaynak kodludur.ChatGLM2, RWKV, MPT, Dolly, OpenLLaMA, Falcon vb. Modeller.

Bundan sonraki gün Alibaba Cloud da açık kaynak model saflarına katılacağını duyurdu. Açık kaynak Tongyi Qianwen 7 milyar parametre modeli, genel model Qwen-7B ve diyalog modeli Qwen-7B-Chat'i içerir. Mota topluluğunda kullanıma sunulan iki model, açık kaynak, ücretsiz ve ticari olarak mevcuttur.

İlginç bir şekilde, açık kaynağa ve açıklığa yönelik bu olumlu tutum, kapalı kaynak modeli ChatGPT'nin büyük sahibi Microsoft ile başladı. ** 18 Temmuz'da Microsoft, işletmelere OpenAI ve Google modellerine alternatifler sunan LLaMA 2 modelinin açık kaynaklı ticari sürümünü yayınlamak için Meta ile iş birliği yapacağını duyurdu. **OpenAI'nin yapay zeka büyük ölçekli model pazarındaki tekel konumu, en yakın ortakları dahil tüm sektör tarafından "hedefleniyor" gibi görünüyor.

Küresel olarak tanınan bir numaralı büyük dil modeli olan OpenAI'nin GPT-4'ü, şu anda çok sayıda kullanıcının parasını ödemeye istekli olduğu tek büyük dil modelidir.

Sınıfın en iyi öğrencisi genellikle çalışma grubuna katılmak için motive olmaz. Benzer şekilde, **OpenAI'nin açık kaynak için bir nedeni veya motivasyonu yoktur. **

Bununla birlikte, LLaMA 2'nin tam açık kaynağıyla, giderek daha fazla sayıda geliştirici Meta'ya ve çeşitli açık kaynak modellerine yatırım yaptı. Tıpkı Android'in iOS'a karşı savaşmak için açık kaynak kullanması gibi, çok sayıda açık kaynak yapay zeka modeli de aktif olarak GPT-4'ün ve OpenAI'yi açık kaynak ekosistemiyle çevreleyen teknik engelleri aşıyor. **

Neden açık kaynak?

OpenAI, eklenti işlevini ilk kez başlattığında, birçok kişi AI modelini geleceğin Windows, iOS ve Android ile karşılaştırdı. Artık LLaMA 2'nin piyasaya sürülmesiyle birlikte AI büyük modeli sadece bir işlev değil, piyasa yapısı bile işletim sistemi yönüne doğru gelişiyor.

UC Berkeley liderliğindeki bir kuruluş olan LMSYS Org tarafından başlatılan bu, büyük dil modelleri (LLM'ler) için bir sıralama yarışmasıdır; 20 Temmuz itibariyle, sıralamanın son sürümü 40 büyük AI modelini saydı ve ilk beş hala kapalı GPT-4, GPT-3.5-turbo ve Claude'un üç modeli olan kaynaklar Modeli (Tescilli). Ancak, Google'ın PaLM-Chat-Bison-001 dışındaki aşağıdaki 34 modelin tümü açık kaynaklı modellerdir ve 15'i ticari değildir.

*20 Temmuz'da yayınlanan LMSYS Org Large Language Models (LLM'ler) Lider Tablosu Chatbot Arena: 50.000'den fazla kullanıcı oyu kullanarak Elo derecelendirmelerini hesaplar. MT-Bench: Bir dizi zorlu çok turlu problem. MMLU (5 atış): Bir modelin 57 görevdeki çoklu görev doğruluğunu ölçen bir test. *

Model yetenekleri açısından, tüm pazara bakıldığında, açık kaynak veya kapalı kaynak fark etmeksizin hiçbir model GPT-4 ile kafa kafaya rekabet etmeye cesaret edemez. Ancak Kaplanlar kurtlara karşı koyamadılar ve GPT-4'ün büyük modellerini yenemediler. "Şerit değiştirip sollamayı" seçtiler ve uygulama ekolojisini ele geçirmek için açık kaynak kullandılar. Android'in iOS'a karşı savaşına biraz benziyor.

"Şu anda tüm açık kaynaklı büyük modellerin tek bir amacı var, o da pazarlama."

Yerli bir açık kaynaklı büyük ölçekli model araştırma ve geliştirme şirketinin kurucusu, Tiger Sniff'e açık kaynaklı büyük ölçekli modelleri ve açık kaynaklı Android sistemlerini teşvik etmenin ana nedeninin pazarı ücretsiz olarak ele geçirmek olduğunu itiraf etti. "Birçok büyük şirket büyük yapay zeka modelleri yayınladı, hatta mevcut bir modele dayalı bir uygulama yaptı ve ardından büyük bir hayranlıkla onu tanıtmaya başladı. Aslında, temel büyük modellerin kullanıcıları için reklama daha fazla para harcamak daha pahalı Model için gerçekten açık kaynak değil.” Bu aynı zamanda AI şirketlerinin güçlerini kanıtlamalarının en iyi yoludur.

İlk olarak, açık kaynaklı modellerin değerlendirilmesi, kapalı modellere göre daha kolaydır. Açık kaynak modellerin kodu ve veri kümeleri herkese açık olduğundan, araştırmacılar modelin mimarisini, eğitim verilerini ve eğitim sürecini doğrudan inceleyerek modelin güçlü ve zayıf yönlerini anlamak için daha derin bir analiz yapabilirler.

"Bazı yapay zeka büyük modelleri çok yetenekli görünüyor, ancak bunlar açık kaynak değil ve yalnızca çıktısının sonuçlarını görebilirsiniz."

Açık kaynak modelle karşılaştırıldığında, kapalı kaynak model, modelin avantajlarını ve dezavantajlarını ancak modelin performans değerlendirmesi aracılığıyla anlayabilir. Bu, kapalı kaynak modellerin performansının yapay olarak abartılmasına veya eksikliklerinin gizlenmesine yol açar. Açık kaynak modelinin şeffaflığı, geliştiricilerin modeli daha iyi anlamalarına ve modeli daha adil bir şekilde değerlendirmelerine yardımcı olabilir.

Geç kalanlar için kapalı kaynak modeliyle ilgili başka bir sorun daha var: teknolojinin özgünlüğünü sorgulamak kolay. Birçok büyük model geliştiricisi bir keresinde Huxiu'ya, "Açık kaynak olmayan modeller için, açık bir şekilde söylemek gerekirse, bir kabuk LLaMA olsa veya arka planda ChatGPT arayüzünü çağırsa bile, kim bilir?"

Yerli AI büyük modellerinin ilk dalgası çıktığında, bu tür şüphe sesleri internette geniş çapta dolaştı. Açık kaynak olmayan büyük AI modellerinin masumiyetini kanıtlamak zordur.ChatGPT API'sini çağırmadıklarını kanıtlamak için bazı şirketler muhakeme sunucusunu çıkardı ve ağ kablosunu çıkardı. leke.

Açık kaynak, şüphesiz büyük AI modellerini kendi kendine onaylamanın en iyi yollarından biridir. Ancak **açık kaynağın gerçek değeri, kendi kendini sertifikalandırma yeteneği değil, ekolojiyi ele geçirmesidir. **

"LLaMA 2'nin piyasaya sürülmesinden sonra OpenAI ekosistemini kesinlikle hızlı bir şekilde ele geçirecek." Büyük bir model geliştiricisi Huxiu'ya, GPT-4'ün endüstri tarafından neredeyse en güçlü yeteneğe sahip olarak tanınmasına rağmen, GPT-3'ten sonraki modellerin açık kaynak olmadığını söyledi. Ayrıca, GPT-4'ün API arayüzünün açıklığı da çok düşük olduğundan, GPT modelinin geliştirilmesinde birçok kısıtlama vardır. Sonuç olarak, birçok geliştirici LLaMA gibi açık kaynak modellerini seçer.Bu açık kaynak modeller, yalnızca talimatlarda ince ayar yapamaz, aynı zamanda temel model üzerinde araştırma da yapabilir.

"LLaMA, geliştiriciler arasında kesinlikle OpenAI'den daha popüler."

LLaMA 2, 19 Temmuz'da ilk yayınlandığında, GitHub'da "LLaMA" dahil anahtar kelimelerle 5.600'den fazla proje ve "GPT-4" dahil 4.100'den fazla proje vardı. Piyasaya sürülmesinden iki hafta sonra, LLaMA'nın büyüme hızı daha hızlı.Basın tarihi itibariyle 6.200'den fazla "LLaMA" ve 4.400'den fazla "GPT-4" var.

Öte yandan, ticari şirketler için yapay zeka eğitimini kolaylaştıran, özelleştirilmiş dağıtım için açık kaynak modeller yerel olarak indirilebilir. Bu tür şirketlerin AI uygulamalarının kendi iş verilerine göre eğitilmesi gerekiyor ve özel olarak konuşlandırılan büyük ölçekli AI modeli, veri güvenliğini büyük ölçüde koruyabilir. Aynı zamanda, ister bulut hizmeti, yerel dağıtım, ister birden çok IDC'nin dağıtılmış bilgi işlem gücü olsun, özelleştirilmiş dağıtım için daha fazla bilgi işlem gücü seçeneği vardır ve bu da model eğitimi ve muhakeme maliyetini büyük ölçüde azaltır.

ChatGPT sadece iki ayda aylık 100 milyon aktif kullanıcı toplamış olsa da, geliştirici ekosisteminde açık kaynak modelinin kullanıcıların aklını alma hızı daha yüksek görünüyor.

Şu anda birçok yerli yapay zeka şirketi açık kaynak modelleri yayınlamayı seçmiştir. Bunlar arasında Zhipu AI tarafından yayınlanan açık kaynak modeli ChatGLM-6B, Fudan Üniversitesi tarafından yayınlanan MOSS, Zhiyuan Araştırma Enstitüsü tarafından yayınlanan Wudao Tianying Aquila ve Baichuan Intelligent tarafından piyasaya sürülen Baichuan-7B (13B) yer alıyor. Bunlar arasında **Zhipu AI tarafından piyasaya sürülen açık kaynaklı büyük bir model olan ChatGLM-6B dünya çapında 4 milyondan fazla indirildi ve GitHub'da 32.000 yıldız aldı, LLaMA'dan 3.000 daha fazla yıldız. **

"Açık kaynak modeli yapmazsak, pazar yakında LLaMA ile dolu olacak." Açık kaynak modeli başlatan bir AI şirketinin yöneticisi Huxiu'ya, açık kaynağın Çin'in AI'sının gelişiminde önemli bir adım olduğunu söyledi. büyük model

Bazı yerel açık kaynaklı yapay zeka büyük modeller

Aslında, LLM trendi başlamadan önce, üretken yapay zeka zaten bir açık kaynak ve kapalı kaynak savaşı vermişti.

**Çok sayıda geliştirici ve ürün uygulamasıyla, açık kaynak Wensheng grafik modeli Stable Diffusion, OpenAI'nin ilk kapalı kaynak modeli Dall-E 2'yi neredeyse köşeye sıkıştırdı. Kullanıcılar genellikle Stable Diffusion'ın model yeteneklerinin başka bir kapalı kaynak ürün olan MidJourney kadar iyi olmadığına inansa da Stable Diffusion, açık kaynak ve ücretsiz özellikleri sayesinde çok sayıda Vincent grafik pazarını ele geçirdi ve en yaygın Vincent grafik modeli. Geliştirme şirketi RunwayML And Stability AI da çok fazla ilgi gördü ve finanse edildi. **

LLaMA 2'nin açık kaynak modeli, LLM'ler alanında OpenAI'yi zorlamayı amaçlıyor gibi görünüyor.

Ürünlerle birlikte açık kaynak

LLaMA 2 şu anda açık kaynaktır, serideki üç modelin tümü: 7 milyar, 13 milyar ve 70 milyar parametreli versiyonlar. Ancak piyasada "Meta'nın aslında piyasaya çıkmamış daha büyük parametrelere sahip bir versiyonu var. Bir sonraki sürüm daha büyük parametrelere sahip bir versiyona sahip olabilir, ancak açık kaynak olmayabilir" şeklinde söylentiler de var.

Şu anda birçok açık kaynak modelinin tamamının açık kaynak olmadığını belirtmekte fayda var. Zhiyuan Araştırma Enstitüsü tarafından yayınlanan Enlightenment 3.0 modelinde, yalnızca "Tianying" temel dil modeli açık kaynaktır; Zhipu AI tarafından yayınlanan ChatGLM, model serisinin yalnızca bir kısmını açtı ve daha büyük olan 130 milyar parametre modeli hala kapalı. kaynak. **

LLaMA 2'nin daha büyük modeller için "ayrılmış" olup olmadığına bakılmaksızın, "ücretsiz" biçim şüphesiz Meta'nın büyük model pazarında oluşumunu hızlandıracak ve onu Android'in "eski yoluna" itecektir.

Açık kaynak ekosistemi sayesinde, Android sistemi dünya çapında çok sayıda geliştirici ve kullanıcı biriktirmiştir. Teknoloji ekolojisi açısından, önde gelen kapalı kaynak sistemi iOS'u büyük ölçüde kontrol edip dengeledi ve hatta bazı pazarlarda kendi tekelini oluşturdu. 2018'den bu yana Avrupa Birliği, Android sisteminin tekel mekanizması nedeniyle Google'a 4 milyar avroyu aşkın para cezası verdi. Bu çok yüksek cezadan, açık kaynaklı Android sisteminin ne kadar karlı olduğunu da görebiliriz.

Araştırma firması Sensor Tower'ın bir raporuna göre, Google Play'de kullanıcı harcaması 2022'de yaklaşık 53 milyar ABD doları olacak ve bu rakam 2023'te 60 milyar ABD dolarına çıkacak. Başka bir araştırma kurumu olan Statista tarafından yayınlanan bir rapora göre Ocak 2022 itibarıyla Google Play Store'da yaklaşık 140.000 uygulama bulunuyor.

Açık kaynak yapay zeka modeli bu aşamada henüz cep telefonları kadar popüler değil açıkçası. Bununla birlikte, AI gerçekten cep telefonları kadar popüler olsa bile, Meta gibi devler, LLaMA 2 ile çok para kazanan şirketleri kolay kolay bırakmayacaktır.

LLaMA 2'nin açık kaynak sözleşmesinde şöyle bir hüküm var: **Aylık aktif kullanıcı sayısı 700 milyonu geçerse Meta'dan lisans başvurusu yapmanız gerekiyor. Meta tamamen kendi takdirine bağlı olarak size lisans verebilir ve bu hakların hiçbirini kullanma hakkınız olmayacaktır. **

Aynı zamanda, açık kaynak modelinin kapalı kaynak sürümüne ve yapay zeka büyük modellerinin uygulanmasına ek olarak, bilgi işlem gücünün "malları getirmesine" de yardımcı olabilir.

Çin'de AI büyük ölçekli modellerini tanıtan ilk iki üretici olan Baidu ve Ali, her ikisi de bulut üreticisidir. Diğer iki bulut satıcısı Tencent Cloud ve Huawei Cloud, Wenxin Yiyan ve Tongyi Qianwen gibi LLM ürünlerine sahip olmasalar da, AI modelleri hakkında bağırmaya devam ediyorlar. Bunun temel nedeni ise büyük modelin bulut üzerindeki “taşıma etkisi”dir.

Bir Tencent bulut iş lideri, "Yapay zeka büyük ölçekli modellerinde bazı eylemlerin duyurulması, pazar ve müşteriler tarafından ortaklaşa destekleniyor. Son birkaç ayda, büyük ölçekli modeller hakkında soru sormak için gelen çok fazla müşteri oldu." Huxiu, AI büyük modelinin mal taşıma yeteneğinin en iyi kanıtı olan bilgi işlem gücünün sıraya girdiğini söyledi.

**Modelin para kazanması gerekmez, ancak bilgi işlem gücünün karlı olması gerekir. **Alibaba, Tongyi Qianwen'i açtı ve Baidu, Wenxin Qianfan büyük ölçekli model platformunda 30 açık kaynaklı modeli tanıttı. Bu iki eylem, kullanıcılara "ücretsiz" yapay zeka yetenekleri sunmak içindir. Açık kaynak modelini kullanan kullanıcılar artık AI için ödeme yapmazlar, ancak AI'ları Alibaba Cloud ve Baidu Smart Cloud üzerinde çalıştığı sürece bilgi işlem gücü için ödeme yapmak zorunda kalacaklar.

Baidu Smart Cloud AI ve Big Data Platform'un genel müdürü Xin Zhou, "AI ayrıca bulut fikrine geri dönmeli ve buluttan para kazanmalı." büyük model platformu, müşterilerin işletmeleri için değer yaratmaktır.Değer yaratırken, eski müşterilerin bağlılığını artırabilir ve daha fazla yeni müşteriyi genişletebilir. Bu, bulut satıcılarının ölçek etkisini genişletmede çok yardımcı olur.

Ücretsiz daha pahalıdır

"10 milyon, bu, büyük bir modeli özelleştirmek için başlangıç fiyatıyla hemen hemen aynı miktar."

Açık kaynak kodlu büyük ölçekli bir model firmasının kurucusu telefonda danışmaya gelen aracıya fiyat teklifi verdi.

"Açık kaynak modeli kullanıcılar tarafından tanındıktan sonra, özel geliştirme için hizmet ücreti hakkında başkalarıyla konuşabilirsiniz." Kurucu telefonu kapattıktan sonra, Huxiu'ya LLaMA 2 gibi bir model için geliştirme maliyetinin en azından maliyeti on milyonlarca dolar. Dolayısıyla hedeflediği pazar, geliştirme maliyetinin onlarca, yüzlerce katı olmalıdır.

Mevcut bakış açısından, **AI şirketlerinin açık kaynak modellerinden para kazanmasının en iyi yolu hizmetlerle başlamaktır. **

Neyse ki, AI büyük modellerinin çoğu kullanıcısı bu hizmetlere çok ihtiyaç duyar.

"Model açık kaynaklı, ücretsiz ve ticari olarak mevcut. Bu, modeli indirmeye başlayarak, model konuşlandırmaya, eğitime, ayarlamaya ve gerçek uygulamalarda uygulama geliştirmeye kadar tüm işin sizin tarafınızdan yapılması gerektiği anlamına geliyor." Bir LLaMA uygulama geliştiricisi Huxiu'ya, kapalı kaynak modellerinin çoğu tedarikçisinin eğitim ve dağıtım hizmetleri sağlayacağını ve geliştirme işlevlerini kullanıcı ihtiyaçlarına göre özelleştirebileceğini söyledi. Ancak bir açık kaynak modeli kullanırsanız, tüm bu görevleri kendiniz yapmanız gerekir, kimse eğitmenize yardım etmez, kimse size bilgi işlem gücünü bulamaz ve kimse geliştirmeyi özelleştirmenize yardımcı olmaz.

"Aslında, kapalı kaynak model üreticileri hizmet satar." Bir çevrimiçi eğitim kurumundan sorumlu olan ve LLaMA modeline dayalı yapay zeka uygulama araştırması yapan kişi Huxiu'ya şunları söyledi: "Açık kaynak modeli ücretsiz görünüyor , ancak dağıtım sürecinde hala çok para harcanması gerekiyor.” AI modelini ekledikten sonra, BT departmanındaki insan gücü ve bilgi işlem gücünün maliyeti önemli ölçüde arttı.

Açık kaynak modellerine dayalı eğitim ve ayarlama çoğu BT personeli için zor olmasa da. Bununla birlikte, modelin derinlemesine araştırılması ve geliştirilmesi için, algoritmalar ve yapay zeka açısından bazı teknik rezervler hala gereklidir. Büyük ölçekli AI modelleri konsepti giderek daha popüler hale geldikçe, bu alandaki yeteneklerin fiyatı da artıyor.

Yetkili kişi, "İşçilik maliyetlerindeki artış aslında dalgalanma gösteriyor, ancak sunucuların ve donanımların maliyeti gerçek. Büyük modellere yatırım yapmaktan bugüne kadar maliyetlerimiz yaklaşık %20 - %30 arttı." dedi. Bahsedilen çevrimiçi eğitim kurumunun kuruluşu Şu anda hala yapay zeka sahne keşfi aşamasındadır ve en büyük zorluk, her sahneyi denemesi gerekmesidir. "Biri başarısız olursa, yenisiyle değiştirin. Bu süreçte her adım maliyetlidir."

Bu bağlamda Huxiu, bir Baidu Akıllı Bulut yetkilisine Baidu Wenxin Qianfan'ın dağıtım açısından hizmeti ve maliyeti hakkında sorular sordu. Paradan tasarruf edecek.**"

Aslında, ister açık kaynak ister kapalı kaynak model olsun, model dağıtım maliyeti kişi/gün bazında hesaplanır ve sonraki işlemler için bilgi işlem gücü maliyetlerinde önemli bir fark olmayacaktır. eğitim ve akıl yürütme. "**Ancak, kendi başınıza eğitmek, konuşlandırmak ve geliştirmek için açık kaynak modellerini kullanmak bu süreci yalnızca çok zahmetli hale getirecektir." Baidu içinden biri, belirli dağıtım maliyetinin belirli projeye bağlı olduğunu ve aradaki farkın çok büyük olduğunu söyledi. Ancak, dağıtım ve kullanım maliyetleri açısından açık kaynak ile kapalı kaynak arasında aslında önemli bir fark yoktur. **Veri güvenliği açısından bakıldığında, çoğu kapalı kaynak modeli de özel olarak dağıtılabilir.

**Bu aşamada, yapay zekanın kapsayıcılık elde etmesi hala zordur. **

İnternet işiyle uğraşan çoğu şirket için kendi BT Ar-Ge ekipleri var.Büyük model geldiğinde, yakında AI uygulamaları geliştirmek için "yerleşik" bir ekip oluşturabilecekler. Ancak birçok perakende, geleneksel üretim ve hizmet sektörü için dijital dönüşüm zor bir sorundur.Yapay zeka büyük modellerinin eğitimini, dağıtımını ve mantığını incelemek onlar için gerçekten zordur.

Bu şirketler için en iyi AI ürünü, genel amaçlı bir AI eklentisidir. "İhtiyacımız olan, konuşmaları o kadar da aptalca görünmeyen bir müşteri hizmetleri robotu. Benden modeli nasıl eğiteceğimi öğrenmemi istedim ki bu biraz heyecan verici." Bir e-ticaret markasının iş kolu yöneticisi Huxiu'ya şunları söyledi: AI diyalog yeteneğinin eskisinden daha güçlü olduğu söyleniyor, ancak ChatGPT henüz denenmedi. Yeni teknolojileri benimsemeye de istekli olsa da, öğrenmeye zaman ayırması ve şimdi yapay zekaya para yatırması onun için yeterli motivasyon değil.

"Şu an kullandığım platformda veya yazılımda bir eklenti yoksa elime alıp kullanabilirim yoksa yapay zeka asistanını hemen yükseltmek için para harcamayı çok düşünmem. Düşük.

"** Tüccarların bunu yapmak için yapay zekaya ihtiyacı var ve bu, hissedilmeden uygulanabilir ve güçlendirilebilir.**" SaaS üreticisi Weimob, dijital pazarlamada, satıcıların mevcut uygulamaları yerleştirme biçiminde yapay zeka yeteneklerini aramasına yardımcı olan böyle bir uygulama WAI yarattı. Satıcılara, büyük dil modellerine dayalı yapay zeka diyalogu ve metin ve görüntü oluşturma yetenekleri sağlayın.

Büyük modelleri SaaS hizmet araçlarına açık bir şekilde bağlamak, Baidu Wenxin Qianfan'ın model çağrısına biraz benzer. Yalnızca arayüz aramaları ve İnce Ayar yapılmasına rağmen, kullanıcılara daha fazla, daha hızlı ve daha kararlı AI iniş yetenekleri sağlar.

"Açık kaynaklı modeller, kullanıcıların başlamalarını kolaylaştırabilir ve artık birçok açık kaynaklı model, büyük üreticilerden daha hızlı güncellenmektedir." Weimob COO COO Yin Shiming, açık kaynak ve açıklığın yapay zeka yeteneklerini hızla sunabileceğine inanıyor. kullanıcılara Elinizde, kullanıcıların gerçekten ihtiyaç duyduğu şey "tak ve çalıştır" AI'dır. **

Hâlâ AI büyük modellerini test etme, deneme ve deneyimleme aşamasında olan çoğu kullanıcı için, açık kaynak modellerin eşiği açıkça daha düşüktür ve başlangıç maliyeti neredeyse sıfırdır.

Birçok kullanıcı başından beri açık kaynak modelini kullanmıştır ve gelecekte de kullanmaya devam edecektir. Yukarıda belirtilen dağıtım ve eğitim sorunları, açık kaynak modelleri için bir hizmet endüstrisi zinciri oluşturuyor.

Chen Ran Bu büyük model artışı dalgasında, yeni oluşturulan OpenCSG, açık kaynak büyük model etrafında hizmet işi yapıyor.

OpenCSG tarafından sağlanan büyük model hizmeti, temel olarak işletmeler için açık kaynak modellerin eğitimi ve uygulanmasına yöneliktir. Açık kaynak modellerinin seçiminden, hibrit dağıtılmış bilgi işlem gücüne, iş modeli eğitimi ve arka uç uygulama geliştirmeye vb. kurumlara hizmet sağlayabilir.

"**Bence büyük modeller tüm SaaS'lara benzer. Yukarı ve aşağı sektörler kademeli olarak zenginleşecek ve müşteriler yalnızca model yeteneklerine odaklanmayacak." Chen Ran, müşterilerin nihai talebinin en iyisini bulmak olmadığına inanıyor. yetenekli model, ancak işine hizmet etmek için AI büyük modellerinin daha iyi, daha kolay ve daha basit kullanımı.

AI etrafında açık kaynak ekolojisi

Yapay zeka endüstri zincirinin tamamında açık kaynak, modellerin çok ötesine geçer. Araştırma ve geliştirmeden dağıtıma ve uygulamaya kadar neredeyse her bağlantı açık kaynak konusundan ayrılamaz.

**Algoritmalar, bilgi işlem gücü, veriler ve yapay zeka üç öğesinin her biri açık kaynak desteği gerektirir. **

Algoritma düzeyinde, açık kaynaklı AI büyük modelleri nispeten geç bir aşamadadır. Erken AI araştırma ve geliştirmede, neredeyse tüm AI modelleri, AI araç kutuları oluşturmaya eşdeğer olan makine öğrenimi çerçevelerini kullandı. TensorFlow, Pytorch ve PaddlePaddle (uçan kürek) dahil olmak üzere mevcut ana akım makine öğrenimi çerçevelerinin tümü açık kaynaklı çerçevelerdir.

Veri düzeyinde, Commen Crowl açık kaynak veri kümesi, GPT modeli eğitim sürecinde önemli bir veri kaynağıdır. Şu anda birçok kurum ve veri şirketi, Zhiyuan Araştırma Enstitüsü'nün COIG-PC veri seti ve Haiti AAC'nin DOTS-MM-0526 multimodal veri seti dahil olmak üzere AI eğitim veri setleri hakkında açık kaynaklı ürünler yayınladı.

Veri kümesi yayıncıları için, açık kaynak yalnızca etkiyi ve marka değerini artırmakla kalmaz, aynı zamanda açık kaynak veri kümeleri, verilerdeki hataları veya tutarsızlıkları bulup düzeltmek için açık kaynak topluluğundan olumlu geri bildirimler toplayabilir. Bu harici inceleme, yayıncının ürün ekosistemini daha da zenginleştirirken veri kalitesinin iyileştirilmesine yardımcı olur.

"**Algoritma mühendisleri genellikle araştırma ve geliştirmede veri eksikliği sorunuyla karşılaşıyor. Yüksek kaliteli veriler, model değerlendirmede niteliksel iyileştirmeler sağlayabilir. **Ülkem şu anda yüksek kaliteli veri kümelerinin kıtlığı sorunuyla karşı karşıya. Haiti AAC COO'su Li Ke, Haiti AAC'nin açık kaynak modeli LLaMA 2'nin eğitim verisi sağlayıcılarından biri olduğunu söyledi.

** Bilgi işlem gücü açısından, AI'nın geliştirilmesindeki en büyük darboğaz olan açık kaynaklı çip çerçevesi, endüstrinin gelişimini de teşvik ediyor. **

4 Ağustos'ta Qualcomm, açık kaynak RISC-V mimarisine dayalı çiplerin ticarileştirilmesini hızlandırmak için dört yarı iletken şirketiyle ortak girişim kurduğunu duyurdu. Şu anda piyasada üç ana yonga çerçevesi bulunmaktadır: Intel CPU'lar tarafından kullanılan x86, Nvidia GPU'lar tarafından kullanılan Arm ve açık kaynaklı bir yonga çerçevesi olan RISC-V.

"RISC-V, programlanabilir bir ortam sağlayabilir. Çip geliştirme ekibi, birçok ön işleme ve işleme sonrası işi yapmak için RISC-V'yi kullanabilir ve ayrıca kullanıcı ihtiyaçlarını karşılamak için kullanıcı ihtiyaçlarını karşılayan özel hızlandırıcılar veya işlevsel modüller ekleyebilir. "SiFive'da pazarlama ve iş geliştirmeden sorumlu kıdemli başkan yardımcısı Gang Zhijian, RISC-V ekosisteminin çip araştırma ve geliştirme için zengin seçenekler sunduğunu ve bunun da günümüzde AI çiplerine yönelik hızla artan talebe çok yardımcı olduğunu söyledi.

Arm ve x86, RISC-V'ye kıyasla nispeten kapalı ekosistemlere sahiptir. **Arm ekosisteminde, kullanıcılar yalnızca Arm tarafından sağlanan sınırlı seçenekleri seçebilirken, RISC-V ekosisteminde birçok şirket yer alıyor ve daha fazla ürün türü ve seçeneği olacak. **

Açık kaynağa dayalı mimari, rekabeti hızlandırmak için çip endüstrisini de teşvik ediyor. bu tür bir rekabet sonuçta RISC-V ekosisteminin refahını ve ilerlemesini destekleyecektir.**”

RISC-V komut seti mimarisi ücretsiz ve açık kaynak olmasına rağmen, çip tasarım üreticileri tarafından RISC-V komut seti mimarisinin ikincil gelişimine dayalı olarak oluşturulan çekirdek IP, bağımsız fikri mülkiyet haklarına sahiptir ve harici ücretler yoluyla yetkilendirilebilir. RISC-V International Foundation'ın verilerine göre, 2022'de üye sayısı bir önceki yıla göre %26'dan fazla artacak ve Qualcomm dahil 70 ülke/bölgeyi kapsayan toplam üye birim sayısı 3.180'i aşacak. Intel, Google, Alibaba, Huawei ve UNISOC, Sharp ve diğer birçok önde gelen çip şirketi.

Açık kaynak, RISC-V için bir avantaj olsa da bazı sorunlar da yaratıyor. RISC-V yalnızca 40'tan fazla temel komut setine ek olarak düzinelerce temel modül genişletme yönergesine sahiptir.Her kuruluş ve geliştirici, bağımsız fikri mülkiyet haklarına sahip yongalar oluşturmak için RISC-V'yi ücretsiz olarak kullanabilir.

Bununla birlikte, açık kaynak, son derece özelleştirilebilir ve modüler özellikler de RISC-V ekosistemini daha parçalı ve karmaşık hale getirir.

"Her çip araştırma ve geliştirme şirketi RISC-V'nin komut setini yükselttikten sonra, aslında yeni bir mimari üretecektir. Buna RISC-V denir, ancak farklı şirketler RISC-V ile uyumlu değildir ve açık kaynak ekolojisi aslında .**" Weiwei Technology Başkanı ve Greater China Genel Müdürü Lu Tao, çip mimarisi ve yazılım ekolojisinin açık kaynağının çok önemli olduğuna inanıyor, ancak farklı ekiplerin açıklık arasında bir denge bulması çok zor. özelleştirme ve parçalama Ar-Ge ekibinin bilgeliğini ve yeteneğini test edin.

Ek olarak, Arm mimarisi yapay zeka eğitimi ve muhakeme için uygun GPU'lar, IPU'lar ve diğer yongaları zaten üretmiştir ve teknik ekoloji daha eksiksiz ve olgunlaşmıştır. RISC-V'nin asıl amacı CPU'ları tasarlamaktır.Çok açık olmasına rağmen, AI yongalarının tasarımı hala keşif aşamasındadır.

Araştırma şirketi Counterpoint Research'e göre, 2025 yılına kadar, RISC-V işlemcilerinin kümülatif sevkiyatı, yıllık %114,9 bileşik büyüme oranıyla 80 milyarı aşacak. O zamana kadar RISC-V, küresel CPU pazarının %14'ünü, IoT pazarının %28'ini, endüstriyel pazarın %12'sini ve otomotiv pazarının %10'unu işgal edecek.

Qualcomm, 2019'da Snapdragon 865 SoC'deki mikrodenetleyicilerde RISC-V'yi uygulamaya koydu ve bugüne kadar 650 milyondan fazla RISC-V yongası gönderdi. Eylül 2022'de AI Hardware Summit Forum'da RISC-V'nin mucidi Profesör Krste Asanovic, Google'ın makine öğrenimi çerçevesi TensorFlow, TPU yongalarını geliştirmek için RISC-V tabanlı SiFive Intelligence X280'i kullanmaya başladığını açıkladı. **Bundan önce Google, TPU çip mimarisi üzerinde 10 yılı aşkın bir süredir kendi kendine araştırma çalışması yürütüyordu.

RISC-V çiplerini sıfırdan geliştirmek zor olsa da, RISC-V'nin açık kaynak yapısı, yine sıfırdan başlayan Çin çiplerine, abluka ve tekelde hayatta kalma şansı verdi.“Bana göre Çin Çin'in çipi Çinli çip şirketleri daha agresif ve zorluklarla yüzleşmeye istekli." Gang Zhijian, Çin pazarının çip endüstrisinin gelişimini canlandırmanın anahtarı olduğunu söyledi. Çin'in çip pazarı çok büyük.Örneğin, Çin'in otomotiv çipi bilgi işlem gücü talebi, Avrupa ve Amerika pazarlarınınkini çok aştı. **Çinli işletmelerin yapay zeka bilgi işlem gücüne yönelik artan talebiyle, Çin'in yapay zeka çip endüstrisi gelecekte kesinlikle daha fazla fırsat sunacaktır.

Çözüm

Ticari kaygılara ek olarak, **açık kaynak, teknik yayıncıların modelleri optimize etmesine de yardımcı olabilir. **

"ChatGPT aslında bir mühendislik zaferidir." Günümüzün büyük dil modelinin başarısı, aslında modelin tekrarlanan eğitimi ve ayarlanmasına dayanmaktadır. Temel model kurulduktan sonra, model açık kaynak topluluğuna tanıtılırsa ve model optimizasyon çalışmasına daha fazla geliştirici katılırsa, AI büyük modelinin ilerlemesine şüphesiz çok yardımcı olacaktır.

Buna ek olarak, Pekin Zhiyuan Yapay Zeka Araştırma Enstitüsü'nün başkan yardımcısı ve baş mühendisi Lin Yonghua, 2023 Zhiyuan Konferansı sırasında verdiği bir röportajda, ** içindeki herkesin The genel amaçlı büyük ölçekli modellerin araştırılması ve geliştirilmesi, çok fazla bilgi işlem gücü, veri ve elektrik gerektirir.Bu, sosyal kaynakların rasyonel kullanımına elverişli olmayan tekerleğin tamamen yeniden icat edilmesidir. **

Zhiyuan Araştırma Enstitüsü gibi kar amacı gütmeyen bir kuruluş için, model ister açık kaynak ister kapalı kaynak olsun, çok fazla ticari kaygı olmayabilir. Ancak ister Microsoft, Google, Meta, OpenAI veya yerli Zhipu AI ve Baichuan Intelligent olsun, ticari AI şirketleri için herhangi bir büyük AI modeli kesinlikle yalnızca "bilimsel araştırma" amaçlı olmayacaktır. **

OpenAI'nin ürünleri teknoloji konusunda mutlak bir üstünlüğe sahip olsa da, eklentiler şeklinde kurulan ChatGPT ekosistemi, ekolojik yapı açısından zayıftır. Yapay zekanın açık kaynak ve kapalı kaynak anlaşmazlıklarında gelecekte mobil işletim sisteminden farklı bir model görebiliriz.

View Original

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

Reward
like
Comment
Share

Comment

0/400

No comments

Topic
Gate 2025 Q2 Report Released
10k Popularity
Gate Derivatives Volume Hits New High
13k Popularity
CPI Data Incoming
12k Popularity
4Join Gate VIP to Win MacBook
29k Popularity
5MicroStrategy Buys More Bitcoin
676 Popularity
6BTC Hits New High
98k Popularity
7My Gate Moments
28k Popularity
8VIP Exclusive Airdrop Carnival
26k Popularity
9Fed June Meeting Minutes
7k Popularity
10Gate Alpha Trading Share
15k Popularity

sitemap