Görüntü kaynağı: Sınırsız AI tarafından oluşturuldu
**Bulut! **
Her gün büyük modellerle ilgili medya raporlarına bakarsanız, modellerin geleceğinin bir sonraki çok yönlü modelde yattığını düşünerek, modellerin çeşitliliği ve kısa ömürlü korkutucu uygulamalar karşısında gözlerinizi kamaştıracaksınız. Yani AI, OpenAI veya Anthropic'in kazandığı bir hikaye gibi görünüyor.
İnanılmaz bir hız ve hacimle tamamlanan finansman da bu algıyı kanıtlar nitelikte.
OpenAI'nin en büyük rakiplerinden biri olarak kabul edilen Anthropic, aylık 2 milyarlık bir döngüde finansman turunda - 27 Ekim'de Google, Amazon'un 4 milyar dolar yatırım yapmasından bir aydan kısa bir süre sonra 2 milyar dolar daha yatırım yaptığını söyledi ve bağlam uzunluğu gibi özelliklerle rekabet eden modeli Claude, ChatGPT için en güçlü rakiplerden biri olarak kabul ediliyor. Aynı zamanda, OpenAI çeşitli kaynakları da topluyor ve her hareketinin arkasında SoftBank, Microsoft ve Apple'ın çeşitli şekillerde söylentileri var.
Ancak, gerçekte, hikayenin tamamı bu değil.
Uygulayıcılar için hikayenin diğer tarafı daha derindir:
Açıkçası, daha fazla parası olan ve yapacak daha az şeyi olan yatırımcıların dolarlarını almak daha iyi bir seçimdir, ancak hepsi birbiri ardına büyük fabrikaları ve hatta onları izleyen büyük fabrikaları seçiyor, sadece bir şey yüzünden - bulut bilişim yeteneklerine sahipler. OpenAI'nin Microsoft Azure'a katkısı başarıya giden yolda çok fazla söylendi ve Anthropic artık Google ve Amazon'un bulut bilişim gücü desteğini aynı anda garanti ediyor ve finansmanın önemli amaçlarından birinin yeni nesil modelleri eğitmek için kendisine bir bilgi işlem gücü garantisi oluşturmak olduğunu söyledi.
Bu, büyük modeller için buluta duyulan ihtiyacın mükemmel bir kanıtıdır.
31 Ekim'deki Apsara Konferansı'nda, Alibaba Cloud'dan gelen bir dizi veri de aynı şeyi söylüyordu.
Alibaba Cloud, kendi Tongyi büyük modelinden Baichuan Intelligence, Zhipu AI, Zero One Everything, Kunlun Wanwei, vivo, Fudan Üniversitesi'ne vb. kadar hizmetlerinin üzerinde çalışan bazı modelleri duyurdu, Çin'in büyük model şirketlerinin ve kurumlarının yarısı burada eğitiliyor.
Çin'deki bu ana akım modeller, Tongyi serisi, Baichuan serisi, Zhipu AI ChatGLM serisi, Jiang Ziya genel modeli vb. dahil olmak üzere Alibaba Cloud aracılığıyla API hizmetleri de sağlıyor.
Bu modeller aynı zamanda en üst seviyeyi yakalar, ancak aynı zamanda Çin'in en büyük model şirketlerinden biri olan Baichuan Intelligence'ın da aralarında bulunduğu kendi özelliklerini geliştirmeye başlar, büyük bir modelin kaydının bir versiyonunu yinelemek için ortalama 28 gün belirledi, 30 Ekim Baichuan2-192K'nın en son sürümü, büyük modelin bağlam penceresi için dünyanın en uzun desteği haline geldi, bir seferde 350.000 kelime girebilir ve Claude2-100K'ya liderlik eder.
Bu avantajların tümü, daha gerçekçi uygulamalara işaret ediyor. Baichuan Intelligence CEO'su Wang Xiaochuan, bunu "idealden bir adım daha yavaş ve yerde üç adım daha hızlı" olarak nitelendirdi. Bulut altyapısı ise hızlı olanaklar sunar.
Wang Xiaochuan, Baichuan modelinin aylık yinelemesinin önemli bir nedeninin bulut bilişimin desteklenmesi olduğunu açıkladı. "Modelin hızlı bir şekilde yinelenmesi ve devreye alınması, bulut bilişimden ayrılamaz ve Baichuan Intelligence ve Alibaba Cloud, derinlemesine bir işbirliği gerçekleştirdi. Her iki tarafın ortak çabalarıyla Baichuan, kilokalorili büyük modelin eğitim görevini başarıyla tamamlayarak model çıkarım maliyetini etkin bir şekilde azalttı ve model dağıtımının verimliliğini artırdı. "
Bulut bilişimin öneminin göz ardı edilmesinin bir başka nedeni de, yapay zeka alanının "herkes için kart eksikliği" nedeniyle dikkatinin dağılmış olmasıdır.
"İnsanlar GPU'lara çok fazla dikkat ediyor." Birçok büyük model uygulayıcısı bana, bir bilgi işlem birimi olarak gerçekten de sürekli olarak geliştirildiğini, ancak yapay zeka sorununu çözmek için nihayetinde ihtiyaç duyulan şeyin sistematik ve optimum bir bilgi işlem gücü çözümü olduğunu söyledi. Bulut bile, başlangıcından bu yana tek bir birimin yeterince güçlü olmaması sorununu çözen bir şey olmuştur.
"Sadece kart, sadece kağıttaki harika model, yeterli değil ve sonunda inmek için buluta güvenin ve sonra ideali gerçekleştirin." Dedi. Kulaklarınızı dikkatlice diker ve model ekolojinin ön saflarında yer alan bu gerçek katılımcıların "bağırışlarını" dinlerseniz, o zaman bir kelime duyabilirsiniz:
Bulut!
Yapay zekanın geleceğinin nasıl gelişeceği, bugün buluta her zamankinden daha fazla bağlı.
Yeni Bir Bulut
Ancak bu kesinlikle bir avantaj elde eden bulut satıcılarının uzanıp kazanabileceği anlamına gelmez.
Google ve Microsoft'un yakın zamanda aynı gün kazanç raporlarını yayınlamasından sonra neler olduğuna bir göz atın.
25 Ekim'de Google, yıllık %11 artışla beklentileri aşan bir kazanç raporu yayınladı ve temel reklamcılık işi de %9 arttı. Ama sonra hisse senedi fiyatı düştü. Bunun tek bir nedeni var, bulut bilişim %22 büyüdü, ancak pazar bunun yeterli olmadığına inanıyor. Özellikle, Microsoft'un aynı gün yayınlanan mali raporu, akıllı bulut bölümünün en büyük gelir kaynağı haline geldiğini gösterdi.
Devler, bir zamanlar bahsettikleri reklamcılık gibi işlerle ilk kez kendilerini kenarda buluyorlar, çünkü bulut bilişim, hala yanıltıcı olan modellerin ürettiği doğrudan gelire kıyasla gözlemlenebilir bir ölçüt olarak kabul ediliyor. Bu göstergenin arkasında, bulut satıcılarının yapay zekanın getirdiği zorluklara uyum sağlama yeteneği yatıyor.
1 numaralı pazar payı olan AWS bile baskıyı hissediyor ve Amazon'un Anthropic'e yaptığı yatırım da bu kazanç raporları sırasında gerçekleşti. Microsoft'un Azure gelirinin %3'ünün yapay zekadan geldiği ve müşterileri arasında çok sayıda OpenAI kullanıcısı olduğu bildirildi ve AWS, çeşitli modeller için hizmetlerini vurgulamaya başlıyor. Anthropic'e 2 milyar attıktan sonra, model şirketten sonraki LLM'nin AWS'nin eğitim hızlandırma çipi Trainium ve çıkarım çipi Inferentia ile inşa edileceği hemen açıklandı. Buna ek olarak, Microsoft'un finansal raporunda vurgulanan yeni küme çözümü ve AWS için tam olarak yönetilen bir temel model hizmeti olan Bedrock gibi, yeni yapay zeka ihtiyaçları için kendi dönüşümlerini de vurguluyor.
"Akıllı çağla karşı karşıya kalan Alibaba Cloud, bulut bilişim sistemini, temel bilgi işlem gücünden yapay zeka platformuna ve model hizmetine kadar tam yığın teknolojik yeniliklerle yükseltecek." Alibaba Cloud'un teknik rotasını belirleyen Zhou Jingren de cevabını Apsara Konferansı'nda verdi. Alibaba Cloud'un bu sefer yansıttığı değişiklikler belirleyici ve kapsamlı, dokudan çekirdeğe kadar hepsi yapay zeka için dönüştürülüyor.
Zhou Jingren'in tanıtımına göre, Alibaba Cloud ilk olarak kendini dönüştürmek için büyük bir model kullandı ve 30'dan fazla bulut ürünü büyük model yeteneklerine bağlandı.
Örneğin, Alibaba Cloud'un büyük veri yönetişim platformu DataWorks, kullanıcıların doğal dil girişiyle SQL ifadeleri oluşturmasına ve ilgili veri ETL işlemlerini otomatik olarak yürütmesine olanak tanıyarak genel geliştirme ve analiz verimliliğini %30'dan fazla artıran yeni bir etkileşimli form olan Copilot'u ekledi.
Zhou Jingren bunu, bulutu kullanan geliştiricilerin verimliliğini ve deneyimini büyük ölçüde artıracak olan bulut bilişimin otonom sürüş modu olarak tanımladı.
Aynı zamanda Alibaba Cloud, yapay zeka platformu PAI'yi de yükseltti. PAI'nin temel katmanı, HPN 7.0 yeni nesil AI küme ağ mimarisini kullanır, 100.000 karta kadar ölçeklenebilir küme ölçeğini destekler ve ultra büyük ölçekli dağıtılmış eğitimin hızlanma oranı, endüstri seviyesinin çok üzerinde, %96'ya kadar yüksektir. Büyük model eğitim görevlerinde, bilgi işlem kaynaklarında %50'den fazla tasarruf sağlayabilir ve performans dünya lideridir.
Bu profesyonel terimler biraz karmaşıktır, basit müşteri vakalarıyla açıklanır ve Zhou Jingren aynı gün bazı vakaları da paylaştı: "PAI platformumuz aracılığıyla, akıl yürütmeyi optimize etmeye yardımcı olabilir, Xiaohongshu'nun maliyetlerden %30 tasarruf etmesine yardımcı olabilir ve Xiaohongshu'nun hızlı iş büyümesini ve çeşitli iş ihtiyaçlarını gerçekten teşvik edebilir." "
Alibaba Cloud da dahil olmak üzere bulut satıcıları, esasen yeni altyapıyı buluyor. Yapay zeka teknolojilerinin büyük modeller gibi getirdiği değişimler, modelin en alt katmanından eğitim fikirlerine, veri gereksinimlerinden interaktif arayüze kadar tam yığın halinde değişiyor ve hatta "yeniden yapılması" gerekiyor.
Alibaba Cloud'un tüm dönüşümlerinin başlangıç noktası, Zhou Jingren tarafından erken önerilen MaaS'tır (Hizmet Olarak Model).
"Modelin kendisi, veri ve hesaplamanın üst düzey bir soyutlamasıdır." Zhou Jingren o gün bizimle küçük bir konuşmada söyledi.
"Örneğin, geçmişte, günlüklerden veya veritabanlarından daha fazla veri kullanıyorduk. Model nedir? Model, son derece entelektüel bir soyutlama olan işlenmiş bir veri koleksiyonudur. Yani bu açıdan bakıldığında, orijinal verinin orijinal bilgi işlem gücüne dayanan daha ilkel bir üretim malzemesi olduğunu düşünebilirsiniz. Bugünün modeli, veri hammaddelerine dayalı daha soyut bir üretim öğesi olan bir işleme katmanıdır ve bu tür üretim öğelerini daha yüksek boyutlu iş sistemleri geliştirmek için kullanabilirsiniz. Daha önce bir üretim unsuru olan Altyapımız vardı ve bugün model de bir üretim elemanı. "
Modelin etrafındaki bu yeni altyapı, geçmişe göre daha karmaşık sistem yetenekleri gerektiriyor.
Yapay zeka uygulamaları için eşik giderek düşerken, yeni yapay zeka çağının ihtiyaçlarını karşılayan bulut bilişim sağlama eşiği yalnızca daha da yükselecek. Bu yeni şeyi keşfetmek için, bulut bilişimin temel teknolojisine hakim olmanız gerektiği ve büyük modellerin teknolojisi hakkında gerçek bir anlayışa sahip olmanız gerektiği açıktır - neye sahip olduğunuzu biliyorsunuz ve müşterilerinizin neye ihtiyacı olduğunu biliyorsunuz.
"Bulut bilişimdeki birikimimize dayanarak, eksiksiz bir yapay zeka altyapısı oluşturduk. Günümüzün ağ oluşturma, depolama, zamanlama, derleme, hata toleransı vb. optimizasyonları sayesinde. AI büyük modelleri için eksiksiz bir eğitim platformu oluşturduk. Zhou Jingren dedi. Aynı zamanda, bulutun kendisinin yüksek esnekliği ile birleştirilmiş bir dizi optimizasyon sayesinde, size çok eksiksiz bir model eğitimi ve çıkarım hizmeti sağlayabiliriz. "
Aynı gün Alibaba Cloud, kendi geliştirdiği 100 milyar seviyeli parametre modeli Tongyi Qianwen 2.0'ı da piyasaya sürdü.
Tongyi Qianwen 2.0, performansta büyük ilerleme kaydetti ve karmaşık talimatları, edebi yaratma yeteneğini, genel matematik yeteneğini, bilgi belleğini, illüzyon direncini vb. anlama yeteneğini önemli ölçüde geliştirdi ve kapsamlı performansı GPT-3.5'i aşarak GPT-4'ü yakalamak için hızlandı.
Aynı zamanda, Tongyi modelinin resmi web sitesi, kullanıcıların resimler aracılığıyla Tongyi Qianwen 2.0 ile etkileşime girmesine ve ayrıca daha zengin yeni eklenti yetenekleri çağırmasına olanak tanıyan çok modlu etkileşim ve eklenti işlevleri ekleyerek tamamen güncellendi.
Zhou Jingren, "Tongyi Qianwen 2.0 daha olgun ve kullanımı daha kolay" dedi.
Aç, Aç veya Aç
Bu kadar kapsamlı bir dönüşümle birlikte hem modelin hem de altyapının eninde sonunda hem hakem hem de sporcu olduğunuz bir duruma gelip gelmeyeceği sorusunu doğal olarak gündeme getiriyor.
Alibaba Cloud tarafından verilen cevap maksimum açıklıktır.
Alibaba Cloud, Çin'de kendi geliştirdiği büyük modelleri açık kaynaklı hale getiren en eski teknoloji şirketidir ve şu anda Alibaba Cloud, bir milyondan fazla indirme ile açık kaynaklı Tongyi Qianwen 7B ve 14B sürümlerine sahiptir. Olay yerinde Zhou Jingren, Tongyi Qianwen 72B modelinin yakında açık kaynak olacağını ve Çin'deki en büyük açık kaynak modeli olacağını duyurdu.
Aslında bu tarz bir açıklık ChatGPT'den sonra olacak bir şey değil. Bir yıl önceki Apsara Konferansı'nda Alibaba Cloud, model bir topluluk sihir binası oluşturmaya başladı, aslında o zamanki ilk açık kaynak partisi Alibaba Cloud'un kendi çekirdek modeliydi. O zamanlar Moda'nın planı, Alibaba Cloud'u kullanarak herkesin yapay zekanın geçmişteki kapalı durumunu değiştirmesini sağlamak ve onu gerçekten halka açık hale getirmek için açıklığı kullanmak için kutunun altındaki şeyleri teslim etmekti.
Zhou Jingren, topluluğun bugün 2.300'den fazla yapay zeka modeli topladığını, 2,8 milyon yapay zeka geliştiricisini çektiğini ve yapay zeka modeli indirme sayısının 100 milyonu aşarak onu Çin'deki en büyük ve en aktif yapay zeka topluluğu haline getirdiğini açıkladı. Bu başarı, dış dünyaya açıklığının en doğrudan tanınmasıdır.
Bugün, Magic Community'de Baichuan Intelligence, Zhipu AI, Şanghay Yapay Zeka Laboratuvarı, IDEA Araştırma Enstitüsü, vb. çekirdek büyük modellerini açık kaynaklı hale getirdi ve Alibaba Cloud, geliştiricilere şu ana kadar 30 milyon saati aşan büyük modellerin "erken benimseyenleri" için ücretsiz GPU bilgi işlem gücü sağlıyor.
"Bugünkü konumumuz, farklı ihtiyaçları olan çeşitli müşterilere hizmet vermektir." Zhou Jingren dedi.
Alibaba Cloud ekosisteminde, Fudan Üniversitesi ile ortaklaşa inşa edilen, yüz milyarlarca parametre ile büyük model eğitimini destekleyen ve genel bilgi işlem gücü açısından dünyanın ilk 15'i arasında yer alan bir süper bilgisayar var. Arkasındaki bilgi işlem kümesi, Fudan kampüsündeki Jinsi No. 1 ve Alibaba Cloud'un 1.500 kilometre uzaklıktaki Ulanqab veri merkezindeki Qiewen No. 1'den oluşuyor.
vivo, bilgi işlem gücü, platform işlevleri, eğitim performansı vb.'den Alibaba Cloud'un yapay zeka platformu PAI'nin eğitim optimizasyon çerçevesine kadar kendi geliştirdiği büyük modellere sahiptir SFT denetimi ve büyük modellerin ince ayarı ve pekiştirmeli öğrenme açısından, vivo ve Alibaba Cloud, büyük modelleri daha verimli bir şekilde yinelemek için işbirliği yapıyor.
Ayrıca, fotoğraf üretimi en üst düzeyde en az birkaç bin GPU sunucusu gerektiren popüler "Harika Ördek Kamerası" da vardır ve çevrimdışı dağıtım pratik değildir ve bulut dağıtımı, yeni başlayanlar için çok fazla maliyet ve zaman tasarrufu sağlayabilir. Dahası, Miaoya gibi uygulamalar, gelecekte çıkarım ihtiyacının eğitim ihtiyacından daha ağır basacağı ve bu da bulut bilişimi yalnızca yapay zeka hizmetlerinin sürdürülebilirliği için daha kritik hale getirecek bir eğilimi temsil ediyor.
Böyle bir konumlandırma altında, Alibaba Cloud'un büyük modeli, Alibaba'nın geçmişte her zaman kullandığı bir fikrin devamı gibidir - en iyi uygulamalar. Düşüncesi, yalnızca en karmaşık görevleri yerine getirdiğinde ve altyapısını onunla test ettiğinde dış dünyaya daha güvenilir hizmetler ve teknolojiler sunabileceğidir. Ve tüm bu çabalar nihayetinde tek bir hedefe yöneliktir - AI'nın sanayileşmesini teşvik etmek.
Bu hedefi göz önünde bulundurarak Alibaba Cloud, tek noktadan büyük ölçekli bir model uygulama geliştirme platformu olan Alibaba Cloud Bailian'ı da piyasaya sürdü. Alibaba Cloud, sistematik ve açık bir entegratördür.
Alibaba Cloud, buna dayanarak, geliştiricilerin 5 dakika içinde büyük bir model uygulaması geliştirebileceğini ve birkaç saat içinde kuruma özel bir modeli "iyileştirebileceğini" söyledi. Geliştiricilerin en uygun modeli seçmelerine yardımcı olduktan sonra, ayrıca SFT ve LoRA gibi çeşitli ince ayar yöntemleri sağlar, modelinize ince ayar yapmanıza olanak tanır. Eğitim tamamlandıktan sonra, tek tıklamayla Alibaba Cloud üzerinden de dağıtabilirsiniz. Uygulama geliştirmek de büyük ölçüde basitleştirilmiştir ve kullanıcıların aralarından seçim yapabileceği en son aracılar ve diğer eklentiler bile mevcuttur.
"Her bağlantı ve her insan grubu, bugün tüm geliştirici ekosisteminin önemli bir parçasıdır." Zhou Jingren dedi.
"Amacımız Alibaba Cloud'u en açık bulut haline getirmek ve bugün Alibaba Cloud'un yalnızca bir tür müşteriye hizmet verebileceğini umuyoruz, bugün hepsi çeşitli şekillerde anılan tüm müşterilerimiz, yapay zeka çağında onlara etkin bir şekilde destek sağlayabilir ve kendi uzmanlık alanlarında yenilik yapmalarına ve atılımlar yapmalarına yardımcı olabilir. Bu bizim hedefimiz ve bugünkü ürünlerimizin tasarımının arkasındaki yansımadır. "
Günümüzün "ideal bir adım gerisinde", canlı model ekosistemi sadece gerçek geliştirmede buluta ihtiyaç duymakla kalmıyor, aynı zamanda Çinli teknoloji şirketleri için bulut bilişimin ilhamı da günümüzün yapay zeka ve model uygulayıcıları için son derece önemli.
Çin'in bulut bilişim geliştirme sürecinin her zaman sembolik bir anlamı olmuştur, yani güçlü teknoloji geliştirme yeteneklerine ve en kapsamlı endüstriyel uygulama ihtiyaçlarına sahip olduğumuzda, altta yatan teknolojiyi kendiliğinden nasıl kavrayacağımızı. Ve belirli bir teknolojik dezavantaja sahip olduğunuzda, bu tür fırsatlar ancak büyük teknoloji sistemi tamamen dönüştürüldüğünde ortaya çıkacaktır.
Yeni teknolojik devrim tekrar geldiğinde ve altta yatan teknolojinin yeniden yapılandırılması gerektiğinde, bulut bilişim, Çin'in gelişmiş akranlarıyla güreşmeye devam etme modelinin güveni ve maliyeti haline geldi ve aynı zamanda bir ilham kaynağı ve uyarı. Yapay zeka sektörü ve uygulamaları hızlanırken, kendi ileri teknoloji tabanımıza sahip olmak ve buna dayalı açık ve karşılıklı yardımlaşma ilişkisi kurmak, tüm ekosistemin birlikte ilerlemesi için önemli hale gelecek ve bu teknolojik yeniliği nasıl kavrayacağımızı hatırlatmak da önemli ve hatta sürekli çabalarla bu rekabette bir avantaj haline gelmesi bekleniyor.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Sadece büyük modele bakmayın, yapay zekanın geleceği daha önce hiç olmadığı kadar buluta bağlı
Orijinal kaynak: Silikon Yıldız İnsanlar
**Bulut! **
Her gün büyük modellerle ilgili medya raporlarına bakarsanız, modellerin geleceğinin bir sonraki çok yönlü modelde yattığını düşünerek, modellerin çeşitliliği ve kısa ömürlü korkutucu uygulamalar karşısında gözlerinizi kamaştıracaksınız. Yani AI, OpenAI veya Anthropic'in kazandığı bir hikaye gibi görünüyor.
İnanılmaz bir hız ve hacimle tamamlanan finansman da bu algıyı kanıtlar nitelikte.
OpenAI'nin en büyük rakiplerinden biri olarak kabul edilen Anthropic, aylık 2 milyarlık bir döngüde finansman turunda - 27 Ekim'de Google, Amazon'un 4 milyar dolar yatırım yapmasından bir aydan kısa bir süre sonra 2 milyar dolar daha yatırım yaptığını söyledi ve bağlam uzunluğu gibi özelliklerle rekabet eden modeli Claude, ChatGPT için en güçlü rakiplerden biri olarak kabul ediliyor. Aynı zamanda, OpenAI çeşitli kaynakları da topluyor ve her hareketinin arkasında SoftBank, Microsoft ve Apple'ın çeşitli şekillerde söylentileri var.
Ancak, gerçekte, hikayenin tamamı bu değil.
Uygulayıcılar için hikayenin diğer tarafı daha derindir:
Açıkçası, daha fazla parası olan ve yapacak daha az şeyi olan yatırımcıların dolarlarını almak daha iyi bir seçimdir, ancak hepsi birbiri ardına büyük fabrikaları ve hatta onları izleyen büyük fabrikaları seçiyor, sadece bir şey yüzünden - bulut bilişim yeteneklerine sahipler. OpenAI'nin Microsoft Azure'a katkısı başarıya giden yolda çok fazla söylendi ve Anthropic artık Google ve Amazon'un bulut bilişim gücü desteğini aynı anda garanti ediyor ve finansmanın önemli amaçlarından birinin yeni nesil modelleri eğitmek için kendisine bir bilgi işlem gücü garantisi oluşturmak olduğunu söyledi.
Bu, büyük modeller için buluta duyulan ihtiyacın mükemmel bir kanıtıdır.
Alibaba Cloud, kendi Tongyi büyük modelinden Baichuan Intelligence, Zhipu AI, Zero One Everything, Kunlun Wanwei, vivo, Fudan Üniversitesi'ne vb. kadar hizmetlerinin üzerinde çalışan bazı modelleri duyurdu, Çin'in büyük model şirketlerinin ve kurumlarının yarısı burada eğitiliyor.
Çin'deki bu ana akım modeller, Tongyi serisi, Baichuan serisi, Zhipu AI ChatGLM serisi, Jiang Ziya genel modeli vb. dahil olmak üzere Alibaba Cloud aracılığıyla API hizmetleri de sağlıyor.
Bu modeller aynı zamanda en üst seviyeyi yakalar, ancak aynı zamanda Çin'in en büyük model şirketlerinden biri olan Baichuan Intelligence'ın da aralarında bulunduğu kendi özelliklerini geliştirmeye başlar, büyük bir modelin kaydının bir versiyonunu yinelemek için ortalama 28 gün belirledi, 30 Ekim Baichuan2-192K'nın en son sürümü, büyük modelin bağlam penceresi için dünyanın en uzun desteği haline geldi, bir seferde 350.000 kelime girebilir ve Claude2-100K'ya liderlik eder.
Bu avantajların tümü, daha gerçekçi uygulamalara işaret ediyor. Baichuan Intelligence CEO'su Wang Xiaochuan, bunu "idealden bir adım daha yavaş ve yerde üç adım daha hızlı" olarak nitelendirdi. Bulut altyapısı ise hızlı olanaklar sunar.
Wang Xiaochuan, Baichuan modelinin aylık yinelemesinin önemli bir nedeninin bulut bilişimin desteklenmesi olduğunu açıkladı. "Modelin hızlı bir şekilde yinelenmesi ve devreye alınması, bulut bilişimden ayrılamaz ve Baichuan Intelligence ve Alibaba Cloud, derinlemesine bir işbirliği gerçekleştirdi. Her iki tarafın ortak çabalarıyla Baichuan, kilokalorili büyük modelin eğitim görevini başarıyla tamamlayarak model çıkarım maliyetini etkin bir şekilde azalttı ve model dağıtımının verimliliğini artırdı. "
Bulut bilişimin öneminin göz ardı edilmesinin bir başka nedeni de, yapay zeka alanının "herkes için kart eksikliği" nedeniyle dikkatinin dağılmış olmasıdır.
"İnsanlar GPU'lara çok fazla dikkat ediyor." Birçok büyük model uygulayıcısı bana, bir bilgi işlem birimi olarak gerçekten de sürekli olarak geliştirildiğini, ancak yapay zeka sorununu çözmek için nihayetinde ihtiyaç duyulan şeyin sistematik ve optimum bir bilgi işlem gücü çözümü olduğunu söyledi. Bulut bile, başlangıcından bu yana tek bir birimin yeterince güçlü olmaması sorununu çözen bir şey olmuştur.
"Sadece kart, sadece kağıttaki harika model, yeterli değil ve sonunda inmek için buluta güvenin ve sonra ideali gerçekleştirin." Dedi. Kulaklarınızı dikkatlice diker ve model ekolojinin ön saflarında yer alan bu gerçek katılımcıların "bağırışlarını" dinlerseniz, o zaman bir kelime duyabilirsiniz:
Bulut!
Yapay zekanın geleceğinin nasıl gelişeceği, bugün buluta her zamankinden daha fazla bağlı.
Yeni Bir Bulut
Ancak bu kesinlikle bir avantaj elde eden bulut satıcılarının uzanıp kazanabileceği anlamına gelmez.
Google ve Microsoft'un yakın zamanda aynı gün kazanç raporlarını yayınlamasından sonra neler olduğuna bir göz atın.
25 Ekim'de Google, yıllık %11 artışla beklentileri aşan bir kazanç raporu yayınladı ve temel reklamcılık işi de %9 arttı. Ama sonra hisse senedi fiyatı düştü. Bunun tek bir nedeni var, bulut bilişim %22 büyüdü, ancak pazar bunun yeterli olmadığına inanıyor. Özellikle, Microsoft'un aynı gün yayınlanan mali raporu, akıllı bulut bölümünün en büyük gelir kaynağı haline geldiğini gösterdi.
Devler, bir zamanlar bahsettikleri reklamcılık gibi işlerle ilk kez kendilerini kenarda buluyorlar, çünkü bulut bilişim, hala yanıltıcı olan modellerin ürettiği doğrudan gelire kıyasla gözlemlenebilir bir ölçüt olarak kabul ediliyor. Bu göstergenin arkasında, bulut satıcılarının yapay zekanın getirdiği zorluklara uyum sağlama yeteneği yatıyor.
1 numaralı pazar payı olan AWS bile baskıyı hissediyor ve Amazon'un Anthropic'e yaptığı yatırım da bu kazanç raporları sırasında gerçekleşti. Microsoft'un Azure gelirinin %3'ünün yapay zekadan geldiği ve müşterileri arasında çok sayıda OpenAI kullanıcısı olduğu bildirildi ve AWS, çeşitli modeller için hizmetlerini vurgulamaya başlıyor. Anthropic'e 2 milyar attıktan sonra, model şirketten sonraki LLM'nin AWS'nin eğitim hızlandırma çipi Trainium ve çıkarım çipi Inferentia ile inşa edileceği hemen açıklandı. Buna ek olarak, Microsoft'un finansal raporunda vurgulanan yeni küme çözümü ve AWS için tam olarak yönetilen bir temel model hizmeti olan Bedrock gibi, yeni yapay zeka ihtiyaçları için kendi dönüşümlerini de vurguluyor.
Zhou Jingren'in tanıtımına göre, Alibaba Cloud ilk olarak kendini dönüştürmek için büyük bir model kullandı ve 30'dan fazla bulut ürünü büyük model yeteneklerine bağlandı.
Örneğin, Alibaba Cloud'un büyük veri yönetişim platformu DataWorks, kullanıcıların doğal dil girişiyle SQL ifadeleri oluşturmasına ve ilgili veri ETL işlemlerini otomatik olarak yürütmesine olanak tanıyarak genel geliştirme ve analiz verimliliğini %30'dan fazla artıran yeni bir etkileşimli form olan Copilot'u ekledi.
Zhou Jingren bunu, bulutu kullanan geliştiricilerin verimliliğini ve deneyimini büyük ölçüde artıracak olan bulut bilişimin otonom sürüş modu olarak tanımladı.
Aynı zamanda Alibaba Cloud, yapay zeka platformu PAI'yi de yükseltti. PAI'nin temel katmanı, HPN 7.0 yeni nesil AI küme ağ mimarisini kullanır, 100.000 karta kadar ölçeklenebilir küme ölçeğini destekler ve ultra büyük ölçekli dağıtılmış eğitimin hızlanma oranı, endüstri seviyesinin çok üzerinde, %96'ya kadar yüksektir. Büyük model eğitim görevlerinde, bilgi işlem kaynaklarında %50'den fazla tasarruf sağlayabilir ve performans dünya lideridir.
Bu profesyonel terimler biraz karmaşıktır, basit müşteri vakalarıyla açıklanır ve Zhou Jingren aynı gün bazı vakaları da paylaştı: "PAI platformumuz aracılığıyla, akıl yürütmeyi optimize etmeye yardımcı olabilir, Xiaohongshu'nun maliyetlerden %30 tasarruf etmesine yardımcı olabilir ve Xiaohongshu'nun hızlı iş büyümesini ve çeşitli iş ihtiyaçlarını gerçekten teşvik edebilir." "
Alibaba Cloud da dahil olmak üzere bulut satıcıları, esasen yeni altyapıyı buluyor. Yapay zeka teknolojilerinin büyük modeller gibi getirdiği değişimler, modelin en alt katmanından eğitim fikirlerine, veri gereksinimlerinden interaktif arayüze kadar tam yığın halinde değişiyor ve hatta "yeniden yapılması" gerekiyor.
Alibaba Cloud'un tüm dönüşümlerinin başlangıç noktası, Zhou Jingren tarafından erken önerilen MaaS'tır (Hizmet Olarak Model).
"Modelin kendisi, veri ve hesaplamanın üst düzey bir soyutlamasıdır." Zhou Jingren o gün bizimle küçük bir konuşmada söyledi.
"Örneğin, geçmişte, günlüklerden veya veritabanlarından daha fazla veri kullanıyorduk. Model nedir? Model, son derece entelektüel bir soyutlama olan işlenmiş bir veri koleksiyonudur. Yani bu açıdan bakıldığında, orijinal verinin orijinal bilgi işlem gücüne dayanan daha ilkel bir üretim malzemesi olduğunu düşünebilirsiniz. Bugünün modeli, veri hammaddelerine dayalı daha soyut bir üretim öğesi olan bir işleme katmanıdır ve bu tür üretim öğelerini daha yüksek boyutlu iş sistemleri geliştirmek için kullanabilirsiniz. Daha önce bir üretim unsuru olan Altyapımız vardı ve bugün model de bir üretim elemanı. "
Modelin etrafındaki bu yeni altyapı, geçmişe göre daha karmaşık sistem yetenekleri gerektiriyor.
Yapay zeka uygulamaları için eşik giderek düşerken, yeni yapay zeka çağının ihtiyaçlarını karşılayan bulut bilişim sağlama eşiği yalnızca daha da yükselecek. Bu yeni şeyi keşfetmek için, bulut bilişimin temel teknolojisine hakim olmanız gerektiği ve büyük modellerin teknolojisi hakkında gerçek bir anlayışa sahip olmanız gerektiği açıktır - neye sahip olduğunuzu biliyorsunuz ve müşterilerinizin neye ihtiyacı olduğunu biliyorsunuz.
"Bulut bilişimdeki birikimimize dayanarak, eksiksiz bir yapay zeka altyapısı oluşturduk. Günümüzün ağ oluşturma, depolama, zamanlama, derleme, hata toleransı vb. optimizasyonları sayesinde. AI büyük modelleri için eksiksiz bir eğitim platformu oluşturduk. Zhou Jingren dedi. Aynı zamanda, bulutun kendisinin yüksek esnekliği ile birleştirilmiş bir dizi optimizasyon sayesinde, size çok eksiksiz bir model eğitimi ve çıkarım hizmeti sağlayabiliriz. "
Aynı gün Alibaba Cloud, kendi geliştirdiği 100 milyar seviyeli parametre modeli Tongyi Qianwen 2.0'ı da piyasaya sürdü.
Aynı zamanda, Tongyi modelinin resmi web sitesi, kullanıcıların resimler aracılığıyla Tongyi Qianwen 2.0 ile etkileşime girmesine ve ayrıca daha zengin yeni eklenti yetenekleri çağırmasına olanak tanıyan çok modlu etkileşim ve eklenti işlevleri ekleyerek tamamen güncellendi.
Zhou Jingren, "Tongyi Qianwen 2.0 daha olgun ve kullanımı daha kolay" dedi.
Aç, Aç veya Aç
Bu kadar kapsamlı bir dönüşümle birlikte hem modelin hem de altyapının eninde sonunda hem hakem hem de sporcu olduğunuz bir duruma gelip gelmeyeceği sorusunu doğal olarak gündeme getiriyor.
Alibaba Cloud tarafından verilen cevap maksimum açıklıktır.
Alibaba Cloud, Çin'de kendi geliştirdiği büyük modelleri açık kaynaklı hale getiren en eski teknoloji şirketidir ve şu anda Alibaba Cloud, bir milyondan fazla indirme ile açık kaynaklı Tongyi Qianwen 7B ve 14B sürümlerine sahiptir. Olay yerinde Zhou Jingren, Tongyi Qianwen 72B modelinin yakında açık kaynak olacağını ve Çin'deki en büyük açık kaynak modeli olacağını duyurdu.
Aslında bu tarz bir açıklık ChatGPT'den sonra olacak bir şey değil. Bir yıl önceki Apsara Konferansı'nda Alibaba Cloud, model bir topluluk sihir binası oluşturmaya başladı, aslında o zamanki ilk açık kaynak partisi Alibaba Cloud'un kendi çekirdek modeliydi. O zamanlar Moda'nın planı, Alibaba Cloud'u kullanarak herkesin yapay zekanın geçmişteki kapalı durumunu değiştirmesini sağlamak ve onu gerçekten halka açık hale getirmek için açıklığı kullanmak için kutunun altındaki şeyleri teslim etmekti.
Zhou Jingren, topluluğun bugün 2.300'den fazla yapay zeka modeli topladığını, 2,8 milyon yapay zeka geliştiricisini çektiğini ve yapay zeka modeli indirme sayısının 100 milyonu aşarak onu Çin'deki en büyük ve en aktif yapay zeka topluluğu haline getirdiğini açıkladı. Bu başarı, dış dünyaya açıklığının en doğrudan tanınmasıdır.
"Bugünkü konumumuz, farklı ihtiyaçları olan çeşitli müşterilere hizmet vermektir." Zhou Jingren dedi.
Alibaba Cloud ekosisteminde, Fudan Üniversitesi ile ortaklaşa inşa edilen, yüz milyarlarca parametre ile büyük model eğitimini destekleyen ve genel bilgi işlem gücü açısından dünyanın ilk 15'i arasında yer alan bir süper bilgisayar var. Arkasındaki bilgi işlem kümesi, Fudan kampüsündeki Jinsi No. 1 ve Alibaba Cloud'un 1.500 kilometre uzaklıktaki Ulanqab veri merkezindeki Qiewen No. 1'den oluşuyor.
vivo, bilgi işlem gücü, platform işlevleri, eğitim performansı vb.'den Alibaba Cloud'un yapay zeka platformu PAI'nin eğitim optimizasyon çerçevesine kadar kendi geliştirdiği büyük modellere sahiptir SFT denetimi ve büyük modellerin ince ayarı ve pekiştirmeli öğrenme açısından, vivo ve Alibaba Cloud, büyük modelleri daha verimli bir şekilde yinelemek için işbirliği yapıyor.
Ayrıca, fotoğraf üretimi en üst düzeyde en az birkaç bin GPU sunucusu gerektiren popüler "Harika Ördek Kamerası" da vardır ve çevrimdışı dağıtım pratik değildir ve bulut dağıtımı, yeni başlayanlar için çok fazla maliyet ve zaman tasarrufu sağlayabilir. Dahası, Miaoya gibi uygulamalar, gelecekte çıkarım ihtiyacının eğitim ihtiyacından daha ağır basacağı ve bu da bulut bilişimi yalnızca yapay zeka hizmetlerinin sürdürülebilirliği için daha kritik hale getirecek bir eğilimi temsil ediyor.
Böyle bir konumlandırma altında, Alibaba Cloud'un büyük modeli, Alibaba'nın geçmişte her zaman kullandığı bir fikrin devamı gibidir - en iyi uygulamalar. Düşüncesi, yalnızca en karmaşık görevleri yerine getirdiğinde ve altyapısını onunla test ettiğinde dış dünyaya daha güvenilir hizmetler ve teknolojiler sunabileceğidir. Ve tüm bu çabalar nihayetinde tek bir hedefe yöneliktir - AI'nın sanayileşmesini teşvik etmek.
Bu hedefi göz önünde bulundurarak Alibaba Cloud, tek noktadan büyük ölçekli bir model uygulama geliştirme platformu olan Alibaba Cloud Bailian'ı da piyasaya sürdü. Alibaba Cloud, sistematik ve açık bir entegratördür.
"Her bağlantı ve her insan grubu, bugün tüm geliştirici ekosisteminin önemli bir parçasıdır." Zhou Jingren dedi.
"Amacımız Alibaba Cloud'u en açık bulut haline getirmek ve bugün Alibaba Cloud'un yalnızca bir tür müşteriye hizmet verebileceğini umuyoruz, bugün hepsi çeşitli şekillerde anılan tüm müşterilerimiz, yapay zeka çağında onlara etkin bir şekilde destek sağlayabilir ve kendi uzmanlık alanlarında yenilik yapmalarına ve atılımlar yapmalarına yardımcı olabilir. Bu bizim hedefimiz ve bugünkü ürünlerimizin tasarımının arkasındaki yansımadır. "
Günümüzün "ideal bir adım gerisinde", canlı model ekosistemi sadece gerçek geliştirmede buluta ihtiyaç duymakla kalmıyor, aynı zamanda Çinli teknoloji şirketleri için bulut bilişimin ilhamı da günümüzün yapay zeka ve model uygulayıcıları için son derece önemli.
Yeni teknolojik devrim tekrar geldiğinde ve altta yatan teknolojinin yeniden yapılandırılması gerektiğinde, bulut bilişim, Çin'in gelişmiş akranlarıyla güreşmeye devam etme modelinin güveni ve maliyeti haline geldi ve aynı zamanda bir ilham kaynağı ve uyarı. Yapay zeka sektörü ve uygulamaları hızlanırken, kendi ileri teknoloji tabanımıza sahip olmak ve buna dayalı açık ve karşılıklı yardımlaşma ilişkisi kurmak, tüm ekosistemin birlikte ilerlemesi için önemli hale gelecek ve bu teknolojik yeniliği nasıl kavrayacağımızı hatırlatmak da önemli ve hatta sürekli çabalarla bu rekabette bir avantaj haline gelmesi bekleniyor.