GPT-4 çok pahalı, Microsoft OpenAI'den kurtulmak mı istiyor? B Planı açıklandı: "Küçük modelleri" eğitmeye ayrılmış binlerce GPU, Bing'in dahili testleri başlıyor

**Kaynak:**Xinzhiyuan

**Giriş: **GPT-4 hesaplama açısından çok zorludur ve Microsoft'un, OpenAI'den kurtulmak için daha küçük ve daha düşük maliyetli modelleri eğitmek üzere dahili olarak B Planını formüle ettiği ortaya çıktı.

GPT-4 hesaplama açısından o kadar zorlu ki Microsoft bile buna dayanamıyor!

Bu yıl çok sayıda Microsoft AI konferansında CEO Nadella, GPT-4 ve DALL·E 3'ün Microsoft'un "Aile Grubu"na entegre edildiğini heyecanla duyurdu.

Microsoft'un tüm ürün yelpazesi, yapay zekayı herkesin yaşam ortağı yapma vizyonuyla OpenAI modeliyle yeniden şekillendirildi.

Ancak perde arkasında GPT-4'ün işletme maliyeti çok yüksek olduğundan Microsoft sessizce B planını geliştirdi.

The Information, Peter Lee liderliğindeki 1.500 kişilik araştırma ekibinden bazılarının OpenAI'ye bağımlılıktan kurtulmak için yeni konuşmaya dayalı yapay zeka geliştirmeye yöneldiği haberini özel olarak verdi.

Geliştirilen modelin performansının GPT-4 kadar iyi olmayabileceği ancak parametre ölçeğinin küçük, araştırma maliyetinin daha düşük, çalışma hızının daha hızlı olduğu söyleniyor.

Şu anda Microsoft, Bing Chat gibi ürünler üzerinde dahili testler başlatmıştır.

Yalnızca Microsoft değil, Google dahil diğer teknoloji devleri de hem yapay zeka sohbet yazılımında hem de çiplerde maliyetten tasarruf etmenin başka yollarını buluyor.

Llama 2 duyurulduğunda Microsoft ile Meta arasındaki işbirliği, tamamen OpenAI'ye bağımlı olmaktan kurtulmanın bir yolundan başka bir şey değildi.

Bu, büyümeye ve mevcut sınırlamaları aşmaya devam ederken Microsoft imparatorluğunun izleyeceği yol.

Daha "rafine" modeller, önce bunları denemelisiniz

Bu yılın şubat ayında Microsoft, ChatGPT ile kendi Prometheus modelini birleştiren New Bing'i resmi olarak piyasaya sürdü.

GPT-4'ün duyurulmasının ardından Microsoft, GPT-4'ün Bing'e entegre edileceğini ve arama deneyimini yeni bir düzeye taşıyacağını hemen duyurdu.

Microsoft arama direktörü Mikhail Parakhin geçtiğimiz günlerde Bing Chat'in şu anda "yaratıcı" ve "doğru" modlarda %100 GPT-4 kullandığını söyledi.

Dengeli modda (çoğu kullanıcı tarafından seçilen mod), Microsoft, ek olarak Prometheus modelini ve Turing dili modellerini kullanır.

Prometheus modeli, beceriler ve teknolojilerin bir koleksiyonudur. Turing modeli GPT-4 kadar güçlü değildir ve basit soruları tanımlayıp yanıtlamak ve daha zor soruları GPT-4'e aktarmak için tasarlanmıştır.

Microsoft'un elinde bulunan 2.000 GPU'nun çoğu "küçük modellerin" eğitimine yatırılmıştır. Elbette bu, Microsoft'un OpenAI'ye sağladığı çip sayısıyla karşılaştırıldığında sönük kalıyor.

Ancak bu modeller GPT-4'ten daha basit görevleri yerine getirebilir ve Microsoft'un buzları kırma çabasıdır.

OpenAI'nin zincirlerini kırın

Yıllar boyunca Microsoft ve OpenAI ayrılmaz bağlarını sürdürdüler.

Ancak ChatGPT, Microsoft Bing ve diğer aile paketlerinin piyasaya sürülmesiyle Microsoft ve OpenAI de pazar için gizlice rekabet etmeye başladı.

Her ne kadar Microsoft'un çabaları henüz başlangıç aşamasında olsa da Nadella, Microsoft'un tamamen OpenAI'ye dayanmayan kendi AI ürünleri için bir yol çizme çabalarına liderlik ediyor.

Databricks yöneticisi Naveen Rao, Microsoft'un dahili yapay zeka çabaları hakkında "Bu eninde sonunda gerçekleşecek" dedi.

"Microsoft akıllı bir şirket. Ürünleri GPT-4 dev modelini kullanarak dağıttığınızda verimlilik istiyorlar. Bu, telefon operatörü olmak için üç doktoralı birine ihtiyacımız yok demek gibi bir şey. Ekonomik olarak uygun değil."

Ancak Nadella ve araştırma direktörü Peter Lee, OpenAI olmadan karmaşık yapay zeka geliştirmeyi umuyorlar ki bu muhtemelen sadece bir temenni.

Microsoft, OpenAI'ye yatırım yaptığından beri devin araştırma departmanı, zamanının çoğunu kendi modellerini geliştirmek yerine OpenAI modellerini Microsoft ürünlerine uygun hale getirecek şekilde ayarlamakla geçirdi.

Microsoft'un araştırma ekibinin GPT-4 kadar güçlü bir yapay zeka geliştirebileceğine dair hiçbir yanılsaması yok.

OpenAI'nin bilgi işlem kaynaklarına sahip olmadıklarını ve mühendislerin modeli geliştirebilmesi için Yüksek Lisans tarafından yanıtlanan soruları geri bildirecek çok sayıda insan incelemeciye sahip olmadıklarını açıkça biliyorlar.

Araştırma departmanı da geçtiğimiz yıl boyunca, bazılarının Microsoft içindeki ürün ekiplerine taşınması da dahil olmak üzere, çeşitli araştırmacı ayrılıkları nedeniyle yetenek kaybı yaşadı.

Microsoft açısından, OpenAI'nin yardımı olmadan yüksek kaliteli LLM geliştirmek, iki şirket önümüzdeki birkaç yıl içinde ortaklıklarını yenilemeyi tartışırken daha fazla pazarlık kozu kazanabilir.

Microsoft Yapay Zeka Araştırma Direktörü Peter Lee

Şu anda, iki işlem her iki taraf için de faydalıdır.

Microsoft, OpenAI'ye 10 milyar ABD dolarından fazla yatırım yaptı ve bunun karşılığında Microsoft, OpenAI'nin mevcut fikri mülkiyetini Microsoft ürünlerinde kalıcı olarak kullanma hakkına sahip olacak.

Ayrıca Microsoft, ilk yatırımı geri ödenene kadar OpenAI'nin teorik işletme gelirinin %75'ini, belirli bir tavana ulaşılana kadar ise kârın %49'unu alacak.

Artık Microsoft, OpenAI ve diğer AI şirketleriyle mevcut ittifaklar yoluyla belirsiz bir dönemde en az 10 milyar dolar yeni gelir elde etmeyi umuyor.

Office 365 Family Bucket, GPT-4 özelliklerinin onayını aldıktan sonra gelir artışının ilk işaretlerini gösterdi.

Microsoft ayrıca Temmuz ayında 27.000'den fazla şirketin kod yazma aracı GitHub Copilot için ödeme yaptığını söyledi.

Statista istatistiklerine göre 2023 yılında Microsoft bulut hizmetlerinin en büyük paya sahip olmasının yanı sıra, üretken iş süreçlerini hızlandıran yazılım ürünlerinin gelir payı da giderek artıyor.

Ancak ironik olan şu ki, Microsoft ile OpenAI arasındaki işlem koşulları aynı zamanda dolaylı olarak Microsoft'un OpenAI'ye olan bağımlılığından kurtulma çabasına da yardımcı oluyor.

Kullanıcılar Bing'i kullandığında Microsoft, OpenAI modelinin sonuçlarının çıktısına erişebilir.

Şu anda Microsoft bu verileri daha "rafine" modeller oluşturmak için kullanıyor. Kurum içi araştırmacılardan elde edilen bulgular, bu modellerin daha az hesaplama kaynağıyla benzer sonuçlar üretebileceğini gösteriyor.

"Küçük Modeller"in incelenmesi

Microsoft'taki bazı araştırmacılar, OpenAI'nin gölgesinde bir yıl geçirdikten sonra yeni bir hedef buldular: GPT-4'ü taklit eden "damıtılmış" bir model yaratmak.

Bu yılın haziran ayında Microsoft, GPT-4'ün bilgi işlem gücünün yalnızca onda birini tüketen bir model olan Orca'yı eğitti.

Microsoft, Orca'yı yaratmak için GPT-4 tarafından oluşturulan milyonlarca yanıtı daha temel bir açık kaynak modeline besledi ve ona GPT-4'ü taklit etmeyi öğretti.

Kağıt adresi:

Sonuçlar, Orca'nın yalnızca diğer SOTA talimatı ince ayar modellerini aşmakla kalmayıp, aynı zamanda BigBench Hard (BBH) gibi karmaşık sıfır atışlı çıkarım kriterlerinde Vicuna-13B'nin performansını iki katına çıkardığını gösteriyor.

Ek olarak Orca, BBH değerlendirmesinde ChatGPT ile aynı performansı elde ediyor; SAT, LSAT, GRE ve GMAT gibi profesyonel ve akademik sınavlarda yalnızca %4'lük bir performans farkı var; bunların tümü sıfır örnek ortamında, düşünce zinciri olmadan ölçülüyor. .

Hatta bazı durumlarda Orca'nın performansı OpenAI'nin ücretsiz sürümü ChatGPT ile karşılaştırılabilir.

Benzer şekilde Microsoft, GPT-4-phi-1'in binde birinden daha az parametrelere sahip bir modeli de duyurdu.

"Ders kitabı düzeyinde" yüksek kaliteli eğitim verilerinin kullanılması nedeniyle, phi-1'in matematik ve mantık problemlerindeki yeterliliği, açık kaynak modeline göre beş kattan az değildir.

Kağıt adresi:

Daha sonra Microsoft, "bir LLM'nin belirli bir yeteneğe ulaşmak için ne kadar küçük olması gerektiği" konusunda bir adım daha ileri gitti ve yalnızca 1,3 milyar parametreli phi-1.5 modelini piyasaya sürdü.

Kağıt adresi:

phi-1.5 birçok büyük modelin "adım adım düşünebilme" veya bazı temel bağlam öğrenimini gerçekleştirebilme yeteneklerini gösterir.

Sonuçlar, phi-1.5'in sağduyulu muhakeme ve dil becerileri açısından kendisinden 10 kat daha büyük modellerle aynı performansı gösterdiğini gösteriyor.

Aynı zamanda çok adımlı akıl yürütmede diğer büyük modellerden çok daha üstündür.

Orca ve Phi gibi "küçük modellerin" aslında GPT-4 gibi daha büyük SOTA modelleriyle rekabet edip edemeyeceği belli değil. Ancak devasa maliyet avantajları, Microsoft'un ilgili araştırmaları desteklemeye devam etme motivasyonunu güçlendirdi.

Konuya aşina bir kişiye göre ekibin Phi'yi piyasaya sürdükten sonraki ilk önceliği bu tür modellerin kalitesini doğrulamak olacak.

Yakında yayınlanacak bir makalede araştırmacılar, modele yüksek kaliteli ve düşük kaliteli yanıtlar arasında ayrım yapmayı öğreterek mühendislerin Orca'yı geliştirmelerine olanak tanıyan karşılaştırmalı öğrenmeye dayalı bir yöntem öneriyorlar.

Aynı zamanda, Microsoft'taki diğer ekipler de yoğun bir şekilde yeni bir çok modlu büyük model, yani metin ve görüntüleri hem yorumlayabilen hem de oluşturabilen bir LLM geliştiriyor.

GPT-4V

Açıkçası Orca ve Phi gibi modeller, Microsoft'un müşterilere yapay zeka yetenekleri sağlamak için gereken bilgi işlem maliyetlerini azaltmasına yardımcı olabilir.

Mevcut bir çalışana göre Microsoft ürün yöneticileri, Bing sohbet robotu sorgularını işlemek için OpenAI modelleri yerine Orca ve Phi'nin nasıl kullanılacağını zaten test ediyor. Örneğin, kısa bir metin paragrafını özetlemek ve evet veya hayır olarak yanıtlamak gibi nispeten basit sorular.

Ayrıca Microsoft, Orca modelini Azure bulut müşterilerine sunup sunmamayı da değerlendiriyor.

Konuya aşina olan kişilere göre Orca gazetesi yayınlanır yayınlanmaz müşteriler gelip onu ne zaman kullanabileceklerini sordu.

Ancak soru şu ki, eğer bu gerçekten yapılacaksa Microsoft'un yine de Meta'dan lisans alması gerekiyor mu? Sonuçta, hangi şirketlerin açık kaynak yüksek lisanslarını ticarileştirebileceği konusunda hâlâ kısıtlamalar var.

Referanslar:

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)