Çok kıvırcık! Büyük Modeller ve AIGC Hakkında 36 Not ve Gerçek

Resim kaynağı: Sınırsız Yapay Zeka tarafından oluşturulmuştur

Kaynak: ben kara at

12 Eylül öğleden sonra, Startup Dark Horse'un Pekin genel merkezi bir "yeni yapay zeka güçleri" dalgasını başlattı.

Huawei Cloud, APUS, Tors, SenseTime, Kuaishou, 360 Group, Qingbo Intelligence, Dark Horse Tianqi, MiniMax, Sinovation Ventures, Qiji Chuangtan, Çin Bilgi ve İletişim Teknolojileri Akademisi... Listelenen şirketler, lider şirketler ve tek boynuzlu atlar hayvan var şirketlerin yanı sıra yapay zeka alanında önde gelen yatırım kurumları ve bilimsel araştırma enstitüleri.

Toplantıya katılan konuklar doğrudan konuya geçtiler ——

"Büyük modellerin mevcut sektör durumu? Şirketler nasıl daha iyi ticarileşebilir? Dikkat etmeye değer yeni trendler ve fırsatlar neler?"

Bu kapalı yapay zeka toplantısına katılmaktan onur duyuyorum. 38 notu ve gerçeği sizlerle paylaşacağım.

**01. Sektörün kaç cildi var? **

Son istatistiklere göre Çin'de 130'dan fazla büyük model piyasaya sürüldü ve 70'den fazla algoritma modeli Çin Siber Uzay İdaresi'ne kaydedildi. BAT gibi internet devlerinin tümü büyük yapay zeka modelleri yayınladı. Yalnızca 2023 yılında 60'tan fazla girişim finansman aldı ve ürünler temel katmanlar, model katmanları ve uygulama katmanlarıyla dolu. Yeni nesil üretken yapay zekanın, önceki nesil yapay zekanın tuzaklarına dönüp bakması ve sektörün önceki kışın reenkarnasyonunu önlemek için gösterdiği kayıtsızlıktan kaçınması gerekebilir. Bu alandaki uygulayıcılar, sektörün gidişatını ve müşterilerin sıkıntılı noktalarını açıkça görmeli ve büyük adamların tavuk çorbasına aldanmamalıdır.

  1. Şimdi bir müşteri bize geliyor ve 20 sahne olduğunu ve her sahnenin maliyetinin X milyon yuan olduğunu mu söylüyor? Daha sonra kapı kapı dolaşıp fiyat sordum, Huawei bunu yapar mıydı? Alibaba bunu yapacak mı? Baidu bunu yapacak mı? Böyle devam ederseniz sonuçta para kazanamazsınız.

  2. Herkesin topladığı paranın %80-90'ı bilgisayar gücü için kullanılıyor, mevcut durum bu. Biliyorsunuz, bu artık sadece eğitim.Eğitimin maliyeti kontrol edilebilir, ancak çıkarımın maliyeti kontrol edilemez.

  3. 30.000 GPU'muz ve 6.000p'lik hesaplama gücümüz var. Yıl sonuna kadar 12.000p'nin üzerinde bir hesaplama gücüne sahip olmak için çaba göstereceğiz. Veri açısından bakıldığında her ay 2 trilyon token temizlenip açıklama ekleniyor ve yıl sonuna kadar 10 trilyon token olacak.

  4. Şu anda sektörde bazı yıkıcı öldürücü uygulamalar hâlâ eksik, bu da ticarileştirmenin gerçekleştirilmesini zorlaştırıyor.

  5. Maliyet-etki arasında denge nasıl bulunur?Bu zor bir noktadır. Hepsinde büyük modeller kullanılıyor ve maliyeti çok yüksek.

  6. Bir süre sonra herkes altyapıyı optimize etme yeteneği için rekabet edecek. Örneğin, ağ optimizasyon yetenekleri açısından, diğerleri başarısız olduğunda devam ederseniz, diğerlerinden daha fazla eğitim alabilirsiniz.

  7. Bilgi işlem gücünün kısıtlı olduğu durumlarda ileriye dönük bazı teknik girişimlerde bulunuyoruz. Büyük model firmamızda modellemeden çok altyapı yapan öğrencilerin olduğunu düşünmemiş olabilirsiniz. Fiyatları genellikle oldukça pahalıdır ve işe alınması zordur.

  8. Büyük modeller artık utanç verici bir durumda.Kendilerini yüksek fiyata satamıyorlar.Sonuçta yalnızca bulut, kart ve bilgi işlem gücü satanlar para kazanıyor.

  9. İlk başta modelin oldukça değerli olduğunu düşünmüştüm ama şimdi tekrar evrilmeye başladı. Bir süre önce bir müşteriyle tanıştım ve BAT ve diğerleri ondan alıntı yaptı. İlk teklif oldukça pahalıydı, 10 milyondan fazla. Son birim fiyat ne oldu bilen var mı? Fazla kıvırcık.

  10. On milyarlarca parametreye sahip büyük modeller bazı özel müşteriler tarafından ücretsiz kabul edilmektedir.

02, Ön saflardan sesler

Yapay zeka alanındaki şirketlerin, Başkan Mao'nun "pratikten pratiğe gelin" sözünü her zaman hatırlaması gerekiyor. Müşterilerinizin yanındayken ancak bornozunuzu ve mandalina ceketinizi çıkarıp sahalara yürüyerek en özgün geri bildirimi alabilirsiniz. Artık yapay zeka alanında çok fazla sözde uzman var, bu yüzden ön saflardan daha fazla ses dinlemek daha iyi.

  1. Yaklaşık 150 müşteriyle konuştuk. Büyük modelin gereksinimleri esas olarak iki kategoriye ayrılmıştır. Bunlardan biri, büyük modelin kendisinin metinsel gereksinimleridir. Müşterilerin büyük dil modeli için gereksinimleri %100 doğrudur. Diğeri ise işlev çağrılarını, kod görüntülerini ve üçüncü taraf araçlara yapılan çağrıları içeren yapay zeka aracısıdır.

  2. İşbirliğimiz sırasında bir çatışma çıktı. Müşteriler, dahili olarak dağıtmaya karar vermeden önce verilerin size verilemeyeceğini hissedeceklerdir. Ancak bu veriler olmadan müşteri ihtiyaçlarına uygun bir modeli nasıl eğitebiliriz?

  3. Proje üzerinde çalışırken kullanıcıların büyük modeller için ödeme yapmaya istekli olmadıklarını ancak yine de uygulamanız için ödeme yaptıklarını gördük. Bazı müşteriler, büyük modeller söz konusu olduğunda, önceki akıllı orta platformlardan ve bilgi grafiklerinden bazılarına artık ihtiyaç duyulmadığını doğrudan soracaktır. Sonunda sahnenin esas olduğunu buldum.

  4. Bazı seksi sahneler bulmamız gerekiyor. Birkaç kriter var. İlk olarak, küçük bir kesi. İkincisi, büyük modellerin avantajlarını eşleştirin. Üçüncüsü, ödeme kararı veren kullanıcıların güçlü bir algıya sahip olmasını sağlayın. Örneğin geçmişte bazı verilerin, sonuçların veya hizmetlerin elde edilmesi farklı süreçler gerektirirken, artık büyük modeller sayesinde karar vericiler bunları mobil cihazlarda hızlı bir şekilde elde edip tamamlayabiliyor.

  5. Büyük bir modelde başarılı olmak için üç şeye ihtiyaç vardır: 1) Bilgi işlem gücü satın almaya yetecek parayı elde edip edemediğiniz. 2) Yeterli veriyi alabiliyor muyuz? 3) Yetenek yoğunluğu yeterince yüksek mi, mesele nicelik değil, yeterli sayıda kaliteli bilim insanının bulunup bulunmadığıdır.

  6. Artık üç tür müşteriyle karşılaşıyoruz. Bir tür, rakipleri bunu yaptığı için bunu yapmak isteyen ancak ihtiyaçlarının ne olduğunu bilmeyen finansal müşteriler gibi endişeli müşterilerdir. Bir tür, maliyetleri düşürmek isteyen müşterilerdir. Müşteri yönetimi bunun temel olarak maliyet azaltma ve harcama azaltma meselesi olduğuna inanmaktadır. Ancak modelin ne kadar tasarruf sağladığının spesifik değerini yargılamak zordur. Son kategori ise açık kaynak modellerini kullanarak para kazanmayı uman müşterilerdir. Gelir elde etmek için bu modele güvenirler. Bu müşterilerin ödeme yapması en uygun olanıdır.

**03, ToC veya ToB? **

GPT-4'ü bir kez eğitmenin maliyetinin yaklaşık 63 milyon ABD doları olduğu ve 1,8 trilyon gibi devasa bir parametre gerektirdiği anlaşılmaktadır. Şu anda Çin'de piyasaya sürülen bazı büyük modeller için ToC yönü hâlâ İnternet'in ücretsiz modelidir. Ancak uygulayıcıların hepsi, büyük modellerin geliştirilmesi ve işletilmesinin çok fazla maliyet gerektirdiğini ve bunun da ToB'un iş modelinin sorunsuz bir şekilde işlemesini kolaylaştırdığını biliyor. Ticarileştirme araştırması açısından ToB veya ToC, endüstri için her zaman endişe konusu olmuştur. Kapalı toplantı sırasında iki anahtar kelimeyi tekrar tekrar duyduk: 1) genler ve 2) ihlal. "Olmadığın şey olamazsın."

  1. Fırsatların hala dikey modelde yattığına ve asıl noktanın veri ve senaryonun kendisi olduğuna inanıyoruz.

  2. Biz de yapay zekanın internet, dijitalleştirme vb. ile nasıl birleştirilebileceğini ve orijinal sahnelerin nasıl daha akıllı hale getirilebileceğini düşünüyoruz.

  3. ZK ya da ZK, açıkçası bu herkesin genleriyle alakalı. Bizim yapamıyor olmamız başkalarının da yapamayacağı anlamına gelmiyor. Örneğin bazı ZK uygulamaları bizim yaş anlayışımızın ötesinde 2000 veya 10 yaşında doğan çocuklar tarafından oynanmaktadır.

  4. Toc ve Tob hala çok farklı. ToC nispeten yüksek bir hata tolerans oranına sahiptir. TOB ise tam tersi. Örneğin akıllı soru ve cevabı ele alalım. Doğruluk nasıl sağlanır? Hükümetin olduğu gibi kırmızı çizgileri var. Model yanılsamasının nasıl önlenebileceği şu anda buna göre araştırılıyor.

  5. Tam tersine ToC'de para kazanmanın daha kolay olduğunu düşünüyoruz. ToB'da sorun var, projenin süreci nispeten uzun. Para döngüsü, müşterinin bütçesinin onaylanmasından proje kurulumu ve uygulamasına kadar çok uzundur.

  6. Artık fırsatların çok fazla olduğunu düşünüyorum, nitelikli olmadığınız yerlere kaynak ayırmayın, stratejik seçimler yapmak çok önemli.

04, ToB ve ToG de çok zordur

  1. B tarafındaki en büyük hata, gelişmiş insan dış kaynak kullanımıyla sonuçlanmasıdır.

  2. Tüm projelerin döngüleri vardır ve tüm ödemeler döngünün düğümlerine göre yapılır. Bir modeli kısıtlama olmadan eğitmenize ve optimize etmenize yardımcı olmam imkansız.

  3. AIGC yaratımları daha toleranslıdır ve bazı hatalara sahip olabilir. Ancak bazı şirketlerin üretim ve imalatları söz konusu olduğunda doğruluk gereksinimleri çok yüksektir. Modelden bir veya iki iyi durumu seçmek bizim için genellikle daha kolaydır, ancak kötü durumlar olmadan onu yüksek düzeyde tutmak yine de oldukça zordur.

  4. Ekonomik açıdan gelişmiş bir ilde akıllı bir dijital hükümet projesi üzerinde çalışırken 5'ten fazla senaryoyu tanıttık ve müşteri sonunda 3 senaryoyu onayladı. Ardından güvenlik, veriler ve alt katmanla ilgili konuların temeline ineceğiz. Sonra soracağım, diğer büyük modellerle aranızdaki farklar ve avantajlar neler? Son olarak tüm tarafların oturup bir değerlendirme sistemi oluşturması gerekiyor. Değerlendirme sistemini geçtikten sonra hala performansı değerlendirmemiz gerekiyor.

05. Ürün ve çözümleri geliştirmek için projeleri kullanın

  1. Ürünleri kuluçkalamak için projeler kullanın.Birkaç projeyi tamamladıktan sonra ilgili teknik çözümleri çıkarın. Bu çözüm kümesi büyük olasılıkla bir model değil, büyük model + küçük modeller ve nihayet birden fazla modelin oluşturduğu kapsamlı bir çözümdür.

  2. Geçtiğimiz bir veya iki yılda inovasyon ve ürün üretme süreci olabilir ve nakdin geri kazanılma döngüsü nispeten uzun olacaktır.

06、Temsilci

Yapay zekanın, çok sayıda insanın karmaşık sosyal davranışlarını yönetmek için günlük insan görevlerini taklit ettiğini hayal edin. Stanford Üniversitesi'nden "Üretken Ajanlar: İnsan Davranışının Etkileşimli Simülakrları" başlıklı bir makale, hatırlayan, tepki veren ve plan yapan Yapay Zeka Ajanlarına derinlemesine bir bakış sunuyor. AI Agent, OpenAI'nin çabalarının bir sonraki yönü olarak kabul ediliyor. OpenAI'nin kurucu ortağı yakın tarihli bir etkinlikte şunları da söyledi: "Model eğitim yöntemleriyle karşılaştırıldığında, OpenAI şu anda Aracı alanındaki değişikliklere daha fazla dikkat ediyor. Ne zaman yeni bir Yapay Zeka Aracıları makalesi çıksa, çok heyecanlanıp bunu tartışacağız. ciddi anlamda dahili olarak."

  1. Her zaman büyük modellerin her şeye kadir olduğunu ve çeşitli sorunları çözebileceğini mi hayal ederiz? Durum bu mu? Büyük modeller sadece büyük modellerdir.

  2. Görünmez yapay zeka olarak adlandırılan yapay zekayı dahili olarak yönetiyoruz. Kullanıcıların önünde hangi model olduğunu, kaç parametreye sahip olduğunu vurgulamayacağız. Yapay zeka tanımımız insan yardımıdır.

  3. Modeli ve bilgi işlem gücünü atlayarak bir sonraki fırsat Ajan olabilir.

  4. Şu anda müşteri kullanımını etkileyen en büyük sorun: girdi-çıktı oranı. Müşteriyle konuşmanın sonuna ulaştığınızda ve proje bütçesinden bahsettiğinizde, eğer proje tamamen metinden ibaretse ve yatırım birkaç milyon veya birkaç milyon ise müşteri pek memnun olmayacaktır. Buna ek olarak, büyük modeller gerçek sorunları çözmek için yapay zeka aracıları kullanılarak gerçek üretim ortamlarına yerleştirilirse müşteriler ödeme yapmaya çok istekli olacaktır.

  5. Büyük modeli temel alan AI Agent, bellek, planlama ve yürütme gibi gelişmiş yeteneklere sahiptir. Bu sefer 20'den fazlası Acente olmak üzere 60'tan fazla start-up projesine yatırım yaptık.

  6. ToC ürünleri, ödeme formları ve ürün formları Çin ile yabancı ülkeler arasında çok farklıdır. Son dönemde bazı acente firmalara yatırım yaptık.

  7. Ancak bu aşamada Yapay Zeka Ajanı henüz yeni bir deneysel aşamadadır ve genel zeka ile arasında hâlâ belli bir uçurum vardır. Gelecekte, tek bir Yapay Zeka Aracısının kapsamlı yeteneklerine ek olarak, birden fazla Yapay Zeka Aracısı arasındaki işbirliği ve duygu yeteneklerindeki atılımların da çözülmesi gerekecektir.

  8. Büyük model oyuncular, ikinci yarıda ortaya çıkan yeni şeyleri görme şansına sahip olabilmeleri için poker masasında kalmalarını sağlamalıdır.

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
  • Pin
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)