model, havalı

Görsel kaynağı: Unbounded AI tarafından oluşturuldu

200 günden fazla büyük ölçekli girişimciliğin ardından, Çinli kaşiflerin zihniyeti ideal bir heyecandan gerçeğe dönüştü.

Bundan önce, şirketin kendisine ek olarak, AI modelinin girişimciliğine ulusal duyarlılık ve zamanın trendi gibi daha fazla anlam verildi.Genel amaçlı ChatGPT modelinin ortaya çıkmasıyla karşı karşıya kalan Çinli girişimciler, OpenAI ve ChatGPT'nin Çince versiyonunun nasıl oluşturulacağı konusunda hızla fikir birliğine vardılar.

Hiç şüphe yok ki ChatGPT bu yıl dünyanın en iyi oyuncusu. Bu nedenle, OpenAI web sitesinin trafiği Nisan ayında 1,8 milyarı aşarak küresel trafik sıralamasında ilk 20 arasında yer aldı. Ancak web analiz şirketiBenzerweb tarafından yayınlanan verilere göre, altı aylık hızlı büyümenin ardından ChatGPT'nin ziyaretleri ilk kez negatif bir büyüme yaşadı ve Haziran ayındaki ziyaretler bir önceki aya göre %9,7 düştü.

ChatGPT trafiğindeki ani düşüş, küresel teknoloji camiasında yapay zeka endüstrisinde bir balon riskiyle ilgili endişeleri ve tartışmaları tetikledi. Hatta Economist dergisi, "daha büyük ve daha iyi olan yapay zekaya giden yolun artık mümkün olmadığı" sonucuna vardı. "ChatGPT'nin Çince versiyonu" olma fikri de Çin girişimci çevresinden uzaklaşıyor.

GSR'nin kurucu ortağı Zhu Xiaohu, Moments'ta şunları yazdı: "Genel model hakkında batıl inançlara kapılmayın, çünkü gelecek yıl GPT-3.5 emtia (genel altyapı) olacak ve üç yıl sonra GPT-4 de olacak. Çoğu girişimci için sahne önceliktir ve veriler kraldır!"

Uygulayıcıların zihniyetinin değişmesiyle aynı zamanda, büyük ölçekli girişimcilik pazarı da bölünmeye başladı.

Çin'in büyük ölçekli model şirketleri artık idealize edilmiş "Çin'in OpenAI'si olma" hedefine takıntılı değiller, parametrik modeller ve bilgi işlem gücü peşinde koşmaya da takıntılı değiller.Daha pragmatik yanıtları var ve gerçek endüstriyel senaryolardaki sorunları çözmeye daha fazla dikkat ediyorlar.

AI büyük modellerinin rekabeti, yeni bir izleme düğümünü başlattı.

Kolektif Pragmatizm

Ctrip'in kurucusu ve yönetim kurulu başkanı Liang Jianzhang, bu yılın başında ChatGPT ile iletişime geçmeye başladı. Son yıllarda, akademik ve iş çevrelerinde bir demograf olarak aktif olmuştur, ancak aynı zamanda Çin'deki en eski ve en genç programcıydı ve neredeyse yapay zeka alanında doktora yapacaktı.

13 yaşında metrik şiirler yazmak için bir program tasarlayan Liang Jianzhang, ulusal bir ödül kazandı. 15 yaşında Fudan Üniversitesi'nin ikinci sınıfına kabul edildi. Mezun olduktan sonra okumak için Amerika Birleşik Devletleri'ne gitti ve 21 yaşında Georgia Institute of Technology'den bilgisayar bilimleri alanında yüksek lisans derecesi aldı. 22 yaşında, doktora yapmakta olan Liang Jianzhang, aniden teorik bilginin sınırlarını fark etti ve Amerika Birleşik Devletleri'nde Oracle'a katılmak için doktorasını bırakmayı seçti.

ChatGPT'nin ortaya çıkışı Liang Jianzhang'ı yapay zeka alanında doktora yapmaya devam etmediği için memnun etti çünkü "Tüm bu doğal dil işleme algoritmaları onun tarafından tamamen yenildi (ChatGPT)". ChatGPT ile ilk temasa geçtiğinde "çok ama çok şok" olduğunu ve ikinci duygunun alçakgönüllülük olduğunu hatırladı, "Nihayet yaptığımız en akıllı algoritma, insan beyninin biyolojik yapısına çok yakındı."

Liang Jianzhang, yapay zeka büyük modeli ile Ctrip işinin birleşimi hakkında düşünmeye başladı.

Liang Jianzhang'ın görüşüne göre, akıllı toplumun arka planında, turizm endüstrisi, "otomatize edilmesi zor olan manevi bir talep endüstrisi" olarak, genel sosyal refahın gelişmesiyle birlikte talebi artacak ve ekonomideki payı da artacaktır. Turizm sektörünün dikey modeline gözünü dikti.

Son altı ayda, Ctrip'in çeşitli işletmelerindeki üyeler, Ctrip büyük ölçekli model teknik ekibini oluşturdu. Büyük model geliştirmenin ilk aşamasında Ctrip, organizasyon yapısını büyük modelin stratejik gereksinimlerine göre ayarladı ve genel teknik ekip, içerik stratejisi ekibi, liste ekibi vb.

Liang Jianzhang, Ctrip'in büyük modele yatırım yapmak için hiçbir çabadan kaçınmayacağını söyledi, "Müşterilerimiz veya tüccarlarımız için değerliyse uzun vadede çok sıkı yatırım yapmalıyız. Bu (büyük model) çok yeni ve teknik ekip sürekli olarak yatırım tutarlarını optimize ediyor, ancak bizim sınırımız yok."

Temmuz ortasında Ctrip, turizm endüstrisinin büyük bir dikey modelini resmen yayınladı. Asked, Ctrip'in mevcut yapılandırılmış gerçek zamanlı verileri ve Ctrip'in tarihsel olarak eğitilmiş robotları ve arama algoritmalarıyla birleştirilen 20 milyar yapılandırılmamış turizm verisini taradı ve kendi geliştirdiği dikey model eğitimini gerçekleştirdi.Liang Jianzhang, "Aynı zamanda, genel seyahat yanıtı içeriğini oluşturmak ve doğrulamak için çok fazla insan gücü yatırımı yaptık."

Sorunun yayınlanmasından önce, Ctrip bir dahili test gerçekleştirmişti ve müşteri hizmetleri personeli Wang Yun, açıkça yaptığı işin büyük değişiklikler geçirdiğini hissetti. Geçmişte, müşterilerin satış sonrası sipariş iptalleri ve bagaj kaybıyla ilgili sorularını yanıtlamak için günde 150'den fazla aramayı yanıtlamak zorundaydı; şimdi ise Wang Yun, yolculuktan önce müşteri hizmetlerini tavsiye etmeye dönüştü ve netizenlere seyahatten önce hazırlanması gereken hizmetler ve öneriler sunmak için sahne arkasından canlı yayın odasına giriyor.

Liang Jianzhang'ın görüşüne göre, genel amaçlı büyük ölçekli bir model temelinde, turizm endüstrisindeki doğruluk sorununu çözmek hala anahtardır: "Seyahat, tüketim ağırlıklı bir sektördür. Planlama yarım saat tasarruf etse bile, önerilen otel veya seyahat programı sonucunun yanlış olma olasılığı %5 olabilir." Bu nedenle, **ChatGPT gibi genel amaçlı büyük ölçekli bir modelle karşılaştırıldığında, Liang Jianzhang dikey büyük ölçekli bir model olasılığına daha fazla dikkat ediyor **.

Parametreler açısından genel büyük model kadar iyi olmasa da, genel büyük modelin bilgi işlem gücü ve diğer koşulları için katı gereksinimleri yoktur, ancak dikey büyük model veri ve senaryolar için daha yüksek gereksinimler ortaya koyar.

Ask'ın büyük ölçekli model eğitimindeki en büyük zorluk, gerçek sahnede, kullanıcıların seyahat bilgileri edinme sürecinde, çok sayıda etkileşimli veri toplama ve temizleme sürecinde, veri hacminin ve veri doğruluğunun sürekli olarak düzeltilmesi gerekiyor, özellikle turizm endüstrisi muazzam değişiklikler geçirdi ve üç yıl önceki destinasyon bilgileri şimdiye kadar tamamen güncelliğini yitirmiş olabilir, özellikle salgının küresel turizm endüstrisi üzerindeki etkisi, verilerin güncelliğini şiddetlendirdi.

Ctrip gibi, giderek daha fazla şirket büyük modellerin izini dikey alana koyuyor.

JD.com tarafından verilen Yanxi büyük ölçekli model cevap kağıdı da endüstriyel büyük ölçekli modeli önemli bir özellik olarak ele alıyor. Jingdong Group'un yeni CEO'su Xu Ran'a göre, geçmişte yapay zeka teknolojisinin gelişimi birkaç kez uygulama patlamasının eşiğine geldi, ancak sonunda genellikle kısa sürdü ve bunun önemli nedenlerinden biri, teknolojinin sektörde sağlam bir uygulama oluşturmamış olması**.

Hatta Huawei Cloud CEO'su Zhang Pingan, Huawei Pangu Large Model 3.0'ın 7 Temmuz'daki basın toplantısında, "Pangu Large Model'in şiir yazmaya ve sohbet etmeye vakti yok. Ne kadar parametre ve diyalog yeteneği ne kadar iyi olursa olsun, pratik sorunları çözemezse, pek bir faydası olmaz" dedi.

Tencent, genel büyük ölçekli modeli Hunyuan'ın ilerleyişini henüz açıklamadı, ancak sektörün büyük ölçekli model rotasını yüksek profilli bir şekilde duyurdu ve 10 büyük sektör için tek seferde 50'den fazla çözüm ortaya koydu. Tencent'in başkan yardımcısı ve Tencent'in hükümet ve kurumsal iş birimi başkanı Li Qiang da şunları söyledi: "Genel büyük modeller, model uygulaması için tek yön değildir ve dikey endüstriler için modeller, büyük modellerin değerinin taşma noktası olacaktır."

Zihniyet Değişimi

Büyük ölçekli girişimcilerin zihniyet değişikliğindeki bariz bir düğüm noktası, Wang Huiwen'e depresyon teşhisi konduğunda ve kuruluşundan ışık yılları uzakta Meituan tarafından satın alındığında başladı. Herkesin beklediği ve büyük umutlar beslediği yıldız şirketin bile çeşitli kazalar nedeniyle işini bırakmak zorunda kalabileceğini herkes birdenbire fark etti.

Sadece altı ay önce, diğer satış noktaları bir gecede dağılıyor gibiydi ve yalnızca büyük model C konumundaydı. Çin'in teknoloji çevrelerindeki girişimciler ve yatırımcılar, OpenAI'den öğrenmek için Silikon Vadisi'ne uçtu.Bu devlerin 1 numaralı veya karar alma merkezi figürleri olan Zhang Yiming, Ma Huateng ve Wang Xing, gece geç saatlerde gazete okuyarak ve teknoloji alışverişinde bulunarak işlerine ilk başladıklarında bir gecede heyecan ve merak durumuna geri döndüler.

O zamanlar, Çin büyük ölçekli modellerinin her kaşifinin, aile ve ülke duygularıyla ilgili sorunları düşündüğü görülüyordu. ChatGPT'nin hızlı yinelemesiyle karşı karşıya kalan Çinli girişimciler tarafından belirlenen hedefler, sollamayı ne kadar sürede başarabilecekleridir.

Li Yanhong, "Baidu Wenxinyiyan araştırma ve geliştirme aşamasındaydı ve Baidu'nun teknik ekibi ChatGPT ile karşılaştırmalı bir test yaptı. O zamanlar aradaki fark 40 puandı ve bir ayda yetişebilirdi." Wang Xiaochuan ayrıca yıl sonuna kadar Çin'deki en iyi büyük dil modelini yapacağını söyledi.

360'ın kurucusu Zhou Hongyi, "Çinli Girişimci" ile yaptığı bir röportajda, büyük modellerin artık ticari rekabetin boyutu olmadığını söyledi. Çin İnternetinin kapalılığı ve mobil İnternetin neden olduğu APP'ler arasındaki veri adası sorunu çözülmezse, bunun yapay zeka motoru eğitiminin sınırlamalarına yol açması muhtemeldir, bu da Çin ile Amerika Birleşik Devletleri arasında yeni bir AI devrimi turuna yol açabilir.

OpenAI gibi bir şirketin Çin'de neden doğmadığına gelince, Çinli girişimciler o zamanlar düşünmeye bile başladılar.Geçmişte, yerli yapay zeka keşfi çok pragmatikti ve her şey KPI odaklıydı, bu nedenle herkesin buna yatırım yapacak kararlılığı ve sabrı yoktu, bu yüzden çok önemli bir düğümü kaçırdılar.

Tutkuyla, Baidu Wenxin ilk atışı yaptıktan sonra altı ay içinde 80'den fazla büyük AI modeli ortaya çıktı ve yalnızca Şangay'da düzenlenen 2023 Dünya Yapay Zeka Konferansı'nda 30'dan fazla büyük model ortaya çıktı. Büyük modellerin popülaritesini "yüz model savaşı" olarak tanımlamak abartı olmaz.

Ama gerçekten bu kadar çok büyük modele ihtiyacımız var mı? Ne tür bir büyük modele ihtiyacımız var?

Aslında Robin Li çok erken bir zamanda şöyle bir öneride bulundu: "Girişim şirketlerinin ChatGPT'yi yeniden yaratması pek mantıklı değil. Bence bu geniş dil modeline dayalı uygulamalar geliştirmek için harika bir fırsat var. Tekerleği yeniden icat etmeye gerek yok. Tekerlek kullanıma sunulduktan sonra, araba ve uçak yapmanın değeri, tekerlekten daha yüksek olabilir."

JD Group'un teknolojiden sorumlu başkan yardımcısı He Xiaodong da en başından beri şunu fark etti: "Eğer büyük model değerli olacaksa, endüstriye yerleştirilmelidir ve en iyisi endüstriyel değeri yüksek bir alanda olmaktır. Ancak bu şekilde gerçekten uzun vadeli sürdürülebilir bir şey haline gelebilir, aksi takdirde kısa ömürlü bir şey olabilir."

YENİ DEĞİŞKEN

Tam yerli girişimciler AI modelini keşfetmek için uğraşırken, Zuckerberg'in büyük hamlesi bu sürekli değişen alana yeni değişkenler getirdi.

19 Temmuz'un erken saatlerinde, Pekin saatinde Meta, yapay zeka çevresini bir kez daha patlatan açık kaynaklı büyük model Llama 2'yi piyasaya sürdü: Llama 2, yalnızca GPT-3 ile aynı performansa sahip olmakla kalmıyor, aynı zamanda ücretsiz, açık kaynaklı ve ticari olarak mevcut. Llama 2, Meta tarafından Mart ayının başlarında yayınlanan Llama modelinin devamı niteliğindedir.

Sonraki Microsoft Inspire iş ortağı konferansında Microsoft CEO'su Satya Nadella, Meta ve Microsoft arasındaki işbirliği haberini duyurdu.Bu işbirliği, Llama 2'nin Microsoft'un bulut hizmeti Microsoft Azure üzerinde çalışmasını sağlıyor. Aynı zamanda Amazon AWS bulut da Meta ile iş birliğine katıldı.

Llama 2'nin büyük ölçekli model girişimciler için önemi, tıpkı Android sisteminin APP geliştirme için olduğu gibi, geliştiricilerin tekerleği yeniden icat etmeleri ve kendi endüstriyel senaryolarına daha fazla odaklanabilmeleri için büyük ölçekli modellerin altyapısını en düşük maliyetle doğrudan elde etmeleri gerekmiyor.

Bir dereceye kadar bu, çoğu girişimci için endüstri dikey uygulamalarına odaklanmayı seçmenin daha pratik bir yol olduğu anlamına da geliyor.

Bununla birlikte, genel büyük modellerden farklı olarak, **Endüstriyel büyük modeller, sektör katılımcıları için farklı eşikler ve gereksinimler de ortaya koymaktadır:**Endüstriyel büyük modeller, geliştiricilerin belirli bir teknik birikime ve güce sahip olmasını gerektirirken, diğer yandan endüstriyel büyük modeller, operatörlerin zengin endüstriyel uygulama uygulama senaryolarına sahip olmasını da gerektirir.

Liang Jianzhang, "Çinli Girişimci"ye şunları söyledi: "Genel bir büyük modelin en önemli göstergesi, kaç parametrenin veya kaç GPU'nun kullanıldığı vb. Olabilir, ancak dikey büyük model ve büyük dil modeli bunun yalnızca bir parçasıdır. Ayrıca manuel doğrulama vb.

Liang Jianzhang sonunda "Turizmdeki en büyük sorun güvenilirliktir. Bu gerçekten de AI'nın şiir, makale ve roman yazmasından daha karmaşık. Aynı zamanda uzun vadeli bir iş. Bunu %80, %90, %95 ve hatta %99'a çıkarabilecek her şey yapmaya değer." dedi.

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)