Büyük modellerin "ortaya çıkışı" altında iş fırsatları: "Yüz Model Savaşını" kim kazanacak?

Kaynak: Kağıt

Yazar: The Paper muhabiri Huan Yanhong stajyeri Chen Xiaorui

Resim kaynağı: Unbounded AI aracı tarafından oluşturulmuştur

Üretken yapay zeka teknolojisi yapay zeka sektörünü değiştiriyor.Yalnızca altı aylık bir sürenin ardından yerli büyük ölçekli modellerin geliştirilmesi, teknolojiden ürüne ve ardından işletmeye sıçramayı tamamlayarak dikey sektörlere de nüfuz etti. 6 Temmuz'daki Dünya Yapay Zeka Konferansı sırasında The Paper, Beisen Yetenek Yönetimi Araştırma Enstitüsü başkan yardımcısı Wang Danjun'u, CICC araştırma departmanı genel müdür yardımcısı Yu Zhonghai'yi ve Zhongguancun Kejin Technology başkan yardımcısı Zhang Jie'yi davet etti. Büyük modellerin "ortaya çıkışı" kapsamında İş inovasyon fırsatlarını tartışmak için Metaverse sohbet odası. The Paper'dan bir muhabir olan Shao Wen'in sunduğu diyaloğa bir saatlik diyalog sırasında konuklar aşağıdakiler de dahil olmak üzere bir dizi ilgili konuyu tartıştı:

Genel amaçlı büyük modeller ve dikey alan büyük ölçekli modeller gelecekteki iş senaryolarında kendi değerini nasıl buluyor?

İşletmeler büyük modellerin iş fırsatlarını nasıl yakalayabilir? Fırsatı yakalamanın kilit noktası nedir?

Büyük modelin geçmişi ve geleceği

**澎湃科技: Şu anda iç pazar "yüz model savaşı" durumu oluşturdu.Yerli büyük ölçekli modeller sizce neden bu kadar hızlı gelişiyor? Alanınıza nasıl bir etkisi var? **

**Wang Danjun (Beisen Yetenek Yönetimi Araştırma Enstitüsü Başkan Yardımcısı): **Teknik açıdan, büyük modellerin geliştirilmesi son iki yılda olan bir şey değil. Akademik alanda yıllar önce herkes araştırma yapmaya başlamıştır. Sadece son yıllarda veri hacminin artması ve teknoloji seviyesinin gelişmesiyle, özellikle OpenAI ChatGPT'yi piyasaya sürdükten sonra, geniş ilgi gördü.

Her alan için herkes böyle yeni bir teknolojiyi kendi alanına nasıl uygulayacağını ve iş modelini nasıl geliştireceğini düşünür.

Örneğin, Beisen Yetenek Yönetimi Araştırma Enstitümüz insan kaynakları endüstrisine aittir ve hizmet verdiğimiz müşterilerin tamamı işletmelerin İK (insan kaynakları) gruplarıdır. İnsan kaynakları alanında büyük modellerin uygulanmasının gelecekte bazı yıkıcı değerler üretebileceğini düşünüyoruz, örneğin, gerçekten herkesin iş verimliliğini daha iyi artırabilir; İK veya İK olsun, ortaklarımıza bir dereceye kadar yardımcı olacaktır. Çalışanların gelişimine daha iyi rehberlik edebilir ve aynı zamanda şirketlerin, çalışanları işe alırken sıklıkla sorduğumuz sorular da dahil olmak üzere birçok insan kaynakları yönetimi sorusuna yanıt vermesine yardımcı olabilir: kim daha uygundur ve kim daha fazla fayda sağlayabilir. , maaş nasıl belirlenmeli vs. Büyük modellerin geliştirilmesi ve uygulanmasının insan kaynakları sektörünü çok kısa sürede dönüştüreceğini düşünüyorum.

**Yu Zhonghai (CICC Araştırma Departmanı Genel Müdür Yardımcısı): **Dean Wang çok önemli bir noktadan bahsetti, yani büyük ölçekli model teknolojisi sadece bugün olmadı. 2017'de Google, Dikkat Tek İhtiyacınız Olan (dikkat tek ihtiyacınız olan şey) adlı ünlü bir makale yazdı ve transformatör mimarisini önerdi.

Aslında, Çin'in yapay zeka endüstrisindeki uygulayıcılar, büyük ölçekli model teknolojisinin potansiyelini çok erken keşfettiler. 2021'de bununla ilgili bir araştırma raporu da yazmıştık. O zamanlar yapay zeka modellerinin gelişmesi bizi şok etmişti. Artık ChatGPT'nin özel ürünü, büyük modeli sıradan insanlar tarafından bilinir hale getiriyor.

Büyük modellerin binlerce sektörde bu kadar hızlı uygulanabilmesi, ortaya koyduğumuz çok önemli bir kavram olan teknolojideki eşit haklara da bağlı. Açık kaynak topluluğunun gelişmesi ve bilginin doğal olarak yayılması sayesinde birçok şirket hızla kendi büyük modellerini oluşturdu.

Ayrıca bu sefer tüm teknoloji çemberinin ve hatta tüm toplumun ortak bir güç oluşturduğunu, yani geçmişte nadiren görülen "herkes bunun çok önemli olduğunu düşünüyor" ifadesini gördüğümüzü de eklemek isterim.

**Zhang Jie (Zhongguancun Kejin Technology Başkan Yardımcısı): **Bence büyük modelin ilk yılı GPT3'ün 2020'deki lansmanına kadar izlenebilir. Son altı ayda neden bu kadar hızlı gelişti? Bence üç nedeni var:

İlk husus, Baidu, Huawei, Tsinghua Üniversitesi vb. Gibi bazı şirket ve üniversitelerin daha önce çok fazla birikimi olması, önceden eğitilmiş dil modelleri veya büyük modelleri olması ve son altı ayın bir sürüm güncellemesi olması. onlar için yineleme;

İkinci husus, aralarında bazı yatırım kuruluşlarının da bulunduğu çeşitli işletmelerin yatırımlarını artırmış olması;

Üçüncü husus, açık kaynağa güvenmektir.Açık kaynak topluluğu, işletmeleri çeşitli geniş etki alanı modelleri başlatmaya yöneltmiştir.

Büyük modellerin sahadaki etkisi ile ilgili olarak, müşteriler ve bizim için iki yönlü bir faydadır. Zhongguancun Kejin, sohbete dayalı yapay zeka teknolojisi çözümlerinin lider sağlayıcısıdır.Büyük model, çeşitli sahne modellerini özelleştirme ve geliştirme maliyetimizi düşürür ki bu bizim için iyi bir haber. Müşterilerimiz için, akıllı projelerin maliyetinin düşürülmesi, birçok küçük ve orta ölçekli işletmeyi proje oluşturmayı düşünmeye yöneltti ve pazarın tamamı büyüdü.

**澎湃科技: Son zamanlarda Tencent Cloud ve OpenAI, özelleştirilmiş model yazılımlar için bir uygulama mağazası biçimine benzeyen büyük ölçekli bir model mağaza önerdi. Bu eğilimi nasıl anlıyorsunuz? **

**Wang Danjun:**Bu alanda ister yatırımcı olun ister uygulayıcı olun, herkesin bu eğilimi görmeyi beklediğine inanıyorum çünkü bu, daha fazla insanı bu alanın birlikte yaratılmasına katılmaya teşvik ediyor. Temel hizmet sağlayıcılar için gelecekte mağaza modeline yöneleceklerine ve bu sayede müşteriye yakınlaşmanın daha kolay olacağına inanıyoruz. Büyük model deposunun modeli, hizmet alan kullanıcıların bazı yeni uygulama senaryoları ve hizmet değeri oluşturmak için büyük modeli daha iyi kullanmalarını da sağlar.

Yu Zhonghai: Bu aslında sermaye piyasasını çok endişelendiren bir konu. Gelecekte büyük modellerin geliştirilmesinin daha çok Çin'in genel bulutu ve özel bulutu gibi olacağını düşünüyorum.

Genel bulut, o zamanlar aslında IaaS (Hizmet Olarak Altyapı, hizmet olarak altyapı) olarak adlandırılıyordu.Büyük modeller söz konusu olduğunda, biz buna MaaS (Hizmet Olarak Model) diyoruz. İnternete birçok model koyan Hugging Face adında tanınmış bir denizaşırı şirket var ve sadece API'sini (Uygulama Programı Arayüzü, uygulama programlama arayüzü) çağırarak farklı AI modellerini kullanabilirsiniz.

Bununla birlikte, güvenlik uyumluluğu ve alt bölümlere ayrılmış sahne uygulaması gibi gereksinimler nedeniyle kendi büyük ölçekli modellerini dağıtması ve kendi İnce Ayarlarını yapmak için kendi bilgilerini kullanması gereken birçok kuruluş da vardır. Çin'de pazar..

Genel olarak konuşursak, büyük modeller aslında herkesin doğrudan kullanması için uygun değildir, buna aslında sıradan herkesin deneyimleyebilmesi için büyük modele dayalı bir ürün içinde paketlenen ChatGPT dahildir. Bu nedenle, büyük modellere dayalı uygulamalar yapmak aslında çok geniş bir pazardır ve bu pazar, dijital çalışanlar ve sunucunun az önce bahsettiği uygulama mağazası konsepti gibi birçok iş modelini üretebilir.

Aslında ChatGPT bir çok kişi tarafından bir trafik portalı olarak da değerlendiriliyor.Bildiğim kadarıyla bazı büyük çaplı cep telefonu üreticileri de arama yaparak çıkabiliyor o zaman bu konu bambaşka.Ulaşılabilir pazarı işletmeden olacaktır. BT Harcaması, pazarlama harcamasına dönüşür. Çinli şirketler, gelirlerinin ortalama %1-3'ünü BT'ye harcayabilir, ancak gelirlerinin %30'unu pazarlamaya harcayabilir. Dolayısıyla, trafiğiniz olduğunda iş modeli çok değişebilir ki bu çok ilginç.

Zhang Jie: OpenAI ve Tencent Cloud'un farklı vurguları olduğunu düşünüyorum. OpenAI'nin odak noktası hala temel büyük model üzerinde olabilir.Bazı parçalanmış senaryolarda temel büyük modelin doğruluk veya profesyonellik eksikliğini telafi etmesine yardımcı olmak için bazı ekolojik ortakları kullanır. Bununla birlikte Tencent Cloud, kendi temel modelini abartmak yerine dikey endüstriler için büyük bir model olması gerektiğini vurguluyor.

Farklı vurguları ortak bir sorunu gösteriyor, yani temel büyük model, yüksek profesyonelliğe sahip bazı belirli endüstrilerde veya senaryolarda doğrudan kullanılamıyor ve ayrıca bir uyarlama katmanına ihtiyaç duyuyor. Bence burada yeni bir iş modeli olabilir, yani gelecekte daha fazla bilgiden yararlanılabilir. Herkes AI kullandığında teknik paradigmanın farklı olduğu ortaya çıktı. Bu nedenle herkesin paylaşabileceği varlıklar bir miktar ham veridir.Ham veri elde edildikten sonra farklı teknik yöntemlerle işlenir.Bu işlem sırasında verinin ara halinin ticareti yapılamamaktadır.

Bununla birlikte, büyük model temel olarak birçok AI görevini birleştirir ve tüm araştırma paradigması ve işlem akışı yakınsama yaparak, etiketli veriler, talimat hizalaması için veriler, bilgi istemi sözcükleri ve bilgi istemi ifadelerinden oluşan bilgi istemi zinciri gibi birçok ara ürünü alınıp satılabilir hale getirir. vb. ve hatta belirli senaryolarda eğitilmiş robotlar veya asistanlar bazı işlemleri yapabilir ve sermayelendirilebilir.Bu, gelecekte yeni bir iş modeli olabilir.

Genel büyük modele karşı dikey alan büyük model

**Kağıt Teknolojisi: Aslında, az önce üçünüz iki farklı iş yolundan bahsettiniz, alan büyük modeli ve genel büyük model. Bu iki farklı iş modelinin sunduğu fırsatlardan ve zorluklardan detaylı olarak bahsedebilir misiniz? **

Wang Danjun: Gelecekte, büyük modeller etrafında iş yapmak kesinlikle bir iş ekolojisi haline gelecek ve iş ekolojisinin temel özelliği katmanlı olacak. Her şeyden önce, temel hizmetleri sağlayacak bazı üreticiler olacaktır, çünkü büyük modeller veri temeli ve bilgi işlem gücü gerektirir. Büyük model, temel motor olarak hizmet eder.Güçlü yeteneklere sahip olmasına rağmen, belirli alanlar, hizmet modelleri ve müşteri ihtiyaçları hakkındaki bilgileri anlamaz.

Bununla birlikte büyük dikey maketler geliyor. Bu dikey alanlardaki büyük modellerden bazıları, alan üreticilerinin kendi büyük modelleridir ve bazıları temel büyük modellere göre eğitilir. Layman'ın tabiriyle, bu modelleri bir uzman yapmaktır. Örneğin, finans alanında, yatırımcıların iş kararları vermesine yardımcı olmaya adanmış bazı hizmetler olabilir ve insan kaynakları alanında, şirketlerin yetenek kararları vermesine yardımcı olmaya adanmış hizmetler olabilir.

Alt bölümlere ayrılmış birçok alan olabilir. Bu alt bölümler ayrıca endüstri birikimi, eğitim ve müşteri sorunlarının nasıl çözüleceğine dair anlayış ve hatta etkileşimli arayüzün kullanıcı deneyimi düzeyine dahil olmayı gerektirebilir. Bu birikimler aslında daha önce bahsettiğimiz uygulama mağazasının arkasındaki yeteneklerden bazıları.

Yu Zhonghai: Bizim açımızdan bu iki pazar türü aslında oldukça farklı.

Her şeyden önce, genel büyük model için iyi bir veri volanı oluşturmak da önemlidir.

Mesela bugün size masa tenisi oynamayı öğretiyorum ve siz de böyle oynamalısınız diyorum. Sonra bir topa servis atarım ve sen onu tutmazsın, ona vurmanın doğru bir yol olmadığını bilirsin. Sonra başka bir yol değiştirin, bu sefer yakalayın, doğru yolu hatırlayacaksınız. Sonra ben topu size atmaya devam ediyorum ve siz topu yakalamaya devam ediyorsunuz, en iyi yolu bulmak için kas hafızanızı yavaş yavaş ayarlıyorsunuz. Aslında modelin eğitimi de böyle bir süreçtir. ChatGPT ile her iletişim kurduğunuzda, altında bir beğeni veya beğenmeme olacaktır. Ya da hiçbir şey söylemediğiniz ve yeniden canlandırdığınız için çok hayal kırıklığına uğradığınız zamanlar vardır. Veya örneğin, Midjourney'i çizmek için her kullandığınızda, dört resim gösterecek ve ardından varsayılan olarak üçüncüsünü seçip büyüteceksiniz, indireceksiniz ve bunun daha iyi göründüğünü bilecek ve gidecek. Buna gelecekte yön biraz daha önyargılı ve model biraz öğrenecek. Veri geri bildirimi olmadan model burada kalır ve gelişemez. Yani bu, sahnenin kart konumunu vurgulayarak vurguladığımız veri volanı. Genel amaçlı büyük bir model olarak en önemlisi birileri tarafından kullanılıyor olması da Çin'in bir avantajı. Çinliler teknolojiyi kucaklamayı seviyorlar ve büyük modelleri daha çok kabul ediyorlar. Geri bildirimde bulunacak çok sayıda insanımız var.

Geniş alanlı modeller için, daha önemli olanın bilgi birikimi olduğunu düşünüyorum (belirli bir sektörde yer almak veya belirli bir işi yapmak için gereken teknik bilgi ve uzmanlık).

Geniş etki alanı modelinin anahtarı, müşterilerin ihtiyaçlarını karşılamak ve belirli bir derin etki alanındaki müşterilerin bilgi birikimini anlamaktır. Zhongguancun Kejin gibi işletmelerin burada avantajları var: Müşterinin teknik bilgisini anlıyorlar ve müşterinin belirli saha senaryolarındaki sıkıntılarını anlıyorlar.

**Zhang Jie: **Tanındığınız için teşekkür ederiz. Genel büyük modelin ve etki alanı geniş modelinin rekabetçi bir ilişki değil, yukarı ve aşağı yönlü bir ilişki olduğunu anlıyorum. Genel model büyük ve kapsamlıdır ve etki alanı modeli küçük ama güzel bir işletmedir.

Genel büyük ölçekli model, yüksek yatırım ve yüksek getiri, ancak aynı zamanda yüksek belirsizlik olan "üç zirve" ile karakterize edilir. Çünkü temel bir büyük modeli eğitmek, algoritmalar, veriler ve yetenekler açısından yüksek gereksinimler gerektirir. Örneğin, hesaplama gücü en az 10.000 kat bilgi işlem gücü düzeyinde olmalıdır.

Belirsizlik neden bu kadar yüksek? Kısa listeye giren üreticiler temelde büyük İnternet şirketleri veya teknoloji devleri olduğundan, eğitimli büyük modellerin genel yeteneklere ve ortaya çıkan yeteneklere sahip olması için teknik gereksinimler çok yüksektir. Yalnızca açık kaynak modelini kazanarak hayatta kalabilir. Gelecekteki pazarda, bir arada var olan birçok temel büyük model olacağını düşünüyorum, ancak çok fazla olmayabilir.

Bir etki alanı modeli, küçük ama güzel bir yol olabilir. Geniş bir etki alanı modelini eğitmek çok yüksek bilgi işlem gücü gerektirmez.Deneylerimize göre, büyük etki alanı modelini yinelemek yalnızca bir hafta sürer. İki kart, gerçek zamanlı olarak biraz mantık yürütebilir. O halde veriler açısından, Bay Yu'nun az önce bahsettiği veri volanı etkisi olan kendi eşiklerimizi belirlememiz gerekiyor.

Rekabetin en önemli noktası yetenektir. Geniş etki alanı modeli, tüm endüstrinin teknoloji zincirini düzleştirdi.Yetenekleriniz yalnızca algoritmaları anlamamalı, aynı zamanda algoritmaları iyi bir şekilde tasarlamayı, senaryoları, işi ve hatta ürün tasarımını anlamayı da bilmelidir. Yeteneklerin bileşik yeteneğini teşvik etmek ve ardından organizasyonel yeteneğin bir testi olan yeteneklerin inisiyatifini ve yaratıcılığını teşvik etmek gerekir.

**Büyük model hangi alanda en kullanışlıdır? **

**Kağıt Teknolojisi: En umut verici üç dikey uygulama yönü nedir? **

Yu Zhonghai: Pek çok yöne baktık ve şu anda en umut verici yön, bir ürün kategorisine atıfta bulunan ve kendi oluşturduğumuz bir kelime olan AI Yanıtı. Örneğin bugün beni bir konuda test ettiniz ve hangi marka bebek arabasını almanın daha iyi olduğunu sordunuz. Herkesin benzer bir duruma sahip olması gerektiğine inanıyorum, üç arkadaşınıza sorun, beş Xiaohongshu makalesi okuyun ve ardından internette on gönderi arayın. Sonunda okuduktan sonra üç modeli özetledim ve ardından fiyata baktım ve bir karar verdim.

Aslında yapay zekaya sorduğunuz zaman aynısı birçok şey için geçerli.Büyük modelin belli bir hafızası var.Bunların birbiriyle ilişkili olduğunu biliyor ama halüsinasyonları olacak.Nasıl görünüyor. Dolayısıyla şirketlerin sıklıkla yaptığı şey, dahili bilgi tabanına dayalı olarak belirli sorgular yapmak ve ardından bu şeylere dayalı bir özet yapmaktır. Ayrıca yüzlerce sayfaya dayanan sigorta klozeti gibi bir belgeye dayalı soru-cevap, özet veya karşılaştırma bulunmaktadır. Veya bir aramaya dayalı bir cevap verin. Bu ürünleri topluca AI Yanıtı olarak adlandırıyoruz. Ayrıca ofis işleri ve yapay zeka öğrenen makineler gibi fırsatlara da daha fazla önem veriyoruz.

Zhang Jie: Bence önce sektöre, sonra sahneye göre bakabiliriz. Büyük ölçekli etki alanı modelleri için ideal sektör, yüksek bilgi yoğunluğuna, güçlü işlem mantığına sahip, güvenlik ve mahremiyete duyarlı sektördür. Örneğin, finans, tıbbi bakım, hukuk ve devlet işleri gibi sektörler, uygulama için ideal sektörler olabilir. gelecekte büyük ölçekli alan modellerinin

Sahne başlangıçta dahili çalışanlar için yetkilendirilebilir. Örneğin, bazı bilgi sınavları yapın, ardından eğitim ve fikir tartışması yapın. Dahili çalışanları yetkilendirdikten sonra, C'ye (müşterilere) bazı hizmetlerin nasıl yapılacağına veya satış personelinin ve müşteri hizmetleri personelinin pazarlama müşteri hizmetleri asistanları olmaları için nasıl yetkilendirileceğine bakalım. Kısacası, uygulama yaparken öncelikle nispeten yüksek hata toleransı olan sahneden başlamayı düşünebilirsiniz.

Wang Danjun: Ayrıca, herkesin uygulama deneyiminde büyük modellerin bilgi yoğun sektörlerdeki çoğu sorunu çözmemize yardımcı olduğuna inanıyoruz. Beisen veya Zhongguancun Kejin gibi B'ye yönelik alanda, gerçekten de bundan yararlanma olasılığı daha yüksek olan bazı şirketler olacak. Örneğin, bir işletmenin insan kaynakları yönetiminde herkes, büyük modelin, çalışanların çeşitli ortak endişelerine cevap vermek gibi, insanlar için bazı sıkıcı ve sıkıcı şeyleri çözebileceğini umar. Beisen ve Zhongguancun Kejin, gelecekte büyük modelin temel tesisleri aracılığıyla bazı dijital çalışanlar kurmayı ve insan deneyimi ve bilgisi gerektirmiyor gibi görünen bu soruları yanıtlamayı umarak bu alanda işbirliğini de tartışıyorlar.

Ek olarak, kurumsal liderlik koçluğu gibi bazı yüksek değerli alanlar olduğunu bulduk. Bir kuruluşun birden fazla düzeyde yöneticisi vardır ve her yönetici her gün çeşitli zorluklarla karşılaşır, ancak başkalarından tavsiye istemek için çok fazla fırsatı yoktur. AIGC'nin bu senaryoda çok iyi yardım sağlayabileceğini düşünüyoruz ve bazılarını pekala karşılayabilir. mahremiyet için kişisel gereksinimler.

**澎湃科技:Microsoft, yakın zamanda uygulama ekolojisini açmak için OpenAI ile iş birliğini duyurdu. Zhongguancun Kejin, Çin'deki büyük ölçekli uygulama üreticilerinin temsilcisidir. Ürün yerleştirme ve uygulamadaki mevcut ilerleme nasıl? Gelecekte her şirketin kendine özel bir modeli olacak mı? **

Zhang Jie: Bence her şirketin kendi özel modeline ihtiyacı yok çünkü bence büyük model teknolojisi sığdan derine doğru üç katmana ayrılabilir:

Birinci düzeyde, endüstri veya işletme çok fazla bilgi veya belgeye sahip değilse veya işletmenin özelliği güçlü değilse, özel bir model kullanmaya gerek yoktur ve genel bir büyük model doğrudan kullanılabilir. Genel büyük modelde, belirli sahne gereksinimlerine göre ayarlamak (istem) yeterlidir. Bu dönemde işletmelerin ihtiyacı olan, iyi bir kullanıcı deneyimi ve düşük eşiğe sahip hızlı bir kelime yönetim aracıdır. Bazı iş uzmanlarının belirli senaryolarda bazı yararlı istemleri biriktirmesi gerekebilir; daha karmaşık olanlar için, bazı istemleri küçük bir bilgi istemleri grubuna dönüştürmek ve ardından farklı kümeler arasında zincirler oluşturmak ve zincirler sıralanır Mantıksal ilişki için, hızlı bir zincir yönetim aracına sahip olmak yeterlidir.

İkinci katman biraz daha karmaşıktır. Bazı işletmeler çok fazla parçalanmış bilgiye sahiptir. Şu anda, hızlı sözcükler veya bilgi istemi zincirleri yeterli olmayabilir. Düşük frekanslı ve uzun kuyruklu bilgiyi yönetmek için genel büyük modelin üstüne bir bilgi tabanı eklemek gerekir. Genel büyük model belirli sorunlarla karşılaştığında yanıtları bulmak için bilgi tabanına gidin. Bu, genel büyük model + bilgi tabanı + hızlı mühendisliğin teknik yoludur.

Üçüncü katman, büyük miktarda alan bilgisine sahip işletmeler için, işletmeye özel geniş bir alan modeli oluşturmak ve alandaki genel bilgiyi, yalnızca genel ortak bilgileri korumakla kalmayan büyük modelin beynine girmek gerekir. duyu ve muhakeme, aynı zamanda alanda uzmanlığa sahiptir. Bilgi ve beceriler, sosyal bilimler öğrencilerinden alan uzmanlarına kadar büyük modeller oluşturur. Bu, geniş alan modeli + alan bilgi tabanı + hızlı mühendislik rotasıdır.

Zhongguancun Kejin'in yukarıdaki üç durum için bazı uygulama uygulamaları var.Bir süre önce üç teknik zorluğu çözmeye çalışıyorduk ve çözdükten sonra iki takım yardımcı uygulama oluşturduk. Üç teknik zorluk nedir?

Birincisi, genellikle büyük modellerde ortaya çıkan halüsinasyonlar, yani ciddi saçmalıklar sorununu çözmektir. Bu, büyük modele bir soru sorulduğunda bilgi tabanında ilgili bilgiyi bulması gerektiğini bilmesini sağlamak için alanda bir bilgi tabanı gerektirir. Bir bilgi tabanı oluştururken genellikle belgeleri zengin metin biçiminde işlemek gerekir.Büyük modelin önce belge düzenini anlaması ve ardından içindeki içeriği anlaması gerekir.

İkincisi, etki alanında büyük modeller eğitilirken eğitim sürecinde unutma sorununun önüne geçmektir. Aksi takdirde beynine yeni bilgiler yüklediğinizde eski bilgileri unutacaktır. Burada etkili ince ayar teknik araçları kullanılacaktır, böylece yalnızca orijinal genel bilgiye sahip olmakla kalmaz, aynı zamanda alandaki sağduyuyu da öğrenir.

Üçüncüsü, kullanıcıların onu daha rahat ve düşük maliyetle nasıl kullanacağıdır. İster geniş bir etki alanı modeli, ister bir etki alanı bilgi tabanı veya hızlı sözcükler olsun, bir gecede gerçekleştirilemez ve sürekli geri bildirim ve yineleme gerektirir. alet seviyesi.

**澎湃科技: Bay Yu'ya, proje seçiminin temel odak noktası olan bu büyük ölçekli model yükselişinde, mobil İnternet ve sabit teknoloji çağındaki yatırım mantığıyla karşılaştırıldığında yatırım perspektifinden sormak istiyorum. , yatırım karar verme noktaları dahil olmak üzere nedir? **

**Yu Zhonghai:**Bu aynı zamanda sermayenin araştırdığı bir soru. Son altı ayda, büyük model pazarı da birçok evrim geçirdi. Başlangıçta birçok kişi bunu bir tema yatırımı olarak görüyordu.O zamanlar yapay zeka ile ilgili şirketler spekülasyon yapılıyordu ve büyük ölçekli modellerin altında yatan gerçek yeteneklere sahip şirketler herkes tarafından çok değerliydi. Daha sonra "Yüz Model Savaşı" ortaya çıktı. Herkes büyük modelin biraz fazla karmaşık göründüğünü hissetti. Nuggets'tan kürek satın almanın avantajının bilgi işlem gücü gibi göründüğünü gördüler, bu nedenle şirketlerin bilgi işlem gücüyle ilgili değerlemesi bir kat arttı. pay. Bu yılın Mayıs ve Haziran aylarında, "AI uygulamalarının patlayıcı bir Kambriyen dönemini başlattığını" öne sürdük. Birçok şirket kendi ürünlerini geliştirdi ve AI uygulaması yeniden yükselmeye başladı.

Aslında büyük modellerin yatırım ritmi de kademeli.Başlangıçtan itibaren yapay zeka şirketi olduğu sürece artabilir ve sonra bir uygulama ile çıkar ve sonrasında herkes bu uygulamanın olup olmadığını keşfetmeye başlar. Bunun için ödeme yapan müşterilerin olup olmadığı ve gerçek siparişlerin olup olmadığı. Belki bir yıl sonra herkes bu uygulamanın önünde engeller olup olmadığını ve işin uzun vadede sürdürülebilir olup olmadığını düşünür. Aslında en iyimser olduğumuz konu uygulama düzeyi… Büyük modeller ile kurumsal uygulamaları gerçek anlamda birbirine bağlayabilen ve gerçekten değer yaratabilen işletmelere büyük önem veriyoruz.

**Kağıt: Sıradaki soru Dean Wang'a. Yetenekler açısından bakıldığında, büyük model şimdi insan-makine işbirliğine dayalı yeni bir üretim ilişkisi kuruyor. Peki bunun işletmelerin yetenek yönetimine etkisi ne olacak? **

Wang Danjun: Bu özellikle iyi bir soru. Çünkü toplumsal düzeyde herkesin "İleride yaptığım işin yerini büyük bir maket mi alacak?" sorusunu tartışmaya çok hevesli olduğunu görüyoruz. Bu soruya iki açıdan bakmayı öneriyorum:

Bir yandan, herkesin daha çok tartıştığı şey, büyük ölçekli modellerin yeteneğinin giderek güçlenmesi ve dikey alanların uygulanmasının giderek derinleşmesi ve bunun gelecekte birçok genel çalışanın işinin yerini alabilecek olmasıdır. Son yıllarda, büyük ölçekli model geliştirme geçmişi olmasa bile, herkes, işletmelerdeki işgücü maliyetlerinin oranını içeren maliyetlerin düşürülmesi ve verimliliğin artırılması konusunda çok endişeli. İşçilik maliyetlerini azaltmak için bazı yeni teknolojiler kullanılabilirse, işletme için çok değerli olacaktır, bu da sürdürülebilir kalkınmasının önemli bir nedenidir.

Öte yandan, gelecekte büyük modellerin ortaya çıkması ve daha dikey saha araçlarının ortaya çıkması çalışanlar için bir nimet olacaktır. Olumlu tarafı, çalışanlar insan-makine işbirliğinden daha iyi yararlanabilirse şirket için daha fazla değer yaratabilir.

İleride organizasyonel yapıda bazı değişiklikler olacağını tahmin ediyoruz. Artık çoğu şirket fonksiyonel bir yapıya sahip.Farklı fonksiyonlar aynı müşterilere hizmet ediyor.Fonksiyonlar arası işbirliği ve iletişimde birçok sorun var ki bu şirket için büyük bir tüketim. Ancak gelecekte, bireysel çalışanlar veya gruplar araçların yardımıyla çok yönlü yeteneklere sahip olduğunda, organizasyon birimi kaçınılmaz olarak daha küçük olacak ve daha çevik, esnek ve duyarlı olacaktır.

**Kağıt Teknolojisi: Üçünüze Yüz Model Savaşı bağlamında şirketlerin en çok ne tür yeteneklere ihtiyaç duyduğunu sormak istiyorum. **

**Zhang Jie: **Temel büyük ölçekli model üreticileri için en çok ihtiyaç duydukları şey, özellikle güçlü ve benzersiz teknik yeteneklere sahip olmak. karmaşık muhakeme seks. Alandaki büyük ölçekli model üreticileri için en çok bileşik yeteneklere ihtiyaç duyulur ve organizasyon becerileri çok önemlidir. Yeteneklerin inisiyatifine ve yaratıcılığına tam anlamıyla yer vermek gerektiğinden, onu bazı son teknoloji iş fırsatlarıyla buluşturmak ve müşterilerin neye ihtiyacı olduğunu bilmesini sağlamak gerekiyor. Ek olarak, bazı mühendislik yetenekleri ve algoritmik yetenekler olmalıdır.

Yu Zhonghai: Verilerin çok önemli olduğunu düşünüyorum, özellikle büyük modeller kullanmak isteyen şirketler için veriler gerçekten önemli. Aslında, veriler yakında bizim için bir engel haline gelecek.Zhongguancun Kejin gibi büyük ölçekli model uygulamaları sağlayan şirketlerin en büyük avantajı verilerde.

**Wang Danjun: **Aslında, işletmelerin büyük çoğunluğu için gelecekte büyük modellerin yaratıcıları yerine büyük modellerin tüketicileri olma olasılığı daha yüksektir. Büyük modelleri aktif olarak benimsemek, dijital yönetim süreçlerini büyük ölçüde hızlandırabilir. . Hem kuruluşların hem de bireylerin değişimi benimsemesi gerekebilir.Her seviyedeki liderlerin bu yeni fırsatı benimseme konusundaki farkındalıklarını artırmaları ve çalışanların sürekli ve kendi kendine güdümlü öğrenme yeteneklerini sürdürmeleri gerekir.

**Kağıt Teknolojisi: Bu süreçte dikey alandaki işletmeler sektörel know-how avantajına sahiptir. Büyük model verilerinin kart noktalarını kırmak daha mı kolay? **

Zhang Jie: Sektör bilgisinin ayrıntılı olarak incelenmesi gerektiğini düşünüyorum ve özel dikkat gerektiren birkaç biçim olabilir.

Endüstri bilgi birikiminin en bariz şekli, belgelerdeki sembolik ifadeler olan bazı verilerdir. Belgeden (soru sözcükleri) veya istem zincirlerinin nasıl çıkarılacağı, bu aşamada ele alınması gereken bir sorun türüdür. Birçok şirketin çok sayıda belgesi vardır ve bu belgelerin birçoğu PPT veya PDF formatındadır. Hem biçimini hem de içeriğini anlamak gerekir.

Bu sektördeki know-how'ın yanı sıra sektör uzmanlarının veya senaryo uzmanlarının kafasında saklı bilgiler de vardır.Ona kelimelerle özetlenebilecek bir araç verilmesi gerekir.Örneğin sektördür. daha yüksek yoğunluklu know-how.

Ayrıca, sistem günlüklerinde gizlenen kolektif bilgelik olan nispeten gizli bir endüstri bilgisi türü de vardır. Bu günlükleri inceledikten sonra, dağınık bilgiyi yapılandırılmış zincir bilgisine dönüştürmek mümkündür. Daha sonra binlerce zincirden belirli bir senaryo altında özetlenir ve en iyi uygulamaya dönüştürülür. Örneğin, satış görevlileri her gün çok sayıda telefon görüşmesi yapıyor ve her gün birikmiş milyonlarca konuşma günlüğü var.Sipariş tamamlama, akış düzeni veya aramaları kapatma gibi farklı sonuçlara göre uyarlayarak, yeni pazarlama için en iyi konuşma becerileri ürünler çökelebilir.

Bu üç tür soru aslında çok iyi endüstri bilgisidir. Burada ayrıca bilgi istemi sözcüklerinin ve bilgi istemi zincirlerinin belgelerden ve günlüklerden nasıl çıkarılacağı gibi bazı teknik zorluklar da vardır. doc2 ve log2, yatırım yapmaya değer araştırmaların odak noktasıdır.

Yu Zhonghai: Aslında, Zhang Jie'nin her zaman beni derinden etkileyen bir sözü vardır. Güneş sistemindeki sekiz gezegenin yörüngelerini on milyonlarca yıl boyunca kaydetmenin soyut bir kanun kadar iyi olmadığını söylerdi. şeyleri daha iyi açıklayabilen yerçekimi.Doğa.

Bence bu bilgi birikimidir. Dikey alanlardaki şirketlerin ilgili alanlarda çok fazla tecrübesi var, bir örnek vereyim, yapay zeka popüler hale geldikten sonra herkes mühendis diye yıllık bir milyon maaş alan yeni bir meslek olduğunu söyledi.

Yazmaya giden mühendis. Peki neden bu kadar değerliler? Ben de yapay zeka boyama araçlarını kendim kullanıyorum. Bir keresinde takım elbiseli bir adam çizmek istedim ama birçok anahtar kelime denedim ve işe yaramadı. Daha sonra "kravat" yazdım ve kişi hemen bir takım elbise giydi ve bunun sihirli kelime olduğunu göreceksiniz.

Büyük model biraz olasılık oyunu gibidir, aslında önceden birçok olasılığa sahiptir. Az önceki sahnede kravat, takım elbiseye tekabül eden çok önemli bir kelimedir. Ve mühendis hangi anahtar kelimelerin modeli bozabileceğini bilir ve ne tür şeyler yazmak istediğimizi bilir.Bu onun değeridir. O halde bu konuyu uygulama senaryosuna koyarsak aslında dikey alanlarda firmaların değeridir. Hem yapay zekayı hem de sektör bilgisini anlıyor.

Wang Danjun: Şu anda, temel büyük ölçekli model şirketlere ek olarak, dikey saha şirketleri, pazarda herkesin yakından ilgileneceği ikinci grup şirketler gibi görünüyor. Önümüzdeki dönemde onlar için çok zorlayıcı olacağını düşünüyorum. Şirketlerin dikey alanlardaki deneyimi, yeni teknolojilerin nimetiyle doğrudan yeni yaratıcılığa dönüşmeyebilir. Önce öğrenmek, büyük model operasyonunun altında yatan mantığın ne olduğunu anlamak, bunun bana nasıl yardımcı olabileceğini öğrenmek, hatta bilgimizi araştırmama veya müşterilere hizmet sunmamıza yardımcı olmak için daha fazla zaman harcamam gerekiyor. Sanırım bir süre sonra, önce bu zorlukla karşılaşacaklar. Bu temeller üzerinde, bu modellere dayalı olarak müşteriler için değer yaratmak için yeni fırsatlar bulun.

**Kağıt Teknolojisi: Son zamanlarda ChatGPT ziyaretçilerinin sayısındaki yavaşlama gibi bazı yeni trendler olmuştur. Aslında bir süper giriş olarak yoktu. ChatGPT'nin GPT'nin geleceğini temsil edemeyeceği, sadece OpenAI ve Microsoft tarafından piyasaya sunulan bir ürün olduğu yönünde bir görüş var. Üçünüz bu bakış açısı hakkında ne düşünüyorsunuz? **

Yu Zhonghai: Bu bakış açısı gerçekten de oldukça ilginç. Şahsen ben nispeten iyimserim çünkü genellikle büyük ölçekli ürünler kullanan bir insanım. Ve mevcut ChatGPT'nin son hali olmadığını da eklemek isterim. Google'ın yeni nesil Android sistemindeki Google Asistan'ın (Google Asistan) kendi büyük modeliyle destekleneceğini düşünüyorum çünkü bu da çok önemli bir trafik girişi.

Wang Danjun: Sektördeki birçok kişiye göre herkes çok iyimser. Yeni bir ürün olarak, geliştirmenin bu aşamasında doğal olarak bazı farklılıklar olacaktır. Son kullanıcılar için bu tür araçlarla ilgilenecek, denemeye istekli olacak ve kullanmaya devam edeceklerdir. Kullanım sıklığı azalsa ve dikkat derecesi azalsa da kullanıcıların davranışını değiştirmek zordur.

Zhang Jie: Bence ChatGPT'nin büyüme hızındaki yavaşlama er ya da geç olacak bir şey. Ne de olsa trafiğin bir tavanı var. Er ya da geç, trafik zirveye ulaşacak veya halkın sohbet uygulama senaryolarına olan ilgisi azalacaktır.Sonuçta, sohbet yüksek frekanslı katı bir talep değildir, ancak size özellikle iyi bir ilham verir.

Bir yandan, Chat çevresinde ChatDoc, ChatPdf ve ChatBI gibi sohbet yoluyla resim, video, rapor, PPT vb. Başka bir senaryo, az önce bahsedilen finansal GPT, yasal GPT ve tıbbi GPT gibi geniş etki alanı modelidir. Bunların tümü gelecekte bazı yeni işletme girişleri olabilir.

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
  • Pin
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)