Büyük model hakkında, bir profesyonelle bir kerelik sohbet ettim.

2023-07-04 06:35:01

Orijinal kaynak: White Horse Business Review

Görsel kaynağı: Unbounded AI‌ tarafından oluşturuldu

"Kızıl deniz oluyor adeta." Bir girişimciyle büyük model hakkında sohbet ettiğimde direk bana bu cümleyi attı.

Geçen yıl Kasım ayında OpenAI, büyük modellerin yükselişini anında ateşleyen GPT-3.5 tabanlı ChatGPT'yi piyasaya sürdü. Yarım yıldan fazla bir süredir Çin'de bir "yüz model savaşı" yaşanıyor BAT ve yapay zeka şirketleri gibi önde gelen İnternet şirketleri temelde kendi büyük ölçekli modellerini duyurdular.

Mayıs ayının başında, 360'ın başkanı Zhou Hongyi, dış dünyaya şöyle dedi: "Eğer iki yıllık taklit ve intihalden geçmezseniz, gelip onu aşabileceğinizi söylerseniz, bu böbürlenmektir. "Büyük model ile yabancı ülkeler arasında iki yıllık bir boşluk var, onu geri alıyorum, bugün uluslararası düzeye yakın."

Bazı insanlar ChatGPT'ye yetişmenin altı ay sürdüğünü düşünüyor ve görünüşe göre büyük model zor değil.

Peki, büyük modellerin önündeki temel engeller nelerdir? Çin'in büyük modelinin seviyesi nedir? Büyük model insan toplumu için hangi riskleri getiriyor?

Bu amaçla, büyük modelin sisini ortaya çıkarmak için uzun yıllardır makine öğrenimi araştırmalarıyla uğraşan tanınmış bir 985 üniversite profesörü olan Shen Wei (takma ad) ile sohbet ettik.

GPT yolu bitti, yani bir "Yüz Model Savaşı" var

**White Horse Business Review: Büyük modeli en popüler ve basit dille anlatır mısınız, büyük model nedir? Önceki AI modellerinden farkı nedir? **

Shen Wei: Sözde büyük model, modeldeki çok sayıda parametreyi ifade eder, ancak akademik çevrelerde bir parametrenin ne kadar büyük olduğunu "büyük" olarak adlandırmak için net ve net bir tanım yoktur. hızlı araştırma ve geliştirme Genel olarak konuşursak, büyük bir modelin parametre miktarı 100 milyondan fazla 1'e ulaşır.

Aslında, derin öğrenmenin gelişimi kabaca üç aşamadan geçmiştir. İlk aşama 2012'den 2017'ye kadar olup, görüntü segmentasyonu yolo ve görüntü sınıflandırması ResNet gibi küçük alana özgü modellerle temsil edilir, bu nedenle parametre miktarı maksimum birkaç yüz MB bellek kaplar.

2017'de Transformer'ın ortaya çıkışı, derin öğrenmenin bilgi işlemi paralelleştirmesini sağladı, bu da daha verimli, yani büyük ölçekli model işlemlerinin yapılabileceği anlamına geliyor ve ardından OpenAI GPT ve Google Bert gibi büyük doğal dil modelleri üretildi. Bu aşamada, belirli bir görevin büyük bir modeli doğdu ve model parametreleri 100 milyonu aştı.

2020 civarında, derin öğrenme genel model aşamasına girecek. Girdisi boşluklu bir cümle ve modelin rolü "boşlukları doldurmak". Geçmişte, model aşağı akış uygulamalarına uyarlandı, ancak şimdi aşağı yönlü uygulama uyarlama modelidir. Bu aşamadaki modeller arasında doğal dil alanında GPT 3.5 ve GPT 4, görüntü alanında ise Clip, DALLE, Stable Difüzyon, Midjourney vb. Bu aşamada, model parametreleri on milyarlarca ve yüz milyarlara ulaşabilir.

**White Horse Business Review: Büyük ölçekli modelleri ilk inceleyen şirket veya kurumun hangisi olduğunu biliyor musunuz? Sonuçlar nelerdir? **

Shen Wei: İlk başta üniversiteler ve bilimsel araştırma kurumları ilgili araştırma yaptı. Pekin Zhiyuan Yapay Zeka Araştırma Enstitüsü'nden Wu Dao'nun ve Pengcheng Laboratuvarı'nın beyinlerinin en erken olduğunu biliyorum. Şimdi endüstrideki araştırma da çok senkronize. Akademide yapılan araştırmaların bazı sonuçları var, ancak performans ChatGPT kadar şaşırtıcı değil.

**White Horse Business Review: Sadece birkaç ay içinde Çin'de bir "yüz model savaşı" oldu ve büyük ölçekli modeller piyasaya süren şirketlerin sayısı şimdiden sayılamayacak kadar çok. Bu fenomen hakkında ne düşünüyorsunuz? ? **

Shen Wei: Büyük modeller kesinlikle bir trend ve insanlar onları araştırıyor. Eskiden birçok şirket küçük bir alana yatırım yapıp biraz araştırma yapabilirdi, şimdi ise ChatGPT gibi iyi bir ürün birdenbire ortaya çıkınca herkes net bir iş yönü gördü ve bu nedenle yatırımlarını artırmaya başladılar.

Öte yandan birçok firma ticari rekabetin baskısıyla karşı karşıya kalıyor ve büyük ölçekli model yapmazlarsa geride kalabiliyorlar, bu nedenle büyük ölçekli model projelerin hayata geçirilmesi gerekiyor.

White Horse Business Review: Zhou Hongyi geçtiğimiz günlerde "yerli büyük ölçekli modeller ile yabancı ülkeler arasındaki fark iki yıldır" cümlesini geri çektiğini söyledi ve bugün bunun uluslararası düzeye yakın olduğuna inanıyor. Sadece birkaç ay oldu ve büyük model zor görünmüyor. Sizce fark ne kadar?

Shen Wei: Fark kiminle kıyaslama yaptığına bağlı.Şimdiye kadar 360 Smart Brain ürünlerini deneyimlemedim, bu yüzden onları değerlendirmede pek iyi değilim. Bununla birlikte, Çin'de bazı üretken AI ürünleri var. Deneyimlerime göre, ChatGPT ile hala bir boşluk olduğunu hissediyorum. Büyük yerli modellerin hala çok çalışması gerekiyor.

Ağır sermaye yatırımı altında, yalnızca en iyi şirketlerin fırsatı var mı?

**White Horse Business Review: Büyük modellerin geliştirilmesinin önündeki temel engeller nelerdir? **

Shen Wei: Büyük modellerin temel engelleri arasında veriler, bilgi işlem gücü ve algoritmalar yer alır.

Bilgi işlem gücü açısından, ChatGPT gibi üretken bir yapay zekayı eğitmek için en az 10.000 Nvidia A100 ekran kartına ihtiyaç vardır.Tek bir grafik kartının fiyatı şu anda 60.000 ila 70.000 yuan ve daha iyi performansa sahip V100'ün birim fiyatı 80.000 yuan'dır. • Yatırım en az altı veya yedi milyar yuan'a ulaşmalıdır ve yalnızca birkaç üst düzey şirket ve kurum bunu karşılayabilir. Ticari kuruluşlar için bir avuç ekran kartı almak için yüz milyonlarca dolar harcamak sonuç vermeyebilir, bu üzerinde düşünülmesi gereken bir sorudur.

Sırada veri ve algoritmalar var.Geliştirme çerçeveleri ve optimizasyon algoritmaları gibi algoritmaların anlaşılması daha kolaydır. Veri açısından, Çin'de veri sıkıntısı yok ve hatta ABD'den daha fazla İnternet verisi var, ancak eğitim için hangi verilerin seçileceği ve bunların nasıl işleneceği temel engeller.

**Baima Business Review: Genellikle şirketlerle iletişim kurar mısınız? Kâr amacı gütmeyen araştırma kurumları ile araştırma yapan şirketler arasındaki fark nedir? **

Shen Wei: Şirketin araştırma departmanıyla bazı görüş alışverişlerimiz olacak. İşletmelerle iletişim kurarak gerçek iş ihtiyaçlarını daha iyi anlarız.Bazen yaptığımız akademik araştırmalar ileriye dönük teknolojiye daha fazla önem verir ve uygulama gereksinimleri çok yüksek değildir, ancak işletmeler genellikle uygulamaya daha fazla önem verir.

**Baima Business Review: Yerli büyük ölçekli modelleri hiç incelediniz mi? Hangisini en fazla beğeniyorsun? **

Shen Wei: Belki de en iyi şirketler çıkabilir. Biri ağır sermaye yatırımı ve sadece lider şirketlerin gücü var; diğeri birkaç lider şirketin elindeki verilerin daha bol olması; üçüncüsü yapay zeka alanında bir teknoloji birikimi dönemi yaşanıyor.

**White Horse Business Review: En umut verici büyük ölçekli model uygulamanız nedir? **

Shen Wei: Teknik açıdan bakıldığında, ilk uygulama doğal dil işleme ve görüntüler alanında olmalı ve konuşma tanıma daha sonra olabilir.

Metin yazarlığı yazmak için giderek daha fazla chatGPT kullanıldığını görebilirsiniz. Bu tür içerik oluşturma için giderek daha fazla uygulama var. Akıllı müşteri hizmetleri gibi diğer uygulamaların daha hızlı olması gerektiğini düşünüyorum. Mevcut akıllı müşteri hizmetlerinin bir kısmı çoğu zaman kullanıcıların ihtiyaçlarını anlayamaz ve pratik sorunları çözemez.Kullanıcılar bunun insan mı yoksa robot mu olduğunu ayırt edemezse, oyundaki NPC dahil, önceki diyalog sabit kodlanmıştır, Şimdi kademeli olarak etkileşimlidir ve oyuncu deneyimi daha iyi olacaktır.

**White Horse Business Review: Önde gelen bir aracı kurumun baş analistiydiniz. Yatırım açısından bakıldığında, büyük modellerin ne gibi fırsatları olduğunu düşünüyorsunuz? **

Shen Wei: Sermaye aldatmacasının mantığı, uygulamadan algoritmalara, modellere ve ardından bilgi işlem gücüne geçer; endüstrinin mantığı bunun tersidir ve bilgi işlem gücünün net bir büyüme beklentisi vardır, bu nedenle Nvidia son zamanlarda hızla ve çok yükseldi. Yatırımcılar artık büyük modelin hayata geçirilebileceğinin ve gerçekleştirilebileceğinin hala doğrulanması gerektiğini anlıyor, ancak artan sermaye yatırımının çoğu bilgi işlem gücüne yatırıldı. Tekrarlanan yutturmacadan sonra, pazardaki genel yükseliş sona ermiş olmalı ve daha sonra mantıksal doğrulama ve performans yerine getirilmesi gerekiyor.

Başlangıçta, bir süre önce nispeten güçlü oyun sektörü gibi medya ve İnternet endüstrisine baktım. Sermayenin mantığı, önce Ar-Ge verimliliğini artırmak ve maliyetleri azaltmak için büyük modeller uygulamaktır; ikincisi, büyük modeller daha iyi deneyim getirir ve NPC karakterler daha akıllı Viskozite artar, UP değeri yükselir. Tabii ki, sonunda performans doğrulaması gerekebilir.

İnsanlar yapay zekayı ve hatta kendi kaderlerini kontrol edemez

**White Horse Business Review: Altman ve Musk'ın yapay zekanın güvenliğiyle ilgili endişelerini dile getirdiğini gördük. Artık yalnızca büyük model eğitim yoluyla akıllı sonuçlar olduğunu biliyoruz, ancak eğitim süreci bir kara kutu gibidir. Aslında bu oldukça korkutucu. Güvenlik sorunları hakkında ne düşünüyorsunuz? **

Shen Wei: Güvenlik açısından, her şeyden önce, birkaç anormal fenomen gözlemledim. İlki, Mart ayında aralarında Musk ve Apple'ın kurucu ortağı Steve Wozniak'ın da bulunduğu 1000'den fazla kişi tarafından imzalanan ve GPT-4'ten daha güçlü AI sistemlerinin eğitimi konusunda bir moratoryum çağrısı yapan açık bir mektuptu.

İkincisi, Google'ın baş bilim adamı ve 75 yaşındaki "Yapay zekanın babası" Jeffrey Hinton'un bu yıl Mayıs ayında istifa etmesi Google'dan ayrılmasının doğrudan nedeni, yapay zeka tehlikesinden endişe duymasıydı. , hatta hayatı boyunca yaptığı işten pişmanlık duydu. .

Üçüncüsü, son iki yılda akademik alandaki geniş çaplı eğitim modelinin etik tartışmaları da eklemesidir.

Şu anda, büyük modelin hala kontrol edilebilir olduğunu düşünüyorum ve önemli bir sorun yok; ancak teknoloji çok hızlı gelişiyor. Piyasaya sürülmesinden bu yana sadece birkaç ay içinde, GPT birkaç yinelemeden geçti ve geliştirme hızı çok yüksek. Giderek daha zeki hale geldikçe, öz farkındalık geliştirecek, insan "emirlerini" dinlemeyi bırakacak ve kontrolden çıkacak mıyız? Bu soru herkesi endişelendiriyor.

**White Horse Business Review: Yapay zekanın kitlesel işsizliğe neden olacağını düşünüyor musunuz? Yapay zeka karşısında sıradan insanlar işlerini nasıl sürdürebilir? **

Shen Wei: Makro bir bakış açısından, yapay zekanın çok fazla işsizliğe neden olacağını düşünmüyorum.İnsanların her zaman işleri olacak.Sadece insanların işlerinin içeriği değişecek. Elbette bireysel açıdan bakıldığında mutlaka yapısal bir işsizlik olacak ve biz sadece öğrenmeye devam edebiliriz.

**White Horse Business Review: Daha önce birçok kişi makinelerin duygusuz, hayal gücünden yoksun olduğunu ve insanların yerini alamayacağını söyledi; artık insan beyni yapay zeka tarafından simüle edilebildiğine göre, gelecekte insan şehveti ve cinsel arzusu simüle edilebilir mi? Hormonlar , dopamin vb. Biyolojik bir ödül mekanizmasıdır. **

Shen Wei: Makinelerin duyguları olmadığı varsayımı geçerli.Yapay zeka insan düşünme moduna yaklaşıyor.İnsanlara benzer "duygular" üretecek mi? Sadece insanlardan farklı bir uzay boyutunda yaşıyorlar, tıpkı "The Wandering Earth" filmindeki Tu Hengyu'nun kızı gibi. Yapay zeka, insanlara biyolojik olarak benzer ödül mekanizmalarıyla kendi dünyasını yaratabilir.

**White Horse İş İncelemesi: Her şey hesaplanabilse, planlanabilse ve ayarlanabilse, biraz sıkıcı olmaz mıydı? **

Shen Wei: AI'nın davranışı insanlar tarafından tahmin edilip planlanmaz, kendi kendini güçlendirmesinin ve kendi kendini eğitmesinin sonucudur. "The Wandering Earth" de yosunun karar vermesi, talimatlara uymak yerine kendi kendine yapılır. insanlar tarafından verilir.

**White Horse Business Review: Karbon tabanlı uygarlığın silikon tabanlı uygarlıkla değiştirilmesi belirleyici bir yön mü? **

Shen Wei: Bu soru ana hatların ötesinde. Şu anki gelişme trendine göre bu böyle olabilir, tıpkı "The Wandering Earth"teki gibi, insanlığın kaderine gerçekten insanlar değil, yosunlar hükmediyor; ancak gerçekte teknolojinin 1,5 saate kadar durması da mümkündür. belli bir aşamadan geçer ve geçemez.Sonuçta teknolojik gelişme lineer değildir.

View Original

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

1 Likes