GPT-4 sadece AGI kıvılcımı mı? LLM sonunda çıkacak, dünya modeli gelecek

Orijinal kaynak: Xinzhiyuan

İnsan bilişinde, yapay genel zekanın (AGI) uzun süredir yapay zekanın nihai biçimini ve nihai gelişim hedefini belirlemek için kullanıldığı görülüyor.

OpenAI, şirketin AGI'ye ulaşma hedefini uzun süredir belirlemesine rağmen. Ancak AGI nedir için OpenAI CEO'su Sam Altman'ın kendisi belirli bir tanım veremedi.

AGI'nin ne zaman geleceği ise sadece patronlar tarafından ortaya atılan yakın gelecek anlatı senaryolarında var, ulaşılabilecek gibi görünüyor ama çok uzak.

Bugün, tanınmış yabancı podcast web sitesi Substack'te, Valentino Zocca adlı yapay zeka endüstrisinin emektarlarından biri, insanlık tarihinin anlatısal bakış açısı üzerinde duruyor, insanoğlunun ve genel yapay zekanın öyküsünü kapsamlı ve derinlemesine anlatan görkemli bir makale yazdı. zeka, zeka arasındaki mesafe.

Makalede AGI kabaca "dünyayı anlatan bir model" değil, "dünyayı anlayabilen bir model" olarak tanımlanıyor.

İnsanların AGI dünyasına gerçekten ulaşmak istiyorsa, "kendi gerçekliklerini sorgulayabilen ve kendilerini keşfedebilen bir sistem" kurmaları gerektiğine inanıyor.

Bu büyük keşif sürecinde, belki de hiç kimse belirli bir yol haritası verecek niteliklere ve yeteneğe sahip değildir.

OpenAI bilim adamları Kenneth Stanley ve Joel Lehman'ın "Neden Büyüklük Planlanamıyor" adlı son kitaplarında açıkladıkları gibi, büyüklük arayışının bir yönü vardır, ancak belirli sonuçlar beklenmedik olabilir.

**AGI'den ne kadar uzaktayız? **

Yaklaşık 200.000 yıl önce Homo sapiens dünya üzerinde dimdik yürümeye başlamış, aynı zamanda düşünce ve bilgi alanında da seyahat etmeye başlamıştır.

İnsanlık tarihindeki bir dizi keşif ve icat, insanlık tarihini şekillendirmiştir. Bunlardan bazıları sadece dilimizi ve düşüncemizi etkilemekle kalmaz, potansiyel olarak biyolojik yapımızı da etkiler.

Örneğin, ateşin keşfi ilkel insanın yemek pişirmesini sağlamıştır. Pişmiş yiyecekler beyne daha fazla enerji sağlar, böylece insan zekasının gelişimini destekler.

Tekerleğin icadından buhar makinesinin icadına kadar, insanlık Sanayi Devrimi'ni başlattı. Elektrik, bugün sahip olduğumuz teknolojik gelişmelerin önünü daha da açtı ve matbaa, yeni fikirlerin ve kültürlerin geniş çapta yayılmasını hızlandırdı ve insan inovasyonunun gelişimini teşvik etti.

Ancak ilerleme, yalnızca yeni fiziksel boyutların keşfinden değil, aynı zamanda yeni fikirlerden de gelir.

Batı dünyasının tarihi, Roma İmparatorluğu'nun çöküşünden Orta Çağ'a, Rönesans ve Aydınlanma döneminde yeniden doğuş yaşıyor.

Ancak insan bilgisinin artmasıyla birlikte insan türü kendi önemsizliğini fark etmeye başladı.

Sokrates'ten iki bin yıldan fazla bir süre sonra insanlar "hiçbir şey bilmediklerini bilmeye" başladılar ve dünyamız artık evrenin merkezi olarak görülmüyordu. Evrenin kendisi genişliyor ve biz onun içinde sadece bir toz zerresiyiz.

Gerçeklik algısını değiştir

Ancak insanın dünyayı algılamasındaki en büyük değişiklik 20. yüzyılda meydana geldi.

1931'de Kurt Gödel eksiklik teoremini yayınladı.

Sadece dört yıl sonra, "tamlık" temasını sürdürmek için Einstein, Podolsky ve Rosen, "Fiziksel Gerçekliğin Kuantum-Mekanik Deionu Tamamlanmış Olarak Kabul Edilebilir mi?" Başlıklı bir makale yayınladılar.

Daha sonra Niels Bohr, kuantum fiziğinin geçerliliğini kanıtlayarak bu makaleyi yalanladı.

Gödel'in teoremi, matematiğin bile her şeyi kesin olarak kanıtlayamayacağını gösterirken, kuantum teorisi dünyamızın kesinlikten yoksun olduğunu ve elektronların hızı ve hızı gibi belirli olayları tahmin etmemizi engellediğini gösteriyor.

Einstein'ın ünlü "Tanrı evrenle zar atmaz" sözüne rağmen, özünde, fizikteki şeyleri basitçe tahmin etmek veya anlamak söz konusu olduğunda, insanın sınırlamaları tam olarak ortaya çıkıyor.

İnsanlar ne kadar kendi formüle ettikleri kurallarla yönetilen matematiksel bir evren tasarlamaya çalışsalar da, böylesine soyut bir evren her zaman eksiktir ve içinde kanıtlanamayan ve inkar edilemeyecek nesnel aksiyomlar gizlidir.

Matematiğin soyut formülasyonuna ek olarak, insan dünyası da gerçeği tanımlayan felsefe ile ifade edilir.

Ancak insanlar kendilerini bu temsilleri tarif edemez, tam olarak ifade edemez, anlayamaz ve hatta tanımlayamaz halde bulurlar.

  1. yüzyılın başında "hakikat" kavramı hala belirsizdi ve "sanat", "güzellik" ve "yaşam" gibi kavramlar tanım düzeyinde temel bir fikir birliğinden yoksundu.

Aynı şey diğer birçok önemli kavram için de geçerlidir, "bilgelik" ve "bilinç" de insanlar tarafından net bir şekilde tanımlanamaz.

Zekanın Tanımı

Zekanın tanımındaki boşluğu doldurmak için, 2007'de Legg ve Hart, "Genel İstihbarat" kitabında makine zekasının tanımını önerdiler: "İstihbarat, bir aracının (Ajan) değişen bir ortamda hedeflere ulaşma yeteneğini ölçer. ."

Aynı şekilde, "Problem Çözme ve Zeka"da Hambrick, Burgoyne ve Altman, problem çözmenin sadece zekanın bir yönü veya özelliği değil, zekanın özü olduğunu tartışırlar.

Bu iki ifade, dil tanımında benzerdir ve her ikisi de "bir hedefe ulaşmanın" "bir sorunu çözmek" ile bağlantılı olabileceğine inanır.

Gottfredson, "Mainstream Science on Intelligence: An Editorial with 52 Signatories" adlı kitabında, birkaç araştırmacının zeka tanımlarını daha geniş bir perspektiften özetledi:

"Zeka, akıl yürütme, planlama, problem çözme, soyut düşünme, karmaşık fikirleri kavrama, hızlı öğrenme yeteneği ve deneyimlerden öğrenme yeteneğini içeren çok genel bir zihinsel yetenektir. Bu sadece kitap bilgisi, dar akademik beceriler veya sınava girme becerileri Daha ziyade, kişinin çevresini anlamak için daha geniş, daha derin bir yeteneğini yansıtır - şeyleri 'yakalama', 'anlama' veya ne yapacağını 'bulma' yeteneği”.

Bu tanım, zekanın inşasını yalnızca "problem çözme becerileri"nin ötesine götürür ve iki temel boyutu ortaya koyar: deneyimlerden öğrenme yeteneği ve çevreyi anlama yeteneği.

Başka bir deyişle zeka, genel sorunlara çözüm bulmak için soyut bir yetenek olarak görülmemeli, daha ziyade önceki deneyimlerden öğrendiklerimizi, ortaya çıkabilecek farklı durumlar için çevre yeteneklerimize uygulama konusunda somut bir yetenek olarak görülmelidir.

Bu, zeka ve öğrenme arasındaki içsel bağlantıyı vurgular.

Stanislas Dehaene "Nasıl Öğreniriz" kitabında öğrenmeyi "öğrenme, dünyanın bir modelini oluşturma sürecidir" olarak tanımlar; bu, zekanın aynı zamanda çevreyi anlamayı ve açıklamak için içsel bir model oluşturmayı gerektiren bir yetenek olduğu anlamına gelir. çevre.

Bu nedenle zeka, sadece bu yetenek olmasa da, dünyanın modellerini yaratma yeteneğini de gerektirir.

**Mevcut makineler ne kadar akıllı? **

Yapay genel zeka (AGI) ve dar yapay zekadan (Dar AI) bahsederken, genellikle aralarındaki farkı vurgularız.

Dar yapay zeka (veya zayıf yapay zeka) çok yaygın ve başarılıdır, genellikle belirli görevlerde insanları geride bırakır.

Örneğin bu iyi bilinen örnek, 2016 yılında dar anlamda yapay zeka AlphaGo'nun dünya şampiyonu Li Shidol'u Go oyununda 4'e 1'lik skorla mağlup etmesi buna güzel bir örnek.

Ancak 2023 yılında amatör satranç oyuncusu Kellin Perline'ın yapay zekanın baş edemediği taktikleri Go sahasında insanlara bir oyun kazanmak için kullanması, dar yapay zekanın bazı durumlarda sınırlamaları olduğunu gösteriyor.

Alışılmadık taktikleri tanıma ve buna göre ayarlama konusunda insan yeteneğinden yoksundur.

Dahası, en temel düzeyde, acemi bir veri bilimcisi bile yapay zekanın dayandığı her makine öğrenimi modelinin önyargı ve varyans arasında bir denge kurması gerektiğini anlar.

Bu, sadece ezberlemek değil, verilerden öğrenmek, çözümleri anlamak ve genellemek anlamına gelir.

Dar Yapay Zeka, göreceli olarak büyük miktarda gözlemlenen veriye dayalı karmaşık modeller oluşturmak için bilgisayarların bilgi işlem gücünü ve bellek kapasitesini kullanır.

Bununla birlikte, koşullar biraz değiştiğinde, bu modeller genellikle genelleştirilemez.

Sanki Dünya'yı gözlemlere dayalı olarak tanımlamak için bir yerçekimi teorisi bulmuş, sadece Ay'daki nesnelerin çok daha hafif olduğunu bulmuş gibi olurduk.

Teorik yerçekimi bilgimize dayalı olarak sayılar yerine değişkenler kullanırsak, her gezegen veya aydaki yerçekiminin büyüklüğünü hızlı bir şekilde tahmin etmek için doğru değerleri nasıl kullanacağımızı anlayabiliriz.

Ancak değişkensiz sayısal denklemler kullanırsak, bu denklemleri yeniden yazmadan diğer gezegenlere uygun şekilde genelleyemeyiz.

Başka bir deyişle, yapay zeka gerçekten "öğrenemeyebilir", yalnızca bilgi veya deneyimi damıtabilir. AI, dünyanın kapsamlı bir modelini oluşturarak değil, yalnızca ifade edilecek bir özet oluşturarak anlar.

**Gerçekten AGI'ye ulaştık mı? **

AGI'nin artık genel olarak şu anlama geldiği anlaşılmaktadır: insan düzeyinde veya daha yüksek düzeyde birden fazla bilişsel alanda anlayabilen ve akıl yürütebilen bir yapay zeka sistemi, yani güçlü yapay zeka.

Ve belirli görevler için mevcut yapay zekamız, AlphaGO of Go gibi yalnızca zayıf bir yapay zekadır.

AGI, soyut düşünme alanında çeşitli alanları kapsayan insan düzeyinde zekaya sahip bir yapay zeka sistemini temsil eder.

Bu, AGI için ihtiyacımız olan şeyin, deneyimle tutarlı ve doğru tahminler yapabilen bir dünya modeli olduğu anlamına gelir.

Everitt, Lea ve Hutter'ın "Güvenlik Literatürü İncelemesi"nde (AGI Safety Literatür İncelemesi) işaret ettiği gibi: AGI henüz burada değil.

"Gerçek AGI'den ne kadar uzaktayız?" sorusu için farklı tahminler büyük ölçüde değişmektedir.

Ancak çoğu yapay zeka araştırmacısının ve yetkili kurumun görüşleriyle tutarlıdır, yani insanoğlu gerçek genel yapay zekadan en az birkaç yıl uzaktadır.

Şu anda en güçlü yapay zeka ile karşı karşıya olan GPT-4'ün piyasaya sürülmesinden sonra, birçok kişi GPT-4'ü AGI'nin kıvılcımı olarak görüyor.

13 Nisan'da OpenAI'nin ortağı Microsoft, "Sparks of Yapay Genel Zeka: Erken deneyler ile GPT-4" (Sparks of General Yapay Zeka: Erken deneyler ile GPT-4) başlıklı bir makale yayınladı.

Kağıt adresi:

hangi bahseder:

"GPT-4 sadece dilde ustalaşmakla kalmıyor, aynı zamanda matematik, kodlama, vizyon, tıp, hukuk, psikoloji ve diğer alanları kapsayan en yeni görevleri özel komutlar gerektirmeden çözüyor.

Ve yukarıdaki tüm görevlerde, GPT-4'ün performans seviyesi neredeyse insan seviyesiyle eşittir. GPT-4'ün yeteneklerinin genişliğine ve derinliğine dayanarak, genel yapay zekanın neredeyse ama tam olmayan bir versiyonu olarak makul bir şekilde görülebileceğine inanıyoruz. "

Ancak Carnegie Mellon Üniversitesi'nde profesör olan Maarten Sap'ın yorumladığı gibi, "AGI kıvılcımı", araştırma makalelerini halkla ilişkiler olarak kullanan bazı büyük şirketlere yalnızca bir örnektir.

Öte yandan araştırmacı ve makine girişimcisi Rodney Brooks, insanların anlayışındaki bir yanlış anlaşılmaya dikkat çekti: "ChatGPT gibi sistemlerin işlevini değerlendirirken, genellikle performansı yetenekle bir tutuyoruz."

Performansı yanlış bir şekilde yetenekle eşitlemek, GPT-4'ün gerçek dünyayı anladığını düşündüğü, dünyanın özetleyici tanımlarını ürettiği anlamına gelir.

Bu, AI modelinin eğitildiği verilerle ilgilidir.

Günümüzün modellerinin çoğu yalnızca metinle eğitilmiştir ve gerçek dünyada konuşma, duyma, koklama ve yaşama becerilerine sahip değildir.

Bu durum Platon'un mağara alegorisi ile benzerlik göstermektedir.Mağarada yaşayan insanlar sadece duvardaki gölgeyi görebilirler, eşyanın gerçek varlığını tanıyamazlar.

Yalnızca metin üzerinde eğitilen dünya modellerinin yalnızca gramer açısından doğru olduğu garanti edilir. Ama özünde, dilin ne ifade ettiğini anlamaz ve çevre ile doğrudan temas sağduyusundan yoksundur.

Mevcut büyük modelin başlıca sınırlamaları

Büyük dil modellerinin (LLM'ler) en tartışmalı sorunu halüsinasyon görme eğilimleridir.

Halüsinasyonlar, bir modelin referansları ve gerçekleri tahrif ettiği veya mantıksal çıkarımları, nedensel çıkarımları vb. karıştırdığı ve anlamsız içerik ürettiği durumları ifade eder.

Büyük dil modellerinin yanılsaması, olaylar arasındaki nedensel ilişkileri anlamamalarından kaynaklanır.

Araştırmacılar, "ChatGPT İyi Bir Nedensel Akıl Yürütücü mü? Kapsamlı Bir Uation" makalesinde bu gerçeği doğruladı:

ChatGPT gibi büyük dil modelleri, gerçekte bir ilişki olup olmadığına bakılmaksızın, olaylar arasında nedensel bir ilişki olduğunu varsayma eğilimindedir.

Kağıt adresi:

Araştırmacılar sonunda şu sonuca vardılar:

"ChatGPT mükemmel bir nedensel açıklayıcıdır, ancak iyi bir nedensel çıkarım aracı değildir."

Benzer şekilde, bu sonuç diğer LLM'lere de genişletilebilir.

Bu, LLM'nin temelde yalnızca gözlem yoluyla nedensel tümevarım yeteneğine sahip olduğu, ancak nedensel tümdengelim yeteneğine sahip olmadığı anlamına gelir.

Bu aynı zamanda LLM'nin sınırlamalarına da yol açar.Zeka, deneyimlerden öğrenmek ve öğrenilen içeriği çevreleyen çevreyi anlamak için bir dünya modeline dönüştürmek anlamına geliyorsa, o zaman öğrenmenin temel unsuru olan nedensel çıkarım, zeka için mümkün değildir.

Mevcut LLM'ler bu yönden yoksundur, bu nedenle Yann LeCun mevcut geniş dil modelinin AGI olamayacağına inanmaktadır.

Sonuç olarak

  1. yüzyılın başlarında kuantum mekaniğinin doğuşunun ortaya koyduğu gibi, gerçeklik genellikle günlük gözlemlerimizin oluşturduğu sezgilerimizden farklıdır.

Oluşturduğumuz dil, bilgi, metin verileri, hatta video, ses ve diğer materyaller, deneyimleyebileceğimiz gerçekliğin yalnızca çok sınırlı bir parçasıdır.

Tıpkı sezgilerimize ve deneyimlerimize meydan okuyan bir gerçekliği keşfettiğimiz, öğrendiğimiz ve ustalaştığımız gibi, AGI da ancak kendi gerçekliğini sorgulayabilen, kendi kendini sorgulayabilen sistemler kurabildiğimizde gerçek anlamda gerçekleşecektir.

Ve en azından bu aşamada nedensel çıkarımlar yapabilen ve dünyayı anlayan bir model kurmalıyız.

Bu beklenti, insanlık tarihinde ileriye doğru atılmış bir başka adımdır ve dünyamızın doğasının daha iyi anlaşılmasını ima eder.

AGI'nin ortaya çıkışı, sürekli ilerleme ve bilişsel sınırların genişlemesi yoluyla benzersiz değerimizi ve varlığımızın önemini zayıflatacak olsa da, insanın evrendeki durumunu ve insan arasındaki ilişkiyi ve ilişkiyi daha net anlayacağız. Evren.

Referanslar:

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)