AI büyük modeli, AI'da devrim yaratacak

Kaynak: Ekonomik Gözlemci

Yazar: Shen Yiran

Görsel kaynağı: Unbounded AI tarafından oluşturuldu

Bu yılın Nisan ayında, önde gelen bir yapay zeka şirketindeki birkaç araştırmacı yeni bir teknolojiye dikkat çekti: SAM (Segment Everything Model). Araştırmacılar bu teknolojiyi hızlı bir şekilde bölüm başkanına bildirdiler.Bu şirket makine görme teknolojisi ile başladı ve araştırmacıların odaklandığı teknoloji de bununla ilgiliydi. Araştırmacılardan biri, "SAM'in ortaya çıkışıyla, giderek daha fazla yapay zeka insanı büyük modellerin kendileri için bir şok olduğunu fark ediyor" dedi.

Bir ay sonra şirket, büyük bir görsel model geliştirmek için kaynak ayırmaya başladı.

Takip eden üç ayda önde gelen yapay görme yapay zeka şirketleri bu teknolojinin potansiyeline dikkat çekti.Şimdiye kadar SenseTime ve CloudWalk Technology gibi yapay zeka şirketleri ve geleneksel güvenlik şirketleri bu yeni teknoloji rekabetine yatırım yapmaya başladı.

SAM, genel sahneler için bir görüntü segmentasyon modelidir. Bu yılın Nisan ayında Meta tarafından kullanıma sunuldu. Tıpkı ChatGPT ile konuşmak gibi, insanlar SAM'in resimdeki içeriği bağımsız olarak ayırt etmesine ve hakkında düşünmesine izin vermek için bazı dil komutlarını kullanabilir. ChatGPT olmak görüş alanında ortaya çıktı.

Dünyanın her yerindeki meraklılar bunu resim çizmek, resim kesmek ve harika vakit geçirmek için kullanıyor, ancak Çinli araştırmacılar SAM'in gücünü fark ettiler: otomatik sürüşte, güvenlik izlemede, insanları, arabaları ve yolları tespit etmek için kullanılıyorsa, geleneksel yapay görme oyununu temelden kıran bağımsız bir büyük modeldir.

Görüntüleri bölümlere ayırmak ve tanımak, yapay görmenin temel görevidir. Geçmişte, bölümlere ayrılmış bir görüntü oluşturmanın her görevi, bir algoritmanın eğitilmesini, bir grup veriye açıklama eklenmesini ve makinenin küçük modelleri üst üste koyarak görüntüdeki çeşitli nesneleri "görmesine" izin verilmesini gerektiriyordu. SAM bazı yeni özellikler göstermiştir: her belirli görev için küçük bir model oluşturmadan, makine herhangi bir görüntüdeki herhangi bir nesneyi, hatta bilinmeyen, bulanık bir sahneyi bile otonom olarak bölümlere ayırabilir ve işlem son derece basittir.

Bu, SAM'in daha genel özelliklere sahip olduğu anlamına gelir ve bu genel özelliği, yapay görme tanıma maliyetini büyük ölçüde azaltmak için kullanmak mümkündür, böylece orijinal teknolojiye dayalı iş modelini ve rekabet modelini değiştirir.

2016'dan bu yana devasa bir pazara sahip olan Çin'de yüzlerce yapay zeka şirketi ortaya çıktı.Yitu Technology'ye Göre Pazar rekabeti ve sermayenin yardımıyla Shangtang Technology, Cloudwalk Technology, Megvii Technology gibi birkaç AI tek boynuzlu at yavaş yavaş oluştu. , bu şirketler yapay zekayı güvenlik, devlet işleri ve endüstri alanlarına getirdi ve algoritmaların karmaşıklığından ve ölçek avantajlarından yararlanarak bir hendek inşa etti.

Ancak şimdi, teknolojinin değişmesiyle etkinlik yeniden başlatılabilir.

China Mobile Group Baş Bilim İnsanı ve Çin Yapay Zeka Endüstrisi Geliştirme İttifakı Başkan Yardımcısı Feng Junlan, gazetecilere yaptığı açıklamada, AI büyük modelinin yeni bir yapay zeka paradigması getireceğini söyledi. temelde büyük modelin etkisi altında yok. . SAM'in ortaya çıkışı, büyük görsel modellerin fizibilitesini kanıtlayarak yapay görmenin araştırma çerçevesini, etkileşimi ve üretim hizmeti yöntemlerini alt üst eder.

IEEE'nin kıdemli üyelerinden, Tianjin Teknoloji Üniversitesi'nden profesör ve AR/VR teknolojisi uzmanı Luo Xun, gazetecilere, daha önce önde gelen şirketlerin yapay zeka yeteneklerinin avantajlarının, yükseliş nedeniyle bir dereceye kadar zayıflayacağını söyledi. genel amaçlı büyük modeller. Ancak bu şirketlerin kendilerinin zayıflayıp zayıflamayacağı, dönüşümlerine bağlıdır.

Teknik rota

Yapay zekanın önemli bir dalı olan yapay görmenin amacı, bilgisayarların görüntüleri ve videoları anlamak ve işlemek için insan görsel sistemini taklit etmesine izin vermektir.

2000 yılından sonra yapay zekanın kurucuları olarak bilinen Geoffrey Hinton, Yann LeCun ve Yoshua Bengio, derin öğrenme teknolojisinde çığır açarak makinelerin insan beynini belirsiz bir şekilde simüle etmesine ve devasa görüntülerden otomatik olarak öğrenip özellikler çıkarmasına olanak sağladı.

2012 önemli bir zaman düğümü. Stanford Üniversitesi profesörü Li Feifei tarafından oluşturulan ImageNet projesi, derin öğrenmeyi ana akım haline getirdi: araştırmacılar, makine görüşünü büyük ölçüde iyileştiren çok sayıda resmi manuel olarak etiketleyerek bilgisayarlara çeşitli nesneleri tanımayı öğretebilir. maliyeti düşürür ve ticarileştirmeyi mümkün kılar.

Nisan 2023'te yeni değişiklikler geldi ve Meta, SAM adlı bir görüntü segmentasyon modelini piyasaya sürdü. Büyük bir model olarak SAM, makineye sadece dış dünyayı algılayacak gözlerle donatmakla kalmaz, aynı zamanda makineye gerçek bir beyin de verir.Gözlemlemeyi, algılamayı, düşünmeyi, mantıksal akıl yürütmeyi, görüntülerden sonuç çıkarmayı ve işleyişi öğrenir. son derece basittir, ChatGPT'ye benzer şekilde makine komutları vermek için insan dili diyaloğu kullanır.

Kısacası, çok sayıda görüntü ek açıklamasına ve yığınlama algoritmasına ihtiyaç duymadan makine görüşü hedefine daha kolay ulaşır ve daha az bilgi işlem gücü tüketir. Nvidia yapay zeka bilimcisi Jim Fan, SAM büyük modelinin makine görüşünün GPT-3 anı olduğunu söyledi.Bilinmeyen nesneler, alışılmadık sahneler (su altı görüntüleri gibi) ve belirsiz durumlarda bile nesnelerin genel kavramını anladı. segmentasyon da mümkündür.

Meta, SAM'ı piyasaya sürdükten sonra, modeli ve arkasındaki eğitim veri setini de açık kaynaklı hale getirdi ve SAM'ın AR, VR, içerik oluşturma ve diğer alanlardan uygulama senaryolarını tanıttı.

Çin'deki şirketler ve araştırmacılar, SAM'in olası ticari değerine hızla karar verdiler.SAM, otonom sürüşte, güvenlik izlemede, insanları, arabaları ve yolları tespit etmek için kullanılırsa, geleneksel makine görüşünü temelden bozabilir.

Feng Junlan, büyük modelin yapay zekanın tedarik modunu değiştireceğini, arz tarafının karmaşıklığını büyük ölçüde azaltacağını ve marjinal maliyetin sıfıra yakın olduğunu söyledi; iş tarafı talebi daha basit bir doğal dilde ifade edebilir ve artık güvenmek zorunda değildir. mühendisler tarafından yazılan kodlar gibi profesyonel talimatlar üzerine Makinelerle iletişim kurun ve kendi ihtiyaçlarına göre farklı modellere esnek bir şekilde konuşlandırarak verimliliği artırın

Uniview Technology'nin baş ürün sorumlusu Zhu Bing, gazetecilere şunları söyledi: "Geçmişte, yapay zeka işi kutu taşımak gibiydi. Aslında, bu nispeten düşük teknolojili fiziksel bir işti. Yapay zeka tek noktalı bir sahneyi güçlendirdiğinde çok parçalı ve özelleştirilmiş olanlar, satış öncesi verimlilik, satış sonrası verimlilik ve satış verimliliği düşük ve endüstrinin yukarı ve aşağı akışları daha sancılı.” Örneğin, Zhu Bing, farklı senaryolar ve bölgeler için algoritmaları geliştirmeye, malzeme toplamaya, kalibre etmeye ve özelleştirmeye yatırım yapan üreticilerin yatırım ve maliyetinin çok büyük olduğunu söyledi.Müşteriler için özel geliştirme ücreti de önemli bir masraf.

Bugün, orijinal küçük model oyununu değiştirmek için büyük bir model kullanmak, yığınlama algoritmaları veya büyük miktarda etiketli veri gerektirmez ve işlem sırasında çok az bilgi işlem gücü tüketir. profesyonel bir bilgisayar programlama dili kullanarak. . Zhu Bing, büyük modelin AI araştırma ve geliştirme ve dağıtım maliyetini büyük ölçüde azalttığını, bir dizi yeni oynanış oluşturduğunu ve özellikle bilgisayarla görme endüstrisinde endüstri düzenini yeniden yapılandırdığını söyledi.Büyük şirketler tarafından inşa edilen önceki teknik engeller, düzeldi, herkes aynı başlangıç çizgisine döndü.

akını

Önceki nesil yapay görme teknolojisi çevresinde, Çin'de bir dizi yapay zeka şirketi doğdu ve bu şirketler tarafından sağlanan teknolojiler, kamu güvenliği, metrolar ve ticari binalar için kamera izleme ve güvenlik denetimi tanımlamasında yaygın olarak kullanılmaya başlandı.

"AI Four Tigers", 2011 ile 2014 yılları arasında art arda kurulan dört Çinli yapay zeka şirketini, yani SenseTime, Cloudwalk Technology, Megvii Technology ve Yitu Technology'yi ifade eder. Ortak özellikleri, çekirdek teknoloji olarak makine görüşüdür.Yapay zekanın derin öğrenme rotasındaki atılımı, bu yapay zeka şirketleri grubunun yükselişi için teknik bir temel sağladı ve Çin'in endüstriyel avantajları, bu şirketlerin gelişimi için bir pazar sağladı. .

SAM çıktıktan sonra art arda bu teknolojiyi hedef almaya başladılar.

Muhabir, sektördeki birçok kişiden Yitu Technology, SenseTime, Yuncong Technology ve Megvii Technology'nin yanı sıra "AI Four Tigers" arasında büyük ölçekli görsel modeller geliştirdiğini öğrendi. Kangweishi ve Uniview Technology de ilgili teknoloji araştırma ve geliştirmesini kullanıyor.

Nisan ayında, Meta'nın SAM'ı piyasaya sürmesinden sadece birkaç gün sonra, SenseTime "Daily New" büyük modelini piyasaya sürdü. SenseTime Akıllı Endüstri Araştırma Enstitüsü dekanı Tian Feng, gazetecilere verdiği demeçte, "Ri Ri Xin" serisinin doğal dil oluşturma, görüntü oluşturma ve görsel algı dahil olmak üzere çok sayıda büyük modelden oluşan bir koleksiyon olduğunu söyledi. Bunlar arasında "Ruying", "Qiongyu" da bulunuyor. , "Gewu" vizyonla ilgili büyük modellerdir.

Mayıs ayında Yuncong Technology, vizyon dahil olmak üzere çok modlu büyük bir model olan "sakin" büyük modeli piyasaya sürdü. modeller. Çünkü şirketin bilgisayarlı görü alanında güçlü bir rezervi var ve müşterilerin özel işlerini çözmek için çok modlu teknolojiye ihtiyacı var.

Megvii ve Yitu henüz büyük modelleri piyasaya sürmedi. Megvii gazetecilere verdiği demeçte, "büyük bir model geliştirdiğini, ancak piyasaya sürülüp müşterilere teslim edilmediğini" söyledi. Yön açısından Megvii dört araştırma yönü seçti: genel görüntü büyük modeli, video anlama büyük modeli, hesaplamalı fotoğrafçılık büyük modeli ve otonom sürüş algısı büyük modeli ve belirli atılımlar gerçekleştirdi.

Omdia araştırma kurumunda yapay zeka baş analisti Su Lianjie, gazetecilere, görsel büyük ölçekli modelin etkisi altında, "AI Four Tigers"ın hızla büyük ölçekli bir modele dönüştüğünü ve çok modlu bir büyük ölçekli konuşlandırdığını söyledi. vizyona odaklanan ölçekli model. nispeten makul.

Hikvision, bu yılın Haziran ayında yatırımcılara şunları söyledi: "SAM modeline piyasaya sürülmesinin başında dikkat ettik ve sistematik bir değerlendirme yaptık." Zhu Bing, gazetecilere şirketin kendi geliştirdiği AIoT endüstri modelinin "Wutong" olduğunu söyledi. genel bir büyük ölçekli model + endüstri sahnesi + eğitim ve ayarlamaya dayalı büyük ölçekli bir endüstri modeli İlk kez 9 Mayıs'ta piyasaya sürüldü ve ilk grup ortaklar tarafından Haziran ayında test edildi.

Hikvision ve Uniview Technology, ekipman üreticileri olarak başlayan geleneksel güvenlik şirketleridir. "AI Four Tigers" güvenlik endüstrisine girdikten sonra şiddetli bir rekabetle karşı karşıya kaldılar. Aktif olarak yapay görme teknolojisi pazar payını benimsiyorlar.

Şu anda yapay zeka şirketleri, "büyük modellerin çığır açması"nın anlamı konusunda bir fikir birliğine varmaya başlıyor.

SenseTime Akıllı Endüstri Araştırma Enstitüsü dekanı Tian Feng ve Yuncong Technology'nin kurucu ortağı Yao Zhiqiang, gazetecilere AI1.0'ın küçük modeller çağı olduğunu söyledi. özel sahne ihtiyaçları. ; AI2.0, büyük modellerin çağıdır. İşletmelerin, dünya için genel algı ve biliş yeteneklerine sahip çok modlu bir temel model oluşturmak için birleşik bir büyük ölçekli teknoloji tabanlı platform kullanması gerekir ve bu temelde bir dizi endüstri oluşturun.Profesyonel sahnelerin ve daha büyük sahnelerin ihtiyaçlarını karşılamak için küçük modeller.

Yao Zhiqiang, bir AI şirketi hala önceki aşamadaysa, birçok sahne sorununu çözebileceğine, ancak maliyetin düşürülmesinin zor olduğuna ve ölçek etkisinin gösterilmesini imkansız hale getirdiğine inanıyor; Tian Feng, iki dönemin bir arada var olduğuna inanıyor. uzun bir zaman ve kimin birbirini ortadan kaldırdığı değil.Zıt ilişki, ikisi koordineli bir şekilde tamamlanır. Örneğin, AI2.0 çağında hibrit uzman model yapısı (MoE) kullanılarak, birden fazla model hizmetlerde birleştirilir ve 1.0 modelleri de entegre edilebilir.

Yeni rekabette özgün teknoloji birikimi ve donanım yatırımı yine rol oynayacak.

Tian Feng gazetecilere verdiği demeçte, "AI Large Device" akıllı bilgi işlem merkezinin güçlü AI bilgi işlem gücüne sahip olduğunu ve yüz milyarlarca parametreye sahip 20 büyük model için eğitim hesaplama gücü sağlayabildiğini söyledi. Bu, büyük modelleri geliştirmek ve eğitmek için temel ekipmandır. sadece kişisel kullanım içindir, aynı zamanda büyük ölçekli girişimlere ve Ar-Ge ortaklarına da açıktır.

Yunwalk'tan sorumlu ilgili kişi gazetecilere, şirketin CWOS işletim sisteminin ChatGPT gibi süper dil modellerini entegre etmede doğal avantajlara sahip olduğunu söyledi. Aynı zamanda sistem, gerçek üretim durumuna göre büyük modele veri ve bilgi geri bildirimi yapabilir, modelin eğitimini ve ayarını optimize edebilir ve modelin doğruluğunu ve verimliliğini geliştirebilir.

Büyük model pazarda çığır açar

"Büyük modelin etkisi olmasa bile, "AI Four Tigers" hala dönüşümde bir kafa karışıklığı döneminde ve kendi değerlerini ve çıkış yollarını düşünmeleri gerekiyor." dedi Su Lianjie.

Aralarında SenseTime ve CloudWalk'ın da sermaye piyasasına girdiği bir grup yapay zeka şirketi, sermaye ve piyasa tarafından tercih edildi. 2018'den 2022'ye kadar SenseTime, araştırma ve geliştirmeye her yıl 12 milyar yuan'dan fazla yatırım yaptı ve 2021'deki halka arzında 5 milyar yuan'dan fazla para topladı. 2018'den 2022'ye kadar Yuncong, araştırma ve geliştirmeye her yıl 2,2 milyar yuan'dan fazla yatırım yaptı ve 2022'de halka arzında 1,7 milyar yuan toplayacak.

Teknoloji ve sermaye arasındaki iyi etkileşim, Çin'e görsel tanıma alanında da lider bir avantaj sağladı.2018 civarında Çin, yayınlanan yapay zeka makalelerinin sayısı ve miktarı açısından ABD'den sonra ikinci oldu veya ABD'yi geride bıraktı. Özellikle görsel tanıma alanında Çinli yapay zeka şirketleri, uluslararası yarışmalarda defalarca rekorlar kırmış ve mükemmel sonuçlar elde etmiştir.

Ancak kısa süre sonra, pazarın tanıtımıyla orijinal teknolojinin potansiyeli kademeli olarak zirveye ulaştı. 2019'da Çin Bilimler Akademisi akademisyeni Zhang Bo, Economic Observer ile yaptığı özel bir röportajda endüstriyel uygulamaların potansiyelinin mevcut teknoloji güzergahında tavana kadar dokunmuştur.

Daha da önemlisi, ticari bir bakış açısıyla, yapay zekanın orijinal teknik yolunun maliyet darboğazını aşması her zaman zor olmuştur, bu nedenle daha geleneksel endüstri müşterileri faturayı ödeyemez. Zhu Bing, "Uzun yıllardır güçlü bir yeni düzen görmedik. Çok sayıda şirket, insan ve plaka tanımanın iki yolunda acımasızca rekabet ediyor. Temel neden, daha fazla algoritmanın bir ölçek etkisi oluşturamamasıdır. "

Önde gelen bir şirketin yapay zeka araştırmacısı gazetecilere, geleneksel yönteme göre bir yapay zeka şirketinin bir otomobil fabrikasına hizmet verdiğini ve barikatları belirlemek için bir dizi algoritma sattığını söyledi. , müşterinin etiketleme için on binlerce resim sağlaması gerekiyor, ancak yalnızca bir algoritma yeterli değil, gerçek yol sahnesi çok karmaşık, küçük arabalar için uygun olan algoritma büyük kamyonlar için uygun olmayabilir ve başka bir açıdan tanınamaz.Algılama hedefinin kısmen kapatıldığında tanınması da zordur.

Yapay zeka şirketlerinin, ekipmanın zekasını artırmak için birden çok algoritmayı üst üste bindirmesi gerekiyor, bu da pek çok küçük modeli üst üste koymak anlamına geliyor. Mali rapora göre, SenseTime 67.000 küçük ticari model biriktirdi Muhabir Yuncong Technology'den şirketin ayrıca binlerce küçük ticari modele sahip olduğunu öğrendi.

Ancak eğitimin süresi ve maliyeti de iki katına çıktı.

Feng Junlan gazetecilere birçok AI şirketinin para kazanmasının zor olduğunu söyledi.Önemli bir neden, AI hizmetlerinin yüksek maliyeti, şirketlerin "bir yuan kazanmasına ve beş yuan kaybetmesine" neden olması ve "ne kadar çok sipariş alınırsa, daha fazla tazminat" tedarikçilerin işini zorlaştırır. Devamında, talep tarafı yalnızca birkaç kilit sektör veya güçlü ödeme kabiliyetine sahip sektörler olabilir.

Mali rapora göre, 2018'den 2022'ye kadar Yuncong Technology 3,1 milyar yuan ve SenseTime 40 milyar yuan'dan fazla zarar biriktirdi.

AI'nın maliyetini daha da azaltmak ve pazarı iyileştirmek için "AI Four Tigers" stratejisi de farklılaştı. SenseTime AI cihazlarını, Cloudwalk işletim sistemlerini, Megvii çipleri ve YITU IoT'yi seçiyor.

Bu açıdan bakıldığında, büyük model sadece mevcut şirketlere zorluklar getirmekle kalmaz, aynı zamanda yepyeni bir iş modeli ve uygulama senaryosu da getirebilir.

Yukarıda adı geçen araştırmacı, şirketin daha fazla pazarda yapay zeka işi bulmak için çok uğraştığını söyledi. Örneğin, şirket bir süpermarkette satış görevlisinin orada olup olmadığını tespit etmek için yapay zeka izleme hakkında bir süpermarketle görüştü. Şirket beş algoritma mühendisi gönderdi ve tek başına maaş 300.000 yuan'a mal oldu. Müşterinin düzinelerce satış elemanının toplam aylık maaşı 50.000 yuan'dan az; ayrıca fabrika sahibiyle, montaj hattındaki ambalaj kutularının hasar görüp görmediğini tespit eden AI kalite denetimi ve diğer taraf, işçi vb. kiralamanın daha ekonomik olduğunu değerlendirmektedir.

Bu gereksinimler toplu olarak yapay zekanın uzun kuyruklu gereksinimleri olarak adlandırılır: zayıf ödeme yetenekleri olan çok sayıda küçük ve orta ölçekli müşterinin yapay zeka için katı bir talebi yoktur, ancak belirli senaryolarda bazı özel ihtiyaçları olabilir; Kullanılsın ya da kullanılmasın ve milyonlarca doları ödemek istemiyorlar. Bu araştırmacının görüşüne göre, gelecekte, büyük modellerin geçiş ve genel yetenekleri kullanılarak, bu görsel algılama senaryolarına belirli bir büyük model türü veya bir dizi çok modlu büyük model uygulanabilir. veri açıklaması ve algoritma yatırımı gereklidir ve geliştirme döngüsü ve bilgi işlem gücü gereksinimleri de daha düşük olacak, böylece maliyet büyük ölçüde azalacak ve müşterilerin ödeme olasılığı daha yüksek olacaktır.

Zhu Bing, geçmişte küçük modellere dayalı AI algoritmalarının parçalanma gereksinimlerinin %10'undan daha azını karşılayabileceğini tahmin etti. toplam uzun kuyruklu algoritmanın süresi 10 kat artırılabilir.Süre 1 kişi haftası içinde azaltılabilir.

Yao Zhiqiang, gazetecilere, teknoloji platformlaştırılıp standartlaştırıldığında, tüm yapay zeka şirketlerinin devasa senaryolara hızla uyum sağlayabileceğini ve birleşik bir çekirdek teknoloji tabanlı platform aracılığıyla devasa uygulamaları gerçekleştirebileceğini söyledi.

Feng Junlan, teknoloji tüketiminin maliyetinin, teknolojinin işletmeye getirdiği değerden çok daha az olduğunu söyledi.Bu formül yerine getirildiğinde, teknoloji ölçeklendirilebilir ve daha fazla ve daha uzun kuyruklu pazarlara taşınabilir. Bu aynı zamanda yapay zeka şirketlerinin kârlılığa ulaşmasındaki temel mantığı da tatmin ediyor ve aynı zamanda daha fazla mavi okyanus pazarı geliştirme fırsatına sahip oldukları anlamına geliyor.

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)