Bilgisayar karnavalı, Nvidia'nın "Çin versiyonu" kim?

**Kaynak: **Core Tide IC

Metin: Wang Yike Ten Alleys

Editör: Su Yang Xubai

* "Çekirdek şeyler ağır" Tencent Technology'nin yarı iletken endüstrisi araştırma planı, Core Tide IC ve Tencent Technology'nin bu sayısı, büyük modellerin patlamasının arkasına, küresel çip bilgi işlem güç pazarında yeni bir modelin oluşumuna, düzenine odaklanıyor lider firmalar ve yerli üreticilerin büyümesini takip ediyor. *

ChatGPT tarafından yanlışlıkla tetiklenen bir AI devrimi dalgası, AI çip pazarını bir kez daha ateşledi.

"A800 ve H800 gibi çipler yaklaşık 120.000 RMB'den 250.000, hatta 300.000'e, hatta 500.000'e kadar değişti." Bu, yerel çip dağıtım çemberinde gerçek bir sahne. Hızla yükselen büyük yerli üreticiler, büyük miktarlarda çip almak istiyor. miktarlar ve Huang Renxun ile "doğrudan bir ilişkiye" sahip olmaları gerekiyor.

"Çip yok, yapay zeka yok" olarak adlandırılan büyük modellerin bilgi işlem gücüne olan talep arttıkça, yapay zeka teknolojisinin temeli olan yongalar önemli iş fırsatlarının kapılarını açıyor. OpenAI bir zamanlar, yapay zeka bilimsel araştırmalarında atılımlar yapmak için, tüketmek için gereken bilgi işlem kaynaklarının her 3 ila 4 ayda bir ikiye katlanacağını ve fonların da üstel büyüme ile eşleşmesi gerekeceğini tahmin etmişti "Moore Yasası".

Nvidia CFO'su Kress, AI bilgi işlem gücüne yönelik mevcut pazar talebinin şirketin önümüzdeki birkaç çeyrek için beklentilerini aştığını ve yerine getirilmesi gereken çok fazla sipariş olduğunu söyledi.

Üretken yapay zeka dalgası Nvidia'ya çok para kazandırdı. Nvidia, 14 yıllık listelemenin ardından trilyon dolarlık piyasa değeri kulübüne başarıyla girdi.Bu hedefe ulaşmak için Apple gibi Silikon Vadisi devleri 37 yıl, Microsoft 33 yıl, Amazon 21 yıl sürdü ve en hızlısı Tesla koştu. sadece 11 yıl sürdü.

Bu aynı zamanda Çinli çip şirketlerini denemeye hevesli olmaya teşvik etti. kendi araştırmalarına güvenmek Yerli büyük ölçekli model güçlendirme. Baidu Kunlun çipleri, Ali Hanguang 800...

Yapay zeka bilgi işlem gücünün getirdiği trilyon dolarlık pazarla karşı karşıya kalan yerli şirketler bu temettü dalgasından yararlanabilir mi? Yerli çip üreticileri Nvidia "dağının" üstesinden nasıl gelmeli? Bu, hiçbir şirketin kaçamayacağı bir sorundur.

01. AI çılgınlığı trilyon dolarlık bir piyasa değeri yarattı Nvidia

Deri giysiler giymeyi seven erkekler, AI temettülerinden ilk yararlananlar oluyor.

2022'nin sonunda, ChatGPT çıktıktan sonra, hızla tüm dünyada bir AI çılgınlığına neden oldu. Bunların arasında AI'nın geleceği üzerine bahis oynayan Nvidia, ChatGPT dalgasından en çok yararlanan şirketlerden biri haline geldi. Bu yılki Nvidia GTC konferansında Nvidia'nın kurucusu ve CEO'su Jen-Hsun Huang, yeni yapay zeka ve çip teknolojisini ortaya çıkardı ve yapay zeka için "iPhone anının" geldiğini söyledi.

Basın toplantısında Huang Renxun, ChatGPT'ye benzer büyük ölçekli dil modellerinin konuşlandırılmasının önemli bir yeni muhakeme iş yükü olduğunu söyledi.Nvidia, büyük ölçekli dil modeli muhakemesini desteklemek için AI etrafında bir dizi ürün ve hizmet yayınladı. Bunların arasında yeni bir mimari benimsenmiş ve daha gelişmiş bir işleme sahip olan H100 çipi en dikkat çekici olanı.

Kaynak: NVIDIA resmi web sitesi

Bu GPU, ChatGPT'ye benzer önceden eğitilmiş modelleri işlemek ve çalıştırmak için tasarlanmış bir Transformer motoruyla donatılmış, NVIDIA Hopper mimarisine dayalı bir H100'dür. Dört çift H100'e ve çift GPU NVLink'e sahip standart bir sunucu, GPT-3 işleme için HGX A100'e kıyasla eğitimi 10 kat hızlandırabilir.

Huang Renxun bir keresinde "H100, büyük dil modellerinin işleme maliyetini büyük ölçüde azaltabilir." demişti. Nvidia, H100 yongasını temel alarak, 8 H100 GPU ile donatılmış en son DGX süper bilgisayarı da inşa etti, böylece bunlar devasa bir GPU oluşturmak üzere bağlanabiliyor ve AI altyapısının inşası için bir "taslak" sağlıyor. DGX süper bilgisayarı tamamen üretime alındı.

Bunun ardından Nvidia'nın A100, H100, A800 ve H800 gibi yüksek performanslı GPU yongaları, özellikle Nisan ayı ortasında yurt dışı e-ticaret platformlarında 40.000 ABD dolarından fazla satılan amiral gemisi yongası H100 ve buna bağlı olarak fiyatlarını yükseltti. hatta bazı satıcılar bunu 6,5 On bin ABD doları olarak fiyatlandırdı.

Aynı zamanda Nvidia'nın Çin'e özel A800 ve H800 yongaları da yağmalandı. "Guangxin Century" elektronik bileşen tedarik tedarikçisinin kurucusu Zhang Jue, "Yerli büyük ölçekli model şirketlerinin bu çipleri elde etmesi temelde zor. Tüm pazardaki talep talebi aşıyor ve eksiklik çok ciddi." Xinchao IC'ye: "Bu yıl, Bu tür bir GPU yongası yaklaşık 120.000 RMB'den 250.000 RMB'ye, hatta 300.000 RMB'ye ve hatta 500.000 RMB'ye kadar değişti."

Hiç şüphe yok ki Nvidia'nın yüksek performanslı GPU'lardaki teknolojik liderliği ve iki AI yongası olan A100 ve H100, ChatGPT gibi büyük dil modellerinin temel itici gücüdür.

Bazı bulut bilgi işlem uzmanları, 10.000 Nvidia A100 yongasının iyi bir AI modeli için bilgi işlem gücü eşiği olduğuna inanıyor. Microsoft'un modellerini eğitmek için OpenAI için ürettiği AI süper bilgisayarı, 10.000 Nvidia GPU yongası ile donatılmıştır. Tesadüfen, büyük yerli internet şirketleri de Nvidia'dan büyük siparişler verdi.Geç tarihli bir LatePost raporuna göre, Byte bu yıl Nvidia'dan 1 milyar ABD dolarından fazla GPU sipariş etti.Adı verilemeyen başka bir büyük şirketin en az daha fazla siparişi var. 1 milyardan fazla Yuan Renminbi.

Daha da abartılı olan şu ki, bu şirketlerin sonunda kartı alıp alamayacakları, daha çok iş ilişkisine, özellikle de geçmişte Nvidia'nın büyük bir müşterisi olup olmadığına bağlı. "İster Çin'in Nvidia'sı ile konuşun, ister Amerika Birleşik Devletleri'ne gidip Lao Huang (Huang Renxun) ile doğrudan konuşun, bu bir fark yaratır."

Sonuç olarak, Nvidia'nın mali verileri bir kez daha yeni zirvelere tırmandı. 25 Mayıs'ta Nvidia ilk çeyrek mali raporunu yayınladı Yapay zeka yongalarının bulunduğu veri merkezi işinin geliri rekor seviyeye ulaştı ve yıllık %10'dan fazla büyüme oranını sürdürdü.

Huang Renxun, tüm veri merkezi ürün hattının şu anda üretimde olduğunu ve talepteki artışı karşılamak için arzın büyük ölçüde artırıldığını açıkladı.

Bir dizi iyi haber, Nvidia'nın hisse senedi fiyatını doğrudan yükseltti ve yükseltti. 30 Mayıs akşamı ABD borsası açıldı ve Nvidia'nın piyasa değeri doğrudan 1 trilyon doları aştı. 19 Temmuz'da Nvidia'nın toplam piyasa değeri bir gecede 175 milyar ABD doları artarak yeniden bir yatırım patlamasını tetikledi.

Companiesmarketcap web sitesine göre, Nvidia'nın toplam piyasa değeri dünyada altıncı sırada yer alıyor ve aynı zamanda şu anda iki TSMC'ye (533.6 milyar $) yakın piyasa değeri en yüksek yonga şirketi konumunda.Nvidia'nın hisse fiyatı bu yıl yaklaşık %180 arttı. yıl. Bu AI çılgınlığı dalgasının Huang Renxun'un Nvidia'sını doldurduğunu itiraf etmeliyim.

02. Nvidia'nın bilgi işlem gücü çılgınlığından zevk alması imkansız

"Nvidia sonsuza kadar büyük ölçekli eğitim ve çıkarım çiplerinde tekele sahip olmayacak."

Sosyal soru-cevap sitesi ve çevrimiçi bilgi pazarı Quora'nın CEO'su Adam D'Angelo'nun tweet'ine Tesla CEO'su Elon Musk'ın yanıtı buydu: "Yapay zeka patlamasının yeterince takdir edilmemesinin bir nedeni GPU'lar. /TPU eksikliği, bu da ürün lansmanlarında ve model eğitiminde çeşitli kısıtlamalara yol açtı, ancak bunların hiçbiri belirgin değildi. Bunun yerine, Nvidia'nın hisse senedi fiyatının hızla yükseldiğini gördük. Arz taleple buluştuğunda işler hızlandı."

Açıkçası, Silicon Valley Iron Man buna katılmıyor ve ayrıca şu yorumu yaptı: "Diğer birçok sinir ağı hızlandırıcı çip de geliştirme aşamasındadır ve Nvidia, büyük ölçekli eğitimi ve muhakemeyi sonsuza kadar tekelinde tutmayacaktır."

Bir fırtına geliyor.

Büyük modellere odaklanan AI çılgınlığı, bilgi işlem gücü piyasası ne kadar büyük olabilir? Soochow Securities, AI modellerinin bilgi işlem gücüne olan talebin artmaya devam ettiğine ve bunun da yüksek performanslı bilgi işlem yongaları için pazar talebini açtığına inanıyor.Ülkemdeki AI yongalarının pazar boyutunun 2025 yılında 178 milyar yuan'a ulaşacağı tahmin ediliyor. 2019'dan 2025'e kadar bileşik yıllık büyüme oranı %42,9'a ulaşacak. Pazar büyüklüğü açısından, yapay zeka çipleri emekleme aşamasındadır, ancak çok büyük bir büyüme potansiyeline sahiptir.

AI çipi, genel olarak yapay zeka uygulamalarındaki hesaplama görevlerini işlemek için özel olarak kullanılan bir modülü ifade eden geniş bir kavramdır.Yapay zeka uygulamalarının hızlı gelişimi çağında doğan bir bilgi işlem görev donanımıdır.Yapay zeka için tüm çipler uygulamalara AI çipleri denir. Üç ana teknik yol vardır: genel amaçlı (GPU), yarı özel (FPGA) ve özel (ASIC).

Büyük ölçekli model eğitimi, senaryo tabanlı ince ayar ve çıkarım uygulama senaryoları açısından, CPU+AI yongaları tarafından sağlanan heterojen bilgi işlem gücü, üstün paralel bilgi işlem yetenekleri ve yüksek ara bağlantı bant genişliği, AI hesaplamanın maksimum verimliliğini destekleyebilir. ve bilgi işlem için akıllı bir ana çözüm haline gelin.

Pazar payı açısından, iResearch'e göre 2027 yılına kadar Çin'in AI çip pazarının 216,4 milyar yuan'a ulaşması bekleniyor. Uygulanan AI modellerinin optimizasyonu ile AI muhakeme çiplerinin oranı her geçen gün artacaktır. 2022'de Çin'in AI eğitim çipleri ve AI muhakeme çipleri sırasıyla %47,2 ve %52,8'i oluşturacak.

Şu anda yapay zeka yongaları alanında üç tür oyuncu var: Biri olağanüstü ürün performansıyla Nvidia ve AMD tarafından temsil edilen eski yonga devleri, diğeri ise Google, Baidu ve Huawei tarafından temsil edilen bulut bilişim devleri. ve büyük modellerin geliştirilmesini desteklemek için AI yongaları, derin öğrenme platformları vb. geliştirdi. Örneğin, Huawei'nin Kunpeng Ascend'i, CANN ve Mindspore, Baidu'nun Kunlun Core'u vb. Son olarak, Cambrian, Biren Technology, Tianshu Zhixin, vb. gibi bazı küçük ve güzel yapay zeka çipli tek boynuzlu atlar var.

Yerli büyük ölçekli modellerin patlak vermesi bilgi işlem gücünde bir boşluğa neden olsa da, yerli çip üreticilerinin yerli ikamenin temettülerinden faydalanması an meselesi. AI eğitim çiplerinin geliştiricisi olarak, "ilk AI çip stoğu" olan Cambrian, bir kez daha piyasanın dikkatini çekti ve hisse senedi fiyatı yükselmeye devam etti.En son piyasa değeri 90 milyarı aştı.

Cambricon, bulut ürün hattında dört nesil çip ürünü piyasaya sürdü: 2018'de Siyuan 100, 2019'da Siyuan 270, 2020'de Siyuan 290 (araç) ve 2021'de piyasaya sürülen Siyuan 370 serisi. Yapay zeka işleme görevlerini desteklemek için kullanılıyor bulut bilgi işlem ve veri merkezi senaryolarında karmaşıklık ve veri hacminde hızlı büyüme ile. Ayrıca Kambriyen'in araştırılan bir ürünü daha var, Siyuan 590 henüz piyasaya çıkmadı. Ayrıca 2022'nin sonunda Siyuan 370 serisi ve AIGC ürünü Baidu Flying Paddle, Seviye II uyumluluk testini tamamlayacak.

Ancak yerli büyük ölçekli model şirketlerinin Kambriyen çiplerini benimseyip benimsemediği henüz kesin bir bilgiye ulaşmış değil. Kıdemli bir çip mühendisi, "Üst düzey AI yongaları alanında, yerli üreticiler emekleme aşamasında ve birçok şeyin doğrulanması için zamana ve paraya ihtiyacı var." Huawei, Baidu ve Haiguang Information gibi şirketlerin çipleri bile Nvidia ürünleriyle açık ara farka sahip.

Birisi bir zamanlar açık yüreklilikle Nvidia ile diğer çip üreticileri arasındaki farkın akademisyenler ve lise öğrencileri arasındaki fark olduğunu söylemişti. Huang Renxun'un dediği gibi, Nvidia "koşuyor" ve devleri geçmek isteyen diğer çip üreticileri ancak çılgınca koşabilirler.

03. Büyük AI modelinin arkasındaki "Game of Thrones"

Nvidia'nın yanı sıra bir diğer GPU devi AMD de son dönemde harekete geçti.

Kısa bir süre önce AMD, en son hızlandırıcı kartını piyasaya sürdü. AMD'nin en son hızlandırıcı kartı Instinct MI300X'i piyasaya sürdüğü konferans sitesinde, PPT'ye özel olarak büyük dil modellerine ayrılmış bir satır sözcük yazıldı. Bu, endüstri tarafından doğrudan bir bildirim olarak kabul ediliyor. Nvidia'ya karşı savaş!

MI300X'in yüksek bant genişliğine sahip bellek (HBM) yoğunluğunun Nvidia H100'ün 2,4 katına, yüksek bant genişliğine sahip bellek bant genişliğinin ise H100'ün 1,6 katına kadar çıkabileceği bildiriliyor. H100'den daha AI modeli.

MI300X'in bulunduğu MI300 serisi, AMD tarafından AI ve HPC için oluşturulan en yeni APU hızlandırıcı kart serisidir. Bunlar arasında MI300A, "temel model" ve MI300X, daha yüksek donanım performansına sahip "büyük model için optimize edilmiş model"dir.

Şu anda MI300A örneklendi ve yakında satın alınabileceği tahmin ediliyor; büyük ölçekli özel kart MI300X ve 8 MI300X'i entegre eden AMD Instinct bilgi işlem platformunun bu yılın üçüncü çeyreğinde örneklenmesi bekleniyor. yılın dördüncü çeyreğinde piyasaya sürülecek.

Son yıllarda, Nvidia'nın AI alanındaki büyük hamleleriyle karşılaştırıldığında, AMD'nin eylemleri biraz yavaş görünüyor. DeepBrain AI CEO'su Eric Jang'ın dediği gibi, AMD'nin son birkaç yılda kendisini hayal kırıklığına uğrattığını ve son beş yılda hiçbir şeyin değişmediğini düşünüyor. Özellikle AIGC'nin patlak verdiği dönemde, eğer AMD ayak uydurmak için çok çalışmazsa aradaki fark daha da açılacak.

AMD'nin MI300 serisi ürünlerinin piyasaya sürülmesiyle nihayet AMD ve Nvidia'nın kafa kafaya mücadele ettiğini görebiliriz.

Ne yazık ki, piyasa AMD'nin yeni kartlarını alıyor gibi görünmüyor.

Bu AMD konferansı sırasında hisse senedi fiyatı yükselmedi, düştü. Buna karşılık, Nvidia'nın hisse senedi fiyatı da bir dalga yükseldi. Piyasa duyarlılığını anlamak zor değil çünkü yüksek teknoloji alanında, özellikle gelişmekte olan piyasalarda, her adıma ayak uydurmak ve güçlüyü korumak ticari piyasada yaygın bir mantık haline geliyor.

Ama aslında, nedenleri dikkatlice inceledikten sonra, Nvidia'nın yapay zeka eğitim çipi pazarını tekelleştirmesinin ana nedeninin kendi geliştirdiği CUDA ekolojisi olduğu bulunabilir. Bu nedenle AMD MI300, Nvidia'nın yerini almak istiyorsa öncelikle Nvidia'nın CUDA ekosistemi ile uyumlu hale gelmesi gerekiyor.AMD, bu amaçla ROCm ekosistemini başlatmış ve HIP üzerinden CUDA ile tam uyumluluğu yakalayarak kullanıcıların bilinen maliyetini düşürmüştür.

Bu bağlamda, tanınmış bir yatırım blog yazarı olan Murong Yi, NVIDIA CUDA ile uyumlu rotayı izlemenin zorluğunun, güncelleme yineleme hızının hiçbir zaman CUDA'ya yetişemeyeceği ve tam uyumluluğa ulaşmanın zor olduğuna inanıyor, yani , bir yandan yineleme her zaman bir adım daha yavaştır. Nvidia GPU, mikro mimaride ve talimat setinde hızlı bir şekilde yinelenir ve üst yazılım yığınındaki birçok yerde karşılık gelen işlev güncellemeleri gerekir, ancak AMD'nin Nvidia'nın ürün yol haritasını bilmesi imkansızdır ve yazılım güncellemeleri her zaman bir adım daha yavaş olacaktır. Nvidia (örneğin AMD, CUDA11 desteğini yeni duyurmuş olabilir ancak Nvidia, CUDA12'yi piyasaya sürdü); öte yandan tam uyumluluğun zorluğu, geliştiricilerin iş yükünü artıracaktır.CUDA gibi büyük ölçekli yazılımların mimarisi, çok karmaşık ve AMD'nin çok fazla insan gücü ve malzeme kaynağına yatırım yapması gerekiyor.Ona yetişmek yıllar hatta on yıldan fazla zaman alacak, çünkü kaçınılmaz olarak işlevsel farklılıklar olacak ve uyumluluk iyi yapılmazsa, etkileyecektir. performans. Bu nedenle, herkesin satın almamasının temel nedenleri de bunlardır.

Khaveen Investments tarafından yapılan tahminlere göre Nvidia'nın veri merkezi GPU pazar payı 2022'de %88'e ulaşacak ve gerisini AMD ve Intel paylaşacak.

OpenAI geçen yıl ChatGPT'yi piyasaya sürdüğünden beri, yeni bir teknolojik devrim turu mayalanmaya devam etti. Uzun yıllardır hiçbir teknolojik gelişmenin dünyanın dikkatini ChatGPT kadar çekmediği söylenebilir.

Yurtiçi ve yurtdışındaki çeşitli teknoloji şirketleri, bilimsel araştırma kurumları ve kolejler ve üniversiteler takip ediyor.Yarım yıldan kısa bir süre içinde, büyük ölçekli model uygulamaları için birçok yeni şirket ortaya çıktı ve finansman ölçeği defalarca arttı. yeni zirvelere ulaşın.

Blog yazarı wgang'a göre, Baidu, iFLYTEK, 4Paradigm, Tsinghua Üniversitesi, Fudan ve diğer büyük yerli fabrikalar, start-up şirketler ve bilimsel araştırma kurumları art arda büyük ölçekli model ürünler piyasaya sürdüler:

Kaynak: Zhihu wgwang

Sadece genel alanda değil, spesifik sektör senaryolarında da özellikle profesyonelliğin güçlü olduğu ve bilgi yoğunluğunun yüksek olduğu bazı alanlarda teknoloji şirketlerinin dikey alanlarda da büyük modeller piyasaya sürdüğü görülmektedir. Örneğin, ABD'de kayıtlı bir şirket olan Baijiayun (RTC), kısa bir süre önce, işletmelerin hizmet ihtiyaçlarına ilişkin içgörüsüne dayanarak AIGC ürünü "Market Easy"yi piyasaya sürdü. Bu aynı zamanda içerik üretim senaryolarına uygun ilk GPT büyük ölçekli model motorudur. kurumsal pazarlama departmanları.

Sektörden bazı kişiler gülümseyerek şunları söyledi: "Yerli büyük ölçekli modeller, model gruplarının çılgınca dans ettiği ve yüz modelin yarıştığı bir durum oluşturdu. Yıl sonuna kadar 100'den fazla büyük ölçekli model olması bekleniyor. yıl."

Bununla birlikte, büyük modellerin geliştirilmesi üç önemli faktörün desteğini gerektirir: algoritmalar, bilgi işlem gücü ve veriler. İşlem gücü, büyük model eğitimi için önemli bir enerji motorudur ve aynı zamanda büyük model endüstrisinin gelişiminin önünde büyük bir engeldir. Çin'de.

Çip kapasitesi, yüksek bilgi işlemli eğitimin etkisini ve hızını doğrudan etkiler. Yukarıda da belirttiğimiz gibi yerli büyük ölçekli model ürünler sık sık karşımıza çıksa da arkalarındaki yongalara bakılırsa tüm bu platformlar ya Nvidia A100 ve H100 GPU'ları ya da Nvidia'nın geçen yılki yasağın ardından özel olarak piyasaya sürdüğü azaltılmış konfigürasyon versiyonu A800 ve A800 GPU'ları kullanıyor. H800, bu iki işlemcinin bant genişliği, yüksek performanslı GPU'nun sınırlama standardından kaçınarak orijinal versiyonun yaklaşık 3/4'ü ve yaklaşık yarısı kadardır.

Bu yılın Mart ayında Tencent, H800'ü kullandığını duyurmada başı çekti.H800'ü Tencent Cloud tarafından piyasaya sürülen yüksek performanslı bilgi işlem hizmetlerinin yeni sürümünde zaten kullanmıştı ve bunun Çin'de bir ilk olduğunu söyledi.

Alibaba Cloud ayrıca bu yılın Mayıs ayında dahili olarak "Akıllı Bilgi İşlem Savaşının" bu yılın bir numaralı savaşı olacağını önerdi ve GPU sayısı bu savaşın önemli bir göstergesi haline geldi.

Ayrıca Shangtang, 10.000'i Nvidia A100 olmak üzere "AI büyük cihaz" bilgi işlem kümesinde yaklaşık 30.000 GPU'nun konuşlandırıldığını duyurdu. Byte ve Meituan, büyük model eğitimi için şirketin diğer iş ekiplerinden GPU'ları doğrudan tahsis eder. Hatta bazı üreticiler, 2022'nin ikinci yarısından itibaren A100'ü piyasadan kaldırabilecek çeşitli komple makine ürünleri arıyor, tek amacı GPU yongaları elde etmek. "Çok fazla makine var ve bunları depolamak için yeterli yer yok."

Yerli lider teknoloji şirketlerinin yapay zeka ve bulut bilişime yoğun yatırım yaptığı anlaşılıyor.Geçmişte A100'ün birikimi onbinleri buldu.

Aynı zamanda, Çin'in büyük teknoloji şirketleri hala yeni bir satın alma rekabeti içindeler.

Bir bulut hizmeti sağlayıcısına göre, Byte ve Alibaba gibi büyük şirketler, esas olarak doğrudan orijinal Nvidia fabrikasıyla satın alma pazarlığı yapıyor ve acentelerin ve ikinci el pazarlarının onların devasa ihtiyaçlarını karşılaması zor.

Yukarıda bahsedildiği gibi, ByteDance bu yıl Nvidia'dan 1 milyar ABD dolarından fazla GPU ürünü sipariş etti.Bu yıl tek başına Byte satın alma hacmi, Nvidia tarafından geçen yıl Çin'de satılan ticari GPU'ların toplam satışına yakın. Raporlara göre, en az 1 milyar yuan'dan fazla siparişi olan başka bir büyük şirket var.

Görüldüğü gibi Çin'in büyük teknoloji firmaları GPU alımı konusunda oldukça aceleci davranıyor.

Sadece yerli şirketler değil, büyük yabancı müşteriler de Nvidia'nın A100/H100 yongalarına çok güçlü bir taleple karşı karşıya. İstatistiklere göre, ilk olarak ChatGPT benzeri ürünleri test etmeye başlayan Baidu, 2020'den bu yana yıllık 800 milyon ABD Doları ile 2 milyar ABD Doları arasında, Alibaba'nın yıllık sermaye harcaması ise 6 milyar ABD Doları ile 8 milyar ABD Doları arasındadır. Aynı dönemde kendi veri merkezlerini kuran dört Amerikan teknoloji şirketi Amazon, Meta, Google ve Microsoft'un yıllık sermaye harcamaları en az 15 milyar ABD doları oldu.

Şu anda, Nvidia'nın siparişlerinin görünürlüğü 2024'e ulaştı ve üst düzey çipler yetersiz kalıyor. Mevcut üretim programına göre, A800/H800 bile bu yılın sonuna veya gelecek yıla kadar teslim edilmeyecek. Kısa vadede popülaritesi açısından bakıldığında Nvidia'nın üst düzey GPU satışlarını etkileyen tek şey TSMC'nin üretim kapasitesi olabilir.

04. "Çılgın" Nvidia'nın arkasında yerli çipler hem donanım hem de yazılım açısından yetersiz mi?

Büyük ölçekli model ürünlerin çip tedarikine bakılırsa, AI büyük ölçekli model eğitimi açısından şu anda A100, H100 ve A800 ve H800'ün Çin'e özel olarak tedarik edilen küçültülmüş versiyonlarının yerini hiçbir şey tutamaz.

Öyleyse neden bu GPT patlamasında Nvidia liderliği ele geçirdi ve iyi performans gösterdi?

Huaying Capital'in yönetici ortağı Zhang Gaonan, bir yandan bunun nedeninin Nvidia'nın en eski düzene sahip olması ve mikro çekirdek yapısının da nesilden nesile gelişip gelişmesi olduğunu söyledi. Eşzamanlılık, veri yolu hızı veya mikro çekirdeğin matris dönüşümü için olgun desteği açısından, yetenekleri zaten çok verimli, aynı zamanda çok eksiksiz bir CUDA bilgi işlem platformu sağlamak da dahil, bu aslında potansiyel bir endüstri standardı haline geldi. derin öğrenme algoritmaları Tüm endüstriyel zincirin destekleyici tesisleri de oldukça eksiksizdir ve kapsamlı rekabet engelleri ve hendek derinliği son derece yüksektir.

Özetlemek gerekirse, Nvidia GPU'nun mevcut vazgeçilmezliği büyük modellerin eğitim mekanizmasından kaynaklanmaktadır.Temel adımları ön eğitim ve ince ayardır.İlki, genel eğitim almakla eşdeğer olan temeli atmaktır.Üniversiteden mezun olmak ; ikincisi, iş performansını iyileştirmek için belirli senaryolar ve görevler için optimize edilmiştir.

Peki yerli GPU yongaları, büyük modellerin bilgi işlem gücü gereksinimlerini destekleyebilir mi?

Pratik uygulamalarda, büyük modelin bilgi işlem gücü talebi iki aşamaya ayrılır: Biri ChatGPT büyük modelini eğitme süreci, diğeri ise modeli ticarileştirmenin akıl yürütme sürecidir. Yani, AI eğitimi modeller yapmaktır ve AI muhakemesi modelleri kullanmaktır ve eğitim daha yüksek çip performansı gerektirir.

Buna bağlı olarak yerli AI chip şirketleri birbiri ardına piyasaya ürün sunarak ortaya çıkmaya devam ediyor. Suiyuan Technology, Biren Technology, Tianshu Zhixin ve Cambrian gibi şirketlerin hepsi kendi bulut GPU ürünlerini piyasaya sürdü ve teorik performans göstergeleri zayıf değil. Haiguang Information'ın DCU çipi "Shensu No. 1" nispeten eksiksiz bir yazılım ve donanım ekosistemine sahiptir ve CUDA mimarisiyle uyumludur. Tencent, Baidu ve Ali gibi büyük İnternet şirketleri de yatırım ve kuluçka yoluyla yapay zeka çipleri alanında güçlü bir şekilde konuşlanıyor.

Bunların arasında, büyük ölçekli model eğitiminin, bulut eğitim çipleri için daha yüksek hassasiyet ve bilgi işlem hızı gerektiren yüksek ayrıntı düzeyine sahip bilgileri işlemesi gerekir. Şu anda, çoğu yerli GPU'nun büyük ölçekli model eğitimini destekleme yeteneği yoktur. Uygundur. bu kadar yüksek ayrıntı düzeyi gerektirmeyen bulut çıkarım çalışması için.

* Bazı yerel ilgili şirketlerin AI ürünleri ve uygulama çekirdek dalga IC'leri, kamuya açık bilgilere göre sıralanmıştır *

Bu yılın Mart ayında Baidu Li Yanhong, Kunlun çipinin artık büyük modellerin akıl yürütmesi için çok uygun olduğunu ve gelecekte eğitim için uygun olacağını kamuoyuna açıkladı.

Tianshu Zhixin'in başkan yardımcısı Zou Wei de Xinchao IC'ye yerli çipler ile Nvidia'nın en son ürünleri arasında hala belirli bir boşluk olduğunu ancak çıkarım hesaplamaları açısından yerli çiplerin ana akım ürünlerle aynı performansı elde edebildiğini ve uygulama ile birlikte söyledi. yapay zeka Popülaritesi, akıl yürütme çiplerine yönelik pazar talebi büyümeyi hızlandıracak ve talebin artmasıyla birlikte yerli çipler de daha büyük bir pazara sahip olacak.

Sektörde adını vermek istemeyen başka bir kişi, "Yerli genel amaçlı GPU ürünlerinin, uluslararası amiral gemisi ürünlerle büyük ölçekli model eğitimini karşılamada bir açığı var, ancak bu onarılamaz değil. ürün tanımındaki büyük ölçekli modeller doğrultusunda tasarlanmamıştır."

Şu anda endüstri pratisyenleri, çip bilgi işlem gücünün yongalar ve gelişmiş paketleme yoluyla geliştirilip iyileştirilemeyeceğini düşünmek gibi ilgili keşifler ve çabalar yapıyorlar. Şu anda yerli GPU firmaları büyük modeller alanında chip geliştirme ve layout yapıyor.

Sermaye açısından bakıldığında, Huaying Capital'in yönetici ortağı Zhang Gaonan, Xinchao IC'ye Huaying'in GPU, DPU veya daha ileri teknoloji fotoelektrik hibrit hesaplama, kuantum hesaplama olsun, uzun süredir bilgi işlem gücü altyapısına çok dikkat ettiğini söyledi. , Hedefli araştırma ve düzen vardır. Genel olarak, FPGA ve uç bilgi işlem gibi genel amaçlı bilgi işlem altyapısına odaklanır. Buna karşılık, şu anda, derin öğrenme, özel algoritmalar, yerel bilgi işlem gücü optimizasyonu vb. etrafındaki birçok bilgi işlem gücü yongası, dikkate alınmasının odak noktası değildir.

Aslında, donanım performansındaki boşluğa ek olarak, yazılım ekosistemi de yerli AI çip üreticilerinin bir eksikliğidir.

Çipin donanım sistemi, araç zinciri, derleyici vb. gibi birden çok seviyeye uyum sağlaması gerekir ve güçlü bir uyarlanabilirliğe ihtiyaç duyar. %80 performans senaryosu tükendi.

Yukarıda bahsedildiği gibi, Nvidia'nın bu konuda bariz avantajları var. 2006 gibi erken bir tarihte Nvidia, paralel bir bilgi işlem yazılım motoru olan bilgi işlem platformu CUDA'yı piyasaya sürdü. CUDA çerçevesi, GPU hesaplama gücünü çalıştırmak için gereken birçok kodu birleştirir. Mühendisler bu kodları tek tek yazmadan doğrudan kullanabilirler. Geliştiriciler, yapay zeka eğitimini ve akıl yürütmeyi daha verimli gerçekleştirmek ve GPU bilgi işlem gücünden daha iyi yararlanmak için CUDA'yı kullanabilir. Bugün CUDA bir yapay zeka altyapısı haline geldi ve ana akım yapay zeka çerçeveleri, kitaplıkları ve araçlarının tümü CUDA'ya dayalı olarak geliştirildi.

Bu kodlama dilleri seti olmadan, yazılım mühendislerinin donanımın değerini anlaması son derece zor olacaktır.

Nvidia dışındaki GPU'lar ve AI yongaları, CUDA'ya erişmek istiyorsa, kendi uyarlama yazılımlarını sağlamaları gerekir. Sektördeki bilgilere göre, NVIDIA olmayan bir GPU üreticisiyle iletişime geçtim. Çip ve hizmet teklifleri NVIDIA'nınkinden daha düşük olmasına ve daha zamanında hizmet sağlama sözü vermesine rağmen, onun GPU'sunu kullanmanın genel eğitim ve geliştirme maliyetleri NVIDIA'nınkinden daha yüksek olacaktır. sonuçların ve geliştirme süresinin belirsizliği.

Nvidia GPU'ları pahalı olsa da, aslında kullanımı en ucuz olanlardır. Büyük ölçekli modellerin fırsatını değerlendirmek isteyen şirketler için, para genellikle sorun değildir ve zaman daha değerli bir kaynaktır.İlk hamle avantajını sağlamak için herkesin mümkün olan en kısa sürede yeterince gelişmiş bilgi işlem gücüne sahip olması gerekir.

Bu nedenle, yerel çip tedarikçileri için, karşılaştırılabilir bilgi işlem gücüne sahip bir ürün, çipleri istifleyerek istiflenebilse bile, müşterilerin yazılım uyarlamasını ve uyumluluğunu kabul etmesi daha zordur. Ayrıca sunucu işletimi açısından anakart giderleri, elektrik giderleri, işletme giderleri, güç tüketimi ve ısı dağılımı gibi dikkat edilmesi gereken hususlar veri merkezinin işletme maliyetlerini oldukça artıracaktır.

Bilgi işlem güç kaynaklarının genellikle havuzlama şeklinde sunulması gerektiğinden, veri merkezleri genellikle bilgi işlem güç havuzlama zorluğunu azaltmak için aynı çipi veya aynı şirketten gelen çipleri kullanmaya daha isteklidir.

Bilgi işlem gücünün serbest bırakılması, çipin teorik bilgi işlem gücünü etkili bilgi işlem gücüne dönüştürmek için karmaşık yazılım ve donanım işbirliğini gerektirir. Müşteriler için yerli AI çiplerini kullanmak kolay değildir.Bulut AI çiplerinin değiştirilmesi, yeni ürünün performans avantajları olmadıkça veya başkalarının belirli bir boyutta çözemeyeceği sorunları sağlamadıkça, belirli geçiş maliyetleri ve riskleri gerektirir.Aksi takdirde, istekli değiştirilecek müşteri sayısı çok düşüktür.

ChatGPT'yi fiilen işleyebilen tek GPU tedarikçisi olarak Nvidia, hak ettiği "Yapay Zeka bilgi işlem gücünün kralı"dır. Altı yıl önce Huang Renxun, A100 yongası ile donatılmış ilk süper bilgisayarı OpenAI'ye şahsen teslim etti, ikincisinin ChatGPT'yi oluşturmasına yardımcı oldu ve AI çağının lideri oldu.

Bununla birlikte, Amerika Birleşik Devletleri'nin geçen yıl ihracat kontrollerini uygulamaya koymasından bu yana, Nvidia'nın en gelişmiş GPU yongalarından ikisi olan H100 ve A100'ü Çin'e ihraç etmesi yasaklandı. Bu şüphesiz alt uygulama şirketlerine bir darbedir.

Güvenlik ve otokontrol açısından bakıldığında, bu aynı zamanda yerli çip şirketleri için yeni bir fırsat penceresi sunuyor. Yerli yongalar, karmaşık uluslararası ticari ilişkiler ve jeopolitik faktörler nedeniyle performans ve yazılım ekolojisi açısından Nvidia ve AMD gibi endüstri devlerinden daha düşük olsa da, "yerli ikame" yerli yarı iletken endüstrisinin gelişiminin ana teması haline geldi.

05. Sonuç

Bilgi işlem gücündeki her artış, bir teknolojik ve endüstriyel değişim dalgasını başlatacaktır: CPU'lar insanlığı PC çağına yönlendirir, mobil yongalar bir mobil İnternet dalgasını başlatır ve AI yongaları, AI'daki onlarca yıllık bilgi işlem gücü darboğazını kırar ​endüstri.

Bugün "AI iPhone anı" geldi ve bir sonraki döneme giden yol şimdiden önümüzde olabilir.

Bu veri merkezlerindeki yapay zeka yongaları ve yazılım sistemleri alanlarına hâlâ yabancı üreticiler hakim olsa da, "bilgi işlem gücünün yerelleştirilmesi" için pazar kapısı şimdi açılıyor olabilir.

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)