NVIDIA memutus pasokan chip kelas atas terlebih dahulu, dan daya komputasi perusahaan China menerobos

Sumber asli: Laboratorium berbasis silikon

Sumber gambar: Dihasilkan oleh Unbounded AI

Pada 17 Oktober, Biro Industri dan Keamanan (BIS) Departemen Perdagangan AS mengeluarkan larangan ekspor baru pada chip, memperketat pembatasan pembelian chip high-end penting China.

Membatasi impor chip kelas atas China tidak diragukan lagi untuk menahan perkembangan industri teknologi China. Penelitian sebelumnya telah menunjukkan bahwa untuk setiap kenaikan 1 poin dalam indeks daya komputasi, ekonomi digital dan PDB akan meningkat masing-masing sebesar 3,5 ‰ dan 1,8 ‰.

Namun, pengetatan pembatasan eksternal tidak menyebabkan stagnasi industri daya komputasi China, yang telah melewati angka triliun dolar. **Menurut Akademi Teknologi Informasi dan Komunikasi China, pada akhir tahun 2021, skala industri daya komputasi inti China telah melampaui 1,5 triliun yuan, dan skala industri terkait telah melebihi 8 triliun yuan.

Di balik pasar triliunan dolar, perusahaan dan pemerintah bekerja sama untuk merebut era AI.

Di satu sisi, sejak peluncuran ChatGPT, perusahaan domestik dan lembaga penelitian telah meluncurkan lebih dari 130 model besar hanya dalam waktu setengah tahun, di antaranya para pemain terkemuka mulai menerapkan model besar ke skenario tertentu dan membuat aplikasi eksplosif.

Di sisi lain, untuk membangun basis daya komputasi, pemerintah daerah telah memulai pembangunan pusat komputasi cerdas, meletakkan informasi berkecepatan tinggi di era data besar, mempromosikan inovasi dan peningkatan industri, dan mengurangi biaya perusahaan yang menyebut pencapaian ilmiah dan teknologi diwakili oleh model besar.

Perdagangan chip eksternal secara bertahap mendingin, dan pasar daya komputasi internal telah berkilau, dan di antara dua langit es dan api, orang tidak bisa tidak penasaran:

Kota mana yang telah ditangkap oleh pertempuran terobosan industri daya komputasi China? Bagaimana cara memutus rantai industri daya komputasi? Dalam proses ini, perusahaan mana yang telah memikul tanggung jawab perintis?

**01 NVIDIA memotong pasokan, mempengaruhi geometri? **

Jika model bahasa besar digunakan sebagai dasar untuk memproses permintaan inferensi 1,4 miliar orang di Tiongkok pada saat yang sama, jumlah komputasi yang diperlukan melebihi total daya komputasi pusat data Tiongkok sebesar 3 kali lipat. "**

Pada Konferensi Kecerdasan Buatan Dunia (WAIC) 2023 di Shanghai pada Juli tahun ini, Wang Yu, seorang profesor teknik elektronik di Universitas Tsinghua, mengungkapkan skala kesenjangan daya komputasi domestik.

Faktanya, tidak hanya model besar, tetapi juga popularitas aplikasi yang beragam di 5G, kota pintar, dan Internet of Things juga telah membawa percepatan pembuatan data yang berkelanjutan.

IDC memperkirakan bahwa skala kekuatan komputasi cerdas China akan mencapai 1271EFLOPS pada tahun 2026, dengan tingkat pertumbuhan tahunan gabungan sebesar 69,45%. Pada akhir tahun 2022, "Buku Putih Pengembangan Daya Komputasi Cerdas 2023" yang disusun oleh New H3C Group dan Akademi Teknologi Informasi dan Komunikasi China menunjukkan bahwa total daya komputasi domestik hanya 180EFLOPS. (Catatan: FLOPS mengacu pada operasi floating-point per detik, dan 1271EFLOPS berarti 1271 operasi exascale per detik.) )

** Untuk mengatasi situasi kekurangan daya komputasi saat ini, negara telah berturut-turut mengeluarkan sejumlah dokumen untuk mendukung dan memandu semua daerah untuk mempercepat pembangunan infrastruktur daya komputasi. **

Diantaranya, Rencana Aksi untuk Pengembangan Infrastruktur Daya Komputasi Berkualitas Tinggi yang dirilis pada bulan Oktober dengan jelas menyatakan bahwa skala daya komputasi akan melebihi 300EFLOPS pada tahun 2025, di mana proporsi daya komputasi cerdas yang dapat digunakan untuk pelatihan model besar perlu mencapai 35%.

Saat ini, ada sekitar 31 pusat komputasi cerdas yang didanai oleh pemerintah, sesuai dengan total daya komputasi 10,13EFLOPS dalam rencana tersebut, dengan total investasi hampir 47 miliar yuan, yang masih jauh dari total skala daya komputasi cerdas yang direncanakan sebesar 105E, 50 pusat komputasi cerdas, dan skala daya komputasi pusat tunggal sebesar 2,1EFLOPS.

** Faktanya, tidak hanya di Cina, tetapi juga di dunia, ada kekurangan daya komputasi. Menurut data OpenAI, ada kesenjangan 10.000 kali lipat antara tingkat pertumbuhan volume komputasi model dan tingkat pertumbuhan daya komputasi perangkat keras kecerdasan buatan. **

Kekurangan daya komputasi pertama kali berkontribusi pada meroketnya harga GPU. Sejak Desember tahun lalu, harga NVIDIA A100 telah meningkat hampir 40% dalam 5 bulan. H100 baru tahun ini bahkan lebih tak ternilai harganya.

Karena masuknya pesanan, siklus pengiriman NVIDIA, produsen GPU dengan pangsa pasar tertinggi, telah diperpanjang dari satu bulan menjadi lebih dari tiga bulan, dan bahkan beberapa pesanan mungkin tidak terkirim hingga 2024. Alasan utamanya adalah rantai pasokan chip panjang dan terfragmentasi, dan tidak mungkin untuk memperluas kapasitas produksi dengan cepat.

**Karena pembatasan larangan AS, rencana produsen dalam negeri untuk memperluas daya komputasi lebih sulit diterapkan daripada Google, Meta, dan OpenAI. **

Sebelum mengumumkan putaran baru larangan, Nvidia mengadaptasi aturan pembatasan dengan memasok pasar Cina dengan "versi dikebiri" dari chip komputasi unggulan A800 dan H800, yang telah mengurangi kecepatan interkoneksi.

Pada bulan Agustus, media melaporkan bahwa perusahaan seperti Baidu, Tencent, Alibaba dan ByteDance telah memesan $ 5 miliar chip dari Nvidia. Dari jumlah itu, $ 1 miliar telah dipesan untuk A800, yang diharapkan akan dikirimkan tahun ini. Sisa pesanan $ 4 miliar akan dikirimkan pada tahun 2024.

Setelah pengumuman larangan ini, karena kepadatan kinerja sebagai persyaratan yang relevan untuk membatasi standar baru, chip A800 dan H800, karena melebihi standar, juga akan sepenuhnya dilarang.

Dalam pengajuan 8-K NVIDIA yang diperbarui dengan Komisi Sekuritas dan Bursa AS (SEC), disebutkan bahwa pemerintah AS telah memajukan waktu efektif larangan lima chip GPU NVIDIA, termasuk A100, A800, H100, H800 dan L40S, dari akhir November yang asli untuk segera berlaku.

**Perubahan di atas berarti bahwa sekitar 100.000 chip A800 yang telah dipesan BAT kemungkinan besar tidak akan dikirim. **

Namun, infrastruktur daya komputasi domestik tampaknya tidak banyak terpengaruh. Saat ini, ada hampir 30 pusat komputasi cerdas yang sedang dibangun atau diselesaikan, di mana lebih dari 50% pemasok chip adalah Huawei Ascend.

Sebelumnya, Liu Qingfeng, ketua iFLYTEK, mengatakan pada konferensi pers bahwa kinerja Huawei Ascend 910B sudah dapat dibandingkan dengan A100.

Secara keseluruhan, meskipun pengetatan lebih lanjut dari pembatasan AS terhadap China telah menyeret kemajuan iterasi model besar dari beberapa raksasa Internet, infrastruktur daya komputasi domestik masih terus maju. **

Dan karena kesulitan mengimpor chip akan terus meningkat di masa mendatang, untuk pertimbangan keamanan rantai pasokan, produsen chip dalam negeri diharapkan dapat mengantarkan gelombang baru peluang pengembangan.

02 Terobosan Daya Komputasi: Penelitian Mandiri Tangan Kiri, Ekologi Tangan Kanan

Meskipun satu-satunya produsen GPU yang secara umum diakui di pasar internasional adalah NVIDIA dan AMD, ini tidak berarti bahwa tidak ada pilihan lain selain mereka.

**Dibandingkan dengan chip ASIC, GPU memiliki keunggulan fleksibilitas yang kuat dan cocok untuk berbagai bidang penelitian. Namun, dibagi lagi menjadi berbagai perusahaan, pada kenyataannya, ada kelebihan daya komputasi umum, ** seperti kemampuan inferensi model besar yang hanya perlu menggunakan GPU, dan tidak membutuhkan daya komputasi grafisnya.

Oleh karena itu, banyak produsen telah memulai jalan penelitian dan pengembangan independen sesuai dengan kebutuhan mereka sendiri. **

Misalnya, Alibaba merilis chip yang dikembangkan sendiri Hanguang 800 pada Mei tahun ini, yang dikatakan sebagai kinerja terkuat dalam chip AI pada waktu itu, dengan daya komputasi setara dengan 10 CPU; Chip AI cloud full-function yang dikembangkan sendiri oleh Baidu, Kunlun, juga telah diiterasi ke 3.0 dan akan mencapai produksi massal pada tahun 2024.

Di antara perusahaan chip yang dikembangkan sendiri, yang paling keras tidak diragukan lagi adalah Huawei yang disebutkan di atas.

Baru-baru ini, mesin all-in-one Spark yang dibuat bersama oleh Huawei dan iFLYTEK telah diletakkan di puncak lagi.

Menurut informasi publik, mesin all-in-one Xinghuo didasarkan pada Kunpeng CPU + Ascend GPU, menggunakan penyimpanan dan jaringan Huawei untuk memberikan solusi kabinet lengkap, dengan daya komputasi FP16 sebesar 2,5 PFLOPS. Sebaliknya, NVIDIA DGX A100 8-GPU, yang paling populer dalam pelatihan model besar, dapat menghasilkan daya komputasi 5PFLOPS FP16.

"Wisdom" telah melaporkan bahwa dalam skenario model besar tertentu seperti Pangu dan Xunfei Xinghuo, Ascend 910 telah sedikit melampaui versi PCIe A100 80GB, mencapai penggantian domestik. Namun, keserbagunaannya masih belum mencukupi, dan model lain, seperti GPT-3, perlu dioptimalkan secara mendalam sebelum dapat berjalan dengan lancar di platform Huawei.

Selain itu, Moore Thread dan Walltech yang baru dimasukkan dalam daftar entitas dalam putaran sanksi ini juga memiliki produk kartu tunggal GPU yang sesuai, dan beberapa indikator dekat dengan NVIDIA.

Selain dampak sanksi AS, chip yang dikembangkan sendiri juga dapat melemahkan ketergantungan berlebihan pada NVIDIA, meningkatkan otonomi strategis perusahaan, dan memimpin dalam memperluas skala daya komputasi di depan pesaing. **

Salah satu buktinya adalah bahwa bahkan perusahaan seperti Google, OpenAI, dan Apple yang tidak dikenakan sanksi telah meluncurkan rencana untuk mengembangkan chip mereka sendiri.

Agar tidak lagi tunduk pada pemasok tunggal, beberapa produsen server juga mulai mengadopsi arsitektur terbuka yang kompatibel dengan chip inovasi independen dalam negeri. **

Misalnya, Inspur Information, yang saat ini menyumbang pangsa pasar tertinggi server domestik, telah meluncurkan arsitektur komputasi terbuka, yang dikatakan memiliki karakteristik daya komputasi besar, interkoneksi tinggi, dan ekspansi yang kuat.

Berdasarkan hal ini, Inspur merilis tiga generasi produk server AI, mewujudkan pendaratan beberapa produk komputasi AI dengan lebih dari 10 mitra chip, dan meluncurkan platform AIStation, yang secara efisien dapat menjadwalkan lebih dari 30 chip AI.

** Secara obyektif, produsen server adalah mata rantai yang relatif lemah dalam rantai industri daya komputasi, hulu membutuhkan raksasa internasional dengan posisi monopoli seperti NVIDIA untuk membeli chip, dan hilir adalah produsen G-end dan cloud, yang tidak memiliki daya tawar dari atas ke bawah. **

Jadi kita bisa melihat bahwa meskipun pendapatan NVIDIA dalam satu kuartal mencapai rekor tertinggi, mencapai $13,51 miliar, peningkatan tahun-ke-tahun sebesar 101%, dan laba bersih melonjak 843% tahun-ke-tahun menjadi $6,188 miliar, laba bersih Inspur pada paruh pertama tahun ini masih merah.

** Untuk memastikan bahwa mereka dapat bertahan hingga triliun uang pasar, vendor server tidak berusaha keras untuk membuktikan nilainya. Secara khusus, ia menyediakan manajemen cluster server AI dan solusi penyebaran untuk memastikan ketersediaan tinggi, kinerja tinggi, dan efisiensi server yang tinggi.

Pada saat yang sama, produsen juga bersaing untuk meluncurkan laporan, standar, dan pedoman industri dengan harapan mendapatkan suara.

Dengan chip yang dikembangkan sendiri di tangan kiri dan ekologi terbuka dengan tangan kanan, rantai industri daya komputasi domestik berada dalam situasi kompleks yang belum pernah terjadi sebelumnya, dengan persaingan dan kerja sama di antara mereka.

Dalam jangka panjang, faktor penentu nyata dalam terobosan daya komputasi masih teknologi, yang mencakup ekologi, perangkat lunak dan perangkat keras, dll., Yang membutuhkan pemain hulu dan hilir untuk membuat lubang untuk mengatasi kesulitan bersama.

Tetapi sebelum benar-benar melalui jalan independen chip, yang lebih penting adalah bagaimana menggunakan setiap sen daya komputasi pada bilahnya, sampai batas tertentu, jawaban atas pertanyaan ini juga mengisyaratkan garis besar pemain yang akan memenangkan pasar 100 miliar di masa depan. **

03 Menggunakan daya komputasi dengan baik adalah prioritas utama

Sebelum menjawab bagaimana menggunakan daya komputasi dengan baik, Anda perlu memikirkan pertanyaan lain: bagaimana menggunakan daya komputasi untuk menggunakannya dengan baik?

** Dilema yang dihadapi industri tenaga komputasi domestik terutama tiga kali lipat: **

** Pertama, kurangnya daya komputasi. **Sumber daya daya komputasi berkualitas tinggi tidak mencukupi dan tersebar, peningkatan GPU terbatas, dan stok sangat tidak mencukupi, yang sulit untuk mendukung pelatihan model besar lebih lanjut, dan secara bertahap menjadi masalah "leher macet" baru.

Kedua, daya komputasi itu mahal. ** Infrastruktur daya komputasi adalah industri padat aset dan padat modal, dengan karakteristik investasi awal yang besar, iterasi teknologi yang cepat, dan ambang konstruksi yang tinggi, dan konstruksi serta operasinya membutuhkan waktu dan biaya modal yang besar, jauh melampaui ruang lingkup usaha kecil dan menengah.

Ketiga, permintaan daya komputasi terdiversifikasi dan terfragmentasi, dan ketidaksesuaian antara penawaran dan permintaan sumber daya komputasi terjadi dari waktu ke waktu. **

Dilema pertama sedang dipecahkan, tetapi ini bukan upaya satu hari, jadi pada tahap ini, arti sebenarnya dari menggunakan daya komputasi seharusnya adalah membuat daya komputasi lebih murah dan mampu menangani beragam kebutuhan.

Jadi, perusahaan mana yang memiliki gerakan paling imajinatif?

**Dalam hal mengurangi konsumsi dan meningkatkan efisiensi untuk pusat komputasi cerdas, konsep Alibaba tentang "menghijaukan seluruh rantai industri daya komputasi" patut dinantikan. **

Seperti yang kita semua tahu, biaya energi pelatihan model besar sangat tinggi. Namun pada kenyataannya, hanya 20% dari kekuatan ini digunakan untuk perhitungan itu sendiri, dan sisanya digunakan untuk menjaga server tetap berjalan. Laporan lingkungan Google 2023 mengkonfirmasi hal ini dari samping. Menurut laporan itu, Google mengonsumsi hampir 5,2 miliar galon air pada tahun 2022 untuk mendinginkan pusat data, setara dengan 1/4 air minum harian dunia, dan dapat mengisi satu setengah Danau Barat.

Untuk mencapai tingkat penghematan energi dan efek pengurangan emisi yang lebih besar secara keseluruhan, Ant Group dan Akademi Teknologi Informasi dan Komunikasi China (CAICT) merilis Buku Putih tentang Penghijauan Komputasi untuk Aplikasi Daya Komputasi, yang mengedepankan konsep "komputasi hijau ujung ke ujung".

Secara khusus, komputasi hijau end-to-end adalah untuk mempertimbangkan biaya konsumsi energi selama operasi pada tahap awal konstruksi, mulai dari produksi daya, komputasi produksi daya (termasuk pembangun pusat komputasi cerdas, produsen perangkat keras, vendor cloud), hingga aplikasi daya komputasi.

Sampai batas tertentu, berdasarkan proporsi penggunaan energi di masa lalu, pengurangan biaya yang dibawa oleh rantai industri penghijauan mungkin lebih hemat biaya daripada terobosan teknologi chip dalam jangka pendek, yang kondusif untuk peningkatan kecerdasan digital usaha kecil dan menengah.

**Dalam hal meningkatkan tingkat penjadwalan daya komputasi, Huawei, Alibaba, Tencent, Baidu, dan perusahaan lain semuanya telah menyumbangkan kekuatan mereka sendiri, tetapi di antara mereka, gen perusahaan yang paling kompatibel masih Huawei. **

Saat ini, proyek penjadwalan daya komputasi paling inti di China adalah proyek "East Data and West Computing" yang pertama kali diusulkan secara eksplisit dalam "Rencana Implementasi Hub Daya Komputasi Sistem Inovasi Kolaboratif Pusat Data Besar Terintegrasi Nasional" pada tahun 2021, yang bertujuan untuk membangun tugas sistem jaringan daya komputasi nasional.

Menyimpan dan memproses data di timur di barat menghadirkan tantangan besar baik di sisi penawaran maupun sisi distribusi.

Ambil masalah kehilangan paket umum sebagai contoh.

Ketika beberapa server mengirim sejumlah besar paket ke server pada saat yang sama, jumlah paket melebihi kapasitas cache switch dan kehilangan paket terjadi, yang pada gilirannya mempengaruhi efisiensi komputasi dan penyimpanan.

Untuk mengatasi masalah ini, Huawei memperkenalkan algoritme cerdas ke dalam sakelar jaringan pusat data, mengumpulkan informasi status jaringan waktu nyata, seperti kedalaman antrian, throughput bandwidth, model lalu lintas, dan dimensi lainnya, dan secara dinamis mengatur pipa antrean ideal melalui algoritme lossless cerdas, akhirnya mencapai keseimbangan tanpa kehilangan paket, kinerja tinggi, dan latensi rendah setelah pelatihan simulasi.

Selain itu, Huawei telah berinovasi teknologi seperti routing adaptif terdistribusi dan algoritma peta cloud cerdas untuk berpartisipasi dalam desain dan konstruksi node hub nasional.

Ketika model besar domestik menjadi semakin praktis di jalan untuk memberdayakan ribuan industri, pertanyaan tentang "bagaimana memecahkan dilema daya komputasi China" akan menjadi semakin penting. Kita dapat melihat bahwa rantai industri tenaga komputasi China telah menghasilkan banyak perubahan, seperti raksasa Internet menambahkan kode chip yang dikembangkan sendiri, basis daya komputasi yang dibangun dengan chip domestik, dan perkecambahan ekologi perangkat lunak yang tidak dihargai di masa lalu ... Di balik perubahan ini adalah ketekunan dan tekad perusahaan Cina untuk menerobos hambatan teknis.

** Secara obyektif, dalam hal kekuatan teknis, pemain domestik masih memiliki jarak tertentu dari pabrikan kelas dunia, tetapi tidak dapat diabaikan bahwa bahkan NVIDIA, yang sedang berjalan lancar, telah melayang di tepi hidup dan mati selama bertahun-tahun sebelum munculnya era AI. **

Malam sebelum fajar paling gelap, tetapi sinar matahari sudah melewati cakrawala.

Sumber daya:

Investigasi kebenaran kekurangan server AI: harga naik 300.000 dalam dua hari, dan bahkan "Raja MSG" memasuki pasar|Barang Kebijaksanaan

  • Daya komputasi cerdas infrastruktur baru ditumpangkan di luar negeri multi-modal upgrade, aplikasi daya komputasi untuk memenuhi katalis | Sekuritas Zheshang*

Master Rantai Teknologi, Ekosistem Huawei | TF Sekuritas

  • Pelatihan permintaan ledakan "haus akan daya komputasi" bagaimana memecahkan | Netinfo Jilin*

  • Larangan chip AS telah meningkat! NVIDIA, Intel atau Limited | Berita Ekonomi Abad 21*

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)