Setelah setengah tahun pembaptisan AI, mungkin sulit untuk menemukan kata yang lebih tepat daripada "respons stres" untuk menggambarkan keadaan setiap orang di industri teknologi saat ini - ketegangan, rangsangan, dan tekanan.
"Respon stres" mengacu pada serangkaian respons yang dihasilkan organisme untuk mempertahankan homeostasis tubuh ketika mereka menghadapi tekanan atau ancaman lingkungan eksternal. Ini adalah respons alami organisme untuk beradaptasi dengan lingkungan dan memastikan kelangsungan hidup. Respons ini bisa berumur pendek atau tahan lama.
Pada 26 Juli, Twitter resmi OpenAI mengumumkan bahwa ChatGPT versi Android telah tersedia untuk diunduh di Amerika Serikat, India, Bangladesh, dan Brasil, dan berencana untuk memperluas ke lebih banyak negara dalam waktu dekat. ChatGPT memperluas saluran, mendapatkan lebih banyak pengguna dan kelekatan penggunaan yang lebih kuat, dan gelombang AI generatif terus meningkat.
Pada awal Juli, di World Artificial Intelligence Conference (WAIC) 2023 di Shanghai, seorang teknisi dari perusahaan rintisan model skala besar bolak-balik melalui ruang pameran. Dia berencana menemukan solusi chip domestik yang hemat biaya untuk perusahaan digunakan untuk pelatihan model skala besar.
"Kami memiliki 1.000 A100, tetapi itu tidak cukup," katanya kepada Huxiu.
A100 adalah GPU kelas atas dari Nvidia dan fondasi perangkat keras untuk pengembangan ChatGPT. Beberapa data publik menunjukkan bahwa dalam proses pelatihan model seri GPT, jumlah GPU Nvidia yang digunakan oleh OpenAI sekitar 25.000. Oleh karena itu, untuk membuat model besar, Anda harus mengevaluasi terlebih dahulu berapa banyak kartu grafis A100 yang bisa Anda dapatkan, yang hampir menjadi praktik di industri ini.
Dimana GPU? Di mana saya dapat menemukan daya komputasi yang murah? Ini hanyalah mikrokosmos dari sekian banyak pertanyaan di konferensi WAIC 2023.
Hampir semua orang yang "stres" dalam enam bulan terakhir sangat ingin menemukan lebih banyak jawaban tentang AI di "acara" ini.
situs 2023WAIC
Seorang teknisi dari peserta pameran chip memberi tahu Tiger Sniff bahwa selama beberapa hari konferensi WAIC, banyak manajer produk datang ke stan "model besar" mereka, berharap menemukan definisi produk untuk bisnis model besar perusahaan di sini.
Di Forum Zhongguancun pada 28 Mei, "Laporan Penelitian Peta Model Skala Besar Kecerdasan Buatan China" yang dirilis oleh Institut Informasi Ilmiah dan Teknologi China menunjukkan bahwa pada akhir Mei, 79 model skala besar dengan skala parameter dari lebih dari 1 miliar di Cina telah dirilis. Dalam dua bulan ke depan, serangkaian model besar AI seperti Tongyi Wanxiang dari Alibaba Cloud, Pangu 3.0 dari Huawei Cloud, dan Youdao "Ziyue" dirilis. Menurut statistik yang tidak lengkap, model besar AI domestik saat ini telah melampaui 100.
Tindakan perusahaan domestik berebut untuk merilis model AI besar adalah perwujudan terbaik dari "respons stres". Kecemasan yang ditimbulkan oleh "reaksi" ini ditransmisikan ke hampir semua personel yang relevan di industri, dari CEO raksasa Internet hingga peneliti di lembaga penelitian AI, dari mitra dana modal ventura hingga pendiri perusahaan. Perusahaan AI, dan bahkan banyak praktisi Hukum terkait AI, serta regulator keamanan data dan jaringan.
Bagi orang di luar industri, ini mungkin hanya karnaval berumur pendek, tetapi berapa banyak orang yang berani mengatakan bahwa mereka berada di luar AI saat ini.
AI mengantarkan era baru, dan semuanya layak dibentuk ulang dengan model besar. Semakin banyak orang mulai berpikir tentang konsekuensi dari difusi teknologi.
Dana mengalir, roda gila ada di sini
Dalam sebulan setelah kelahiran ChatGPT, Li Zhifei, pendiri ChatGPT, pergi ke Silicon Valley dua kali, dan berbicara tentang model besar dengan semua orang.Saat berbicara dengan Huxiu, Li Zhifei dengan blak-blakan mengatakan bahwa ini adalah "All in" terakhirnya.
Pada 2012, Li Zhifei mendirikan Mobwenwen, sebuah perusahaan kecerdasan buatan dengan interaksi suara dan kombinasi perangkat lunak dan perangkat keras sebagai intinya, yang telah mengalami pasang surut dua gelombang kecerdasan buatan China. Selama periode terpanas dari gelombang terakhir kecerdasan buatan, penilaian Momenwenbang pernah didorong ke tingkat unicorn, tetapi juga mengalami masa sepi sejak saat itu. Baru setelah munculnya ChatGPT, industri kecerdasan buatan itu telah diam selama bertahun-tahun Sebuah lubang robek terbuka.
Di pasar primer, "uang panas mengalir masuk".
Ini adalah konsensus industri terkait model besar dalam enam bulan terakhir. Lu Qi, pendiri Forum Qiji, percaya bahwa model skala besar AI adalah "roda gila", dan masa depan akan menjadi era di mana model ada di mana-mana. "Roda gila ini sudah dimulai", dan kekuatan pendorong terbesar adalah modal.
Pada awal Juli, data yang dirilis oleh platform informasi bisnis Crunchbase menunjukkan bahwa perusahaan yang diklasifikasikan sebagai AI mengumpulkan $25 miliar pada paruh pertama tahun 2023, menyumbang 18% dari pembiayaan global. Meskipun angka tersebut mengalami penurunan dibandingkan dengan US$29 miliar pada paruh pertama tahun 2022, jumlah total pembiayaan berbagai industri di dunia pada paruh pertama tahun 2023 mengalami penurunan sebesar 51% dibandingkan dengan periode yang sama pada tahun 2022, yang menunjukkan bahwa jumlah pembiayaan di bidang AI adalah yang terbesar di dunia Proporsi total pembiayaan hampir dua kali lipat. Crunchbase menulis dalam laporannya: "Tanpa ledakan kecerdasan buatan yang dipicu oleh ChatGPT, jumlah pembiayaan pada tahun 2023 akan lebih rendah lagi."
Sejauh ini, pembiayaan terbesar di industri AI pada tahun 2023 adalah investasi Microsoft sebesar $10 miliar di OpenAI pada bulan Januari.
Tiger Sniff Menurut statistik publik, di antara perusahaan rintisan berskala besar di Amerika Serikat, Infleksi AI dapat menjadi perusahaan rintisan terbesar kedua di bidang kecerdasan buatan setelah Open AI, diikuti oleh Anthropic ($1,5 miliar), Cohere ($445 juta), Adept ($415 juta), Runway ($195,5 juta), Character.ai ($150 juta) dan Stability AI (sekitar $100 juta).
Di China, pada paruh pertama tahun 2023, terdapat 456 insiden investasi dan pembiayaan publik di industri kecerdasan buatan dalam negeri. Dan statistik ini adalah 731, 526, 353, 631 dan 648 dalam lima tahun dari 2018 hingga 2022.
Acara investasi dan pembiayaan publik di industri kecerdasan buatan dalam negeri pada paruh pertama tahun ini
Peristiwa lain yang memicu flywheel adalah rilis antarmuka API oleh ChatGPT. Ketika OpenAI membuka antarmuka API ChatGPT untuk pertama kalinya pada bulan Maret, hampir ada konsensus di dalam dan di luar industri AI: industri akan segera berubah. Karena semakin banyak aplikasi yang terhubung ke model besar, semakin banyak hutan lebat tumbuh di atas AI.
"Membangun model skala besar dan membuat aplikasi harus dipisahkan." Investor selalu memiliki indra penciuman yang tajam. Menurut Chen Runze, Direktur Eksekutif Source Code Capital, AI memiliki logika yang sama dengan pembagian kerja di semikonduktor. Setelah kemakmuran model skala besar AI, segera kita akan segera melihat ledakan dalam aplikasi AI.
Di awal tahun ini, ketika Chen Runze dan rekan-rekannya pergi ke Silicon Valley, mereka menemukan bahwa Y Combinator, inkubator startup terkenal di Silicon Valley (CEO OpenAI Sam Altman menjabat sebagai presiden inkubator ini selama bertahun-tahun), setengah dari proyek telah diubah menjadi AI generatif. Antusiasme terhadap model-model besar tidak kalah dengan Cina di seberang lautan.
Namun, ia juga menemukan bahwa baik modal maupun pengusaha di Amerika Serikat lebih optimis tentang aplikasi ekologi berdasarkan model besar daripada kewirausahaan skala besar.Bagaimanapun, perusahaan seperti OpenAI telah muncul di jalur ini.Pada saat yang sama, the Amerika Serikat memiliki tanah ekologis aplikasi ToB yang kuat, sehingga lebih banyak perusahaan Amerika mencoba membuat aplikasi perusahaan berdasarkan ekologi model besar.
Pengamatan Chen Runze sedang dikonfirmasi. Chen Ran, salah satu pendiri platform layanan model skala besar OpenCSG, mengatakan kepada Huxiu bahwa saat ini, lebih dari 90% perusahaan di Bay Area Amerika Serikat telah menggunakan model skala besar kemampuan dalam segala aspek. Sedangkan untuk China, Chen Ran yakin banyak pelanggan yang akan menggunakannya sebelum akhir tahun.
Sekitar bulan Maret tahun ini, Chen Runze dan timnya mulai mencoba mencari perusahaan di China yang membuat aplikasi berdasarkan model besar, tetapi dia menemukan bahwa hanya ada sedikit perusahaan seperti itu. Sejumlah besar modal telah memasuki industri kecerdasan buatan, tetapi jika Anda menelusuri aliran dana ini, Anda akan menemukan bahwa lebih banyak uang masih terkonsentrasi di perusahaan-perusahaan top.
"Bahkan sekarang, dari 10 proyek yang terkait dengan AI generatif, tidak mudah untuk berinvestasi dalam 1-2." Selain Sumber Kode Modal, Huxiu juga berkomunikasi dengan banyak investor teknologi keras, dan mereka semua berkata, meskipun ada banyak proyek untuk dilihat, hanya ada sedikit proyek yang benar-benar andal.
Sikap di sisi aplikasi ini, di mata banyak orang di industri, sudah menjadi norma.
Yu Kai, salah satu pendiri Aspire, percaya bahwa jalur yang tampak hidup di permukaan sebenarnya lebih merupakan kompetisi nominal, dan hasilnya tidak lebih dari dua situasi: "Yang satu murni berorientasi pada modal untuk mengumpulkan uang; yang lain adalah Perusahaan yang membuat model skala besar universal benar-benar perlu berteriak, dan orang lain tidak akan tahu jika mereka tidak berteriak.
Beberapa statistik domestik juga menggambarkan masalah ini Menurut statistik dari organisasi pihak ketiga, Niu, per Juli 2023, ada 242 perusahaan AIGC di China, dan ada 71 insiden pembiayaan jalur AIGC sejak Januari. Ada 67 perusahaan di jalur model skala besar AI, dan hanya ada 21 acara pembiayaan sejak ChatGPT dirilis.
Acara pembiayaan trek AIGC dan trek model besar AI sejak rilis ChatGPT|Sumber data: Enniu Data
“Di pasar AI domestik, hanya ada sedikit target bagus.” Seorang investor memberi tahu Tiger Sniff bahwa proyek bagus terlalu mahal, dan yang murah tidak bisa diandalkan. Meskipun jumlah model skala besar AI yang dirilis di China saat ini melebihi seratus, di antara perusahaan model skala besar di China, tidak banyak, atau bahkan segelintir dari mereka, yang memperoleh pembiayaan besar.
Banyak investasi AI pada akhirnya berubah menjadi investor - mantan pendiri perusahaan unicorn, raksasa internet, orang-orang dengan pengalaman wirausaha terkait model skala besar, dll.
| | | | | |
| --- | --- | --- | --- | --- |
| Jenis Perusahaan | Perusahaan | Tanggal Pendirian | Model Besar dan Produk Terkait |
| Perusahaan internet | Baidu | 2012 | Wenxin Yiyan | Terdaftar |
| Aliyun | 2008 | Tongyi Qianwen | Terdaftar | |
| Tencent AI Lab| 1998 | Hunyuan| Terdaftar| |
| Huawei Cloud | 2019 | Pangu | Tidak Terdaftar | |
| ByteDance| 2016 | Volcanic Ark| Tidak Terdaftar| |
| JD Cloud | 2012 | Yanxi | Terdaftar | |
| Kunlun Wanwei | 2008 | Tiangong | Terdaftar | |
| 360 | 1992 | 360 Zhinao | Terdaftar | |
| | | | | |
| --- | --- | --- | --- | --- |
| Jenis Perusahaan | Perusahaan | Tanggal Pendirian | Model Besar dan Produk Terkait |
| Perusahaan AI | SenseTime | 2014 | Harian Baru | Terdaftar |
| HKUST Xunfei | 1999 | Xunfei Spark | Terdaftar | |
| Teknologi Yuncong| 2015 | Tenang| Terdaftar| |
| Data Daguan| 2015 | Cao Zhi| Babak C| |
| Keluar dan tanyakan | 2014 | Sequence Monkey | Putaran D | |
| Zhipu Al | 2019 | ChatGLM | Putaran B | |
| Teknologi Lanzhou | 2021 | Mencius | Babak Pra-A | |
| MiniMax | 2021 | Glow | Investasi Ekuitas | |
| Teknologi Facewall| 2022 | VisCPM | Angel Wheel| |
| Teknologi Shenyan| 2022 | CPM | Investasi Ekuitas| |
| Kecerdasan Pikiran | 2021 | Al Utopia | Babak Pra-A | |
| Teknologi Lianyuan| 2021 | ProdukGPT | Angel Wheel| |
| Aspire | 2007 | DFM-2 | Penghentian IPO | |
| | | | | |
| --- | --- | --- | --- | --- |
| Jenis Perusahaan | Perusahaan | Tanggal Pendirian | Model Besar dan Produk Terkait |
| Perusahaan AI baru akan didirikan pada tahun 2023 | Tahun cahaya | 2023 | Tidak | Putaran |
| Baichuan Intelligent | 2023 | baichuan | Investasi Ekuitas | |
| Nol Satu Segalanya | 2023 | Tidak Ada | Investasi Ekuitas | |
Sebagian statistik perusahaan yang terkait dengan model skala besar AI domestik
Di antara proyek AI bintang tahun ini, Zhipu AI, Lingxin Intelligence, Shenyan Technology, dan Facewall Intelligence semuanya adalah perusahaan yang diinkubasi oleh Tsinghua Lab. Baik Shenyan Technology dan Facewall Smart didirikan pada tahun 2022, dan mendapat dukungan teknis dari para sarjana terkenal di industri AI.
Waktu pendirian perusahaan AI berbasis Tsinghua ini lebih pendek daripada perusahaan AI yang didirikan oleh beberapa pemimpin industri Internet.Tahun Cahaya Setelahnya, Baichuan Intelligent dan Zero One Wanwu semuanya didirikan setelah dimulainya gelombang model berskala besar ini.
Wang Huiwen, salah satu pendiri Meituan, pernah mengumpulkan US$50 juta tahun cahaya setelah pendiriannya pada awal 2023, yang merupakan salah satu dari sedikit kasus pembiayaan dalam industri model skala besar China pada saat itu. Tidak seperti Zhipu AI dan Xihu Xinchen, yang sudah memiliki perusahaan berbasis model skala besar, Light Years Away akan dimulai pada Februari 2023. Sulit untuk membangun model skala besar dari awal.Pada 29 Juni, Meituan mengumumkan akuisisi semua kepentingan di luar Tahun Cahaya, dengan total pertimbangan sekitar US$233 juta (1,67 miliar yuan) dalam bentuk tunai, sekitar 367 juta yuan dalam bentuk utang, dan 1 yuan dalam bentuk tunai.
"Setidaknya harus ada orang dengan latar belakang pemrosesan bahasa alami, orang dengan sejumlah pengalaman praktis dalam pelatihan model skala besar, dan profesional dalam pemrosesan data, cluster daya komputasi skala besar, dll. Jika Anda ingin melakukannya aplikasi pada saat yang sama, Anda harus memiliki manajer Produk dan bakat operasional yang sesuai di lapangan.” Chen Runze menjelaskan konfigurasi standar tim inti model berskala besar.
AI PERUSAHAAN BESAR LEBIH BAIK
Dalam enam bulan terakhir, berita AI tentang raksasa Internet yang sudah mapan telah bertebaran di langit. Investasi pada model besar AI tampaknya mengejar hot spot, tetapi taruhan yang dibuat oleh perusahaan besar seperti Baidu, Ali, dan Huawei pada AI jelas tidak mengikuti tren.
Taruhan raksasa pada AI sudah dimulai sejak lama Bagi perusahaan-perusahaan ini, AI bukanlah topik baru. Tiger Sniff, menurut statistik yang tidak lengkap dari data pencarian perusahaan, pabrik-pabrik besar telah berinvestasi di berbagai perusahaan terkait kecerdasan buatan sejak 2018. Dari perspektif perusahaan investasi, kebanyakan dari mereka adalah perusahaan dalam penerapan kecerdasan buatan, meskipun beberapa di antaranya melibatkan perusahaan chip AI, tetapi jumlahnya tidak besar, hampir tidak ada perusahaan yang terlibat dalam model skala besar, dan sebagian besar perusahaan terkait kecerdasan buatan yang diinvestasikan oleh pabrikan besar terkait erat dengan bisnis mereka.
Investasi tiga perusahaan Internet besar di perusahaan terkait AI|Sumber data: Qichacha
Pada 2017, Alibaba Dharma Institute didirikan, objek penelitiannya mencakup berbagai bidang industri seperti kecerdasan mesin, jaringan cerdas, dan teknologi keuangan, yang memberdayakan kemampuan kecerdasan buatan ke berbagai lini bisnis Ali. Pada tahun 2018, Baidu mengusulkan strategi "All in AI".
Bedanya, kemunculan AI generatif tampaknya menjadi titik balik. Bagi raksasa teknologi dengan keunggulan dalam data, daya komputasi, dan sumber daya algoritme, kecerdasan buatan tidak hanya merupakan skenario yang memungkinkan bagi mereka, tetapi juga perlu mengambil peran infrastruktur.Bagaimanapun, munculnya AI generatif berarti bahwa industri kecerdasan buatan pembagian kerja telah dimulai.
Perusahaan besar yang diwakili oleh Baidu, Alibaba, Huawei, dan Tencent, empat penyedia cloud, telah mengumumkan strategi AI mereka sendiri, tetapi jelas masing-masing memiliki fokusnya sendiri.
Dalam enam bulan terakhir, raksasa telah merilis produk model skala besar mereka sendiri. Untuk perusahaan besar seperti Baidu dan Ali, belum terlambat bagi mereka untuk masuk ke model besar, pada dasarnya di tahun 2019.
Baidu telah mengembangkan model pra-pelatihan sejak 2019, dan secara berturut-turut merilis seri model Knowledge Enhanced Wenxin (ERNIE). Model Seribu Pertanyaan Tongyi Ali juga dimulai pada 2019. Selain model besar tujuan umum Baidu dan Ali, pada 19 Juni, Tencent Cloud merilis kemajuan penelitian dan pengembangan model besar industri. Pada 7 Juli, HUAWEI CLOUD merilis produk model industri Pangu 3.0.
Fokus ini juga menggemakan bisnis keseluruhan perusahaan, strategi cloud, dan tata letak jangka panjang di pasar AI.
Profitabilitas lini bisnis utama Baidu sangat berfluktuasi dalam lima tahun terakhir. Baidu telah lama melihat masalah bisnis periklanan berbasis pencarian di pasar domestik, dalam hal ini Baidu memilih untuk berinvestasi besar-besaran dalam teknologi AI untuk menemukan peluang baru. Selama bertahun-tahun, Baidu tidak hanya mengundang Wu Enda, Lu Qi, dan pemimpin industri lainnya untuk menjabat sebagai eksekutif, tetapi juga memiliki antusiasme yang jauh lebih tinggi untuk mengemudi secara otonom daripada perusahaan besar lainnya. Baidu, yang sangat peduli dengan AI, pasti akan bertaruh besar-besaran dalam gelombang kompetisi model berskala besar ini.
Ali juga menunjukkan antusiasme yang besar terhadap model besar secara umum. Untuk waktu yang lama, Aliyun menaruh harapan tinggi, dan Ali berharap untuk mengambil jalur teknis untuk menciptakan kurva pertumbuhan kedua grup. Dalam konteks persaingan bisnis e-commerce yang semakin ketat dan pertumbuhan pasar yang melambat, peluang baru di industri AI yang diciptakan oleh Evian tidak diragukan lagi merupakan peluang bagus bagi Alibaba Cloud untuk melakukan upaya lebih lanjut di pasar cloud domestik.
Dibandingkan dengan Baidu dan Ali, Tencent Cloud memilih untuk memprioritaskan model industri skala besar dalam hal model skala besar, sementara Huawei Cloud secara terbuka menyatakan hanya akan fokus pada model industri skala besar.
Bagi Tencent, pertumbuhan bisnis utamanya stabil dan positif dalam beberapa tahun terakhir. Pada tahap ketika masa depan model skala besar tujuan umum masih belum jelas, Tencent relatif berhati-hati dalam bertaruh pada model AI skala besar. Ketika Ma Huateng berbicara tentang model skala besar dalam panggilan konferensi pendapatan sebelumnya, dia berkata: "Tencent tidak terburu-buru untuk menunjukkan produk setengah jadi. Kuncinya adalah melakukan pekerjaan dengan baik dalam algoritme yang mendasarinya, daya komputasi dan data. Adegan jatuh."
Di sisi lain, dari perspektif Tencent Group, Tencent saat ini memiliki 4 AI Labs, dan tahun lalu merilis model elemen campuran berskala besar dengan triliunan parameter. Letakkan semua telur Anda dalam strategi taruhan satu keranjang.
Bagi Huawei, ini selalu menjadi taruhan besar dalam penelitian dan pengembangan.Dalam 10 tahun terakhir, total investasi Huawei dalam penelitian dan pengembangan telah melampaui 900 miliar yuan. Namun, karena kendala yang dihadapi dalam pengembangan bisnis telepon seluler, strategi keseluruhan Huawei dalam banyak penelitian dan pengembangan teknologi mungkin juga menghadapi penyesuaian.
Di satu sisi, bisnis ponsel adalah ekspor terbesar dari teknologi C-end Huawei. Jika bisnis ponsel tidak membayar model skala besar untuk keperluan umum, maka motivasi Huawei untuk mengembangkan skala besar untuk tujuan umum model akan turun secara signifikan. Bagi Huawei, bertaruh pada model industri berskala besar yang bisa diwujudkan dengan cepat tampaknya menjadi solusi optimal dalam permainan AI ini. Seperti yang dikatakan Zhang Pingan, CEO Huawei Cloud, "Huawei tidak punya waktu untuk menulis puisi."
Namun, bagi raksasa teknologi, sebesar apa pun taruhannya, selama mereka dapat membuat taruhan yang tepat, mereka akan dapat merebut pangsa pasar infrastruktur dan mendapatkan hak untuk berbicara di era kecerdasan buatan.
Ambil Palu untuk Paku
Untuk perusahaan komersial, semua keputusan masih jatuh pada buku ekonomi.
Bahkan dengan investasi besar, semakin banyak pendiri perusahaan yang berpandangan jauh ke depan menyadari bahwa ini adalah sesuatu yang harus dilakukan di masa depan, bahkan jika investasi awal mungkin tidak memberikan hasil sama sekali.
Penelitian dan pengembangan model besar AI membutuhkan banyak investasi, tetapi semakin banyak pendiri bisnis dan investor percaya bahwa ini adalah "investasi yang diperlukan", meskipun tidak ada pengembalian sama sekali.
Akibatnya, banyak perusahaan kecerdasan buatan yang lahir di bawah gelombang terakhir AI telah melihat fajar baru setelah lama diam.
“Tiga tahun lalu, semua orang mengatakan bahwa GPT-3 adalah kemungkinan menuju kecerdasan buatan umum.” Li Zhifei memimpin sekelompok orang untuk mempelajari GPT-3 pada tahun 2020. Saat itu, dia berada di titik balik dalam perkembangannya ., mereka ingin menjelajahi bisnis baru, tetapi setelah periode penelitian, proyek model skala besar Li Zhifei ditangguhkan.Salah satu alasannya adalah modelnya tidak cukup besar pada saat itu, dan yang lainnya adalah tidak ada adegan pendaratan komersial.
Namun, setelah ChatGPT keluar pada akhir tahun 2022, Li Zhifei tampaknya diberi kesempatan, karena dia, seperti orang lain, melihat peluang baru untuk model besar. Pada bulan April tahun ini, Going Out and Asking merilis produk model berskala besar yang dikembangkan sendiri - Sequence Monkey. Saat ini, mereka sedang bersiap untuk berlari ke Bursa Efek Hong Kong dengan model skala besar "Serial Monkey" yang baru dirilis, dan mereka telah mengirimkan prospektus pada akhir Mei.
Perusahaan AI lain yang mapan juga menindaklanjuti.Pada Juli tahun lalu, Aspire mengajukan permohonan IPO ke Dewan Inovasi Sains dan Teknologi, yang ditolak oleh komite peninjau daftar pada Mei tahun ini.
Yu Kai berkata terus terang bahwa bahkan OpenAI dilatih dengan Microsoft V100 selama hampir satu tahun di tahap GPT2, dan daya komputasinya beberapa kali lipat lebih buruk daripada A100. Pada tahap akumulasi awal model besar, Aspire juga menggunakan kartu yang lebih ekonomis untuk pelatihan. Tentu saja, ini membutuhkan waktu sebagai harga.
Dibandingkan dengan model besar yang dikembangkan sendiri, beberapa perusahaan berorientasi aplikasi memiliki pilihannya sendiri.
Zhang Wang (nama samaran), presiden sebuah perusahaan pendidikan online, mengatakan kepada Huxiu bahwa dalam enam bulan terakhir, mereka telah berusaha keras dalam mengeksplorasi skenario aplikasi model skala besar, tetapi mereka segera menemukan bahwa ada banyak masalah dalam proses implementasi. seperti biaya dan investasi. Tim R&D perusahaan memiliki 50-60 orang. Sejak mereka mulai melakukan penelitian model skala besar, mereka telah memperluas tim R&D dan merekrut beberapa talenta baru dalam model skala besar. Zhang Wang mengatakan bahwa talenta dalam model tingkat rendah sangat mahal.
Zhang Wang tidak pernah berpikir untuk mengembangkan model besar dari awal, dan mempertimbangkan masalah seperti keamanan data dan stabilitas model, dia tidak bermaksud untuk langsung mengakses API untuk aplikasi. Pendekatan mereka mengacu pada model besar open source dan menggunakan data mereka sendiri untuk pelatihan. Ini juga merupakan praktik saat ini dari banyak perusahaan aplikasi - selain model besar, menggunakan data mereka sendiri untuk membuat model industri kecil. Ke depan, mereka memulai dengan model 7 miliar parameter, mencapai 10 miliar, dan sekarang mencoba model 30 miliar. Tetapi mereka juga menemukan bahwa dengan bertambahnya jumlah data, situasi pelatihan model besar adalah bahwa versi baru mungkin tidak sebagus versi sebelumnya, dan parameternya harus disesuaikan satu per satu. itu harus diambil," kata Zhang Wang.
Zhang Wang memberi tahu Huxiu bahwa persyaratan mereka untuk tim Litbang adalah mengeksplorasi skenario model skala besar AI berdasarkan bisnis perusahaan.
Ini adalah cara untuk menemukan "paku" dengan "palu", tetapi tidak mudah.
"Masalah terbesar saat ini adalah menemukan adegan yang cocok. Faktanya, ada banyak adegan. Bahkan jika AI digunakan, efeknya tidak dapat ditingkatkan banyak," kata Zhang Wang, misalnya, dalam adegan kelas, AI besar model dapat digunakan untuk memberdayakan beberapa mode interaktif, termasuk mengingatkan siswa untuk menghadiri kelas, menjawab pertanyaan, dan memberi label, dll, tetapi setelah mereka mencoba model besar AI, mereka menemukan bahwa akurasinya kurang baik, dan kemampuan untuk memahami dan output tidak ideal. Tim Zhang Wang memutuskan untuk sementara meninggalkan AI dalam adegan ini setelah mencoba beberapa saat.
Penyedia layanan Internet lainnya, Xiaogetong, juga mulai mengeksplorasi bisnis terkait segera setelah merebaknya model AI. Bisnis utama Little Goose adalah menyediakan alat operasi digital untuk pedagang online, termasuk pemasaran, manajemen pelanggan, dan monetisasi komersial.
Fan Xiaoxing, salah satu pendiri dan COO Goose Communication, mengatakan kepada Huxiu bahwa pada bulan April tahun ini, ketika semakin banyak aplikasi lahir berdasarkan AI generatif, Goose Communication melihat potensi di balik teknologi ini. jelas bagi semua.” Fan Xiaoxing dan yang lainnya secara khusus mengatur lini bisnis penelitian AI secara internal, mencari kasus pendaratan yang terkait dengan bisnis mereka sendiri.
Fan Xiaoxing mengatakan bahwa dalam proses mengintegrasikan model besar ke dalam bisnis, yang dianggapnya adalah biaya dan efisiensi, "Biaya input model besar masih cukup tinggi," katanya.
"Paku" industri Internet mudah ditemukan Kesulitan sebenarnya dalam mengimplementasikan AI terletak pada industri fisik seperti industri dan manufaktur.
Yu Kai memberi tahu Huxiu bahwa gelombang AI ini masih berputar ke atas dan maju dalam gelombang, dan kontradiksi dalam penerapan industri tidak berubah sama sekali, hanya mengubah cangkangnya. Jadi dalam pengertian ini, hukum kedua gelombang AI itu sama, dan cara terbaik adalah belajar dari sejarah— "Pelajaran dari gelombang AI terakhir, jangan ulangi kali ini."
Meskipun banyak pabrikan meneriakkan slogan "utamakan industri" dalam penerapan model besar AI, sangat sulit bagi banyak skenario industri fisik untuk menyamai model besar AI saat ini. Misalnya, sistem inspeksi visual AI yang diterapkan dalam beberapa skenario inspeksi industri, meskipun permintaan model AI tidak setinggi 1 miliar parameter, data pelatihan awal masih terbentang.
Mengambil adegan inspeksi tenaga angin sederhana sebagai contoh, jumlah inspeksi di ladang angin mencapai 70.000 unit, tetapi data retakan yang sama mungkin hanya muncul sekali, dan jumlah data yang dapat dipelajari mesin masih jauh dari cukup. Ke Liang, direktur produk Broadbo Intelligent Wind Power Hardware, mengatakan kepada Tiger Sniff bahwa saat ini, robot inspeksi untuk bilah turbin angin tidak dapat menganalisis retakan bilah secara akurat 100%, karena jumlah data yang tersedia untuk pelatihan dan analisis terlalu kecil. identifikasi juga memerlukan sejumlah besar akumulasi data dan analisis manual.
Namun, dalam skenario dengan akumulasi data industri yang baik, model besar AI sudah dapat membantu pengelolaan pustaka komponen model 3D yang kompleks. Perpustakaan suku cadang dari perusahaan manufaktur pesawat terbang domestik telah mengimplementasikan alat bantu pustaka suku cadang berdasarkan model besar dari paradigma keempat "Shishuo". Di antara lebih dari 100.000 bagian pemodelan 3D, pencarian model 3D dapat diwujudkan melalui bahasa alami, model 3D dapat dicari dengan model 3D, dan bahkan perakitan otomatis model 3D dapat diselesaikan. Fungsi-fungsi ini memerlukan operasi multi-langkah di banyak alat CAD dan CAE yang macet di industri manufaktur.
Model skala besar saat ini menghadapi masalah pendaratan yang sama seperti AI beberapa tahun lalu, dan mereka juga harus menemukan paku dengan palu. Beberapa orang secara optimis percaya bahwa palu hari ini benar-benar berbeda dari masa lalu, tetapi ketika harus membayar AI dengan uang sungguhan, hasilnya agak berbeda.
Menurut survei Markets Live Pulse yang dirilis oleh Bloomberg pada 30 Juli, di antara 514 investor yang disurvei, sekitar 77% berencana untuk meningkatkan atau mempertahankan investasi pada saham teknologi dalam enam bulan ke depan, dan hanya kurang dari 10% investor yang percaya bahwa teknologi tersebut industri sedang menghadapi krisis gelembung yang serius. Namun, hanya setengah dari investor yang optimis dengan perkembangan industri teknologi yang terbuka terhadap teknologi AI.
50,2% responden mengindikasikan bahwa mereka tidak berniat untuk membayar pembelian alat AI saat ini, dan sebagian besar perusahaan investasi tidak memiliki rencana untuk menerapkan AI pada transaksi atau investasi dalam skala besar.
Sekop Sekop
"Jika Anda pergi ke California untuk mendulang emas selama demam emas pada tahun 1848, banyak orang akan mati, tetapi orang yang menjual sendok dan sekop selalu dapat menghasilkan uang," kata Lu Qi dalam pidatonya.
Gao Feng (nama samaran) ingin menjadi "penjual sekop", tepatnya, orang yang bisa "menjual sekop bagus di China".
Sebagai peneliti chip, Gao Feng menghabiskan sebagian besar waktu penelitian ilmiahnya pada chip AI. Dalam satu atau dua bulan terakhir, dia merasakan semacam urgensi - dia ingin menjadi perusahaan CPU yang berbasis arsitektur RISC-V. Di kedai teh, Gao Feng menjelaskan masa depan kepada Huxiu.
Namun, membuat chip AI dari awal, baik di industri chip maupun di lingkaran teknologi, seperti "Arabian Nights".
Saat roda gila model besar AI mulai dengan cepat, daya komputasi di belakangnya secara bertahap mulai gagal mengimbangi kecepatan para pemain di trek ini. Permintaan daya komputasi yang melonjak telah menjadikan Nvidia sebagai pemenang terbesar. Tapi GPU bukanlah solusi keseluruhan untuk daya komputasi. CPU, GPU, dan berbagai chip AI inovatif membentuk pusat catu daya komputasi utama model besar.
"Anda dapat membandingkan CPU dengan daerah perkotaan, dan GPU adalah pengembangan pinggiran." Gao Feng mengatakan bahwa CPU dan chip AI harus dihubungkan melalui saluran yang disebut PCIE, dan data dikirim ke chip AI, dan kemudian chip AI mengirimkan data kembali ke CPU. Jika volume data dari model besar menjadi lebih besar, saluran akan menjadi padat dan kecepatan tidak akan meningkat, oleh karena itu jalan ini perlu diperlebar, dan hanya CPU yang dapat menentukan lebar saluran ini, dan berapa banyak jalur yang diperlukan. diatur.
Artinya, meskipun China berhasil menembus chip AI pada model besar, masih sulit untuk menembus CPU yang paling kritis. Bahkan dalam pelatihan AI, semakin banyak tugas yang dapat diberikan ke GPU, tetapi CPU masih merupakan peran "manajer" yang paling penting.
Beberapa chip domestik dipamerkan di area pameran model besar 2023WAIC
Sudah lebih dari 50 tahun sejak Intel menciptakan CPU pertama di dunia pada tahun 1971. Di pasar server sipil dan PC, Intel dan AMD telah lama menjadi dunia. Intel telah membangun sistem yang mencakup hak kekayaan intelektual, akumulasi teknologi, biaya skala, dan ekologi perangkat lunak Seluruh penghalang model bisnis, dan penghalang ini tidak pernah menurun.
Penting untuk sepenuhnya meninggalkan arsitektur X86 dan arsitektur ARM, dan mengembangkan chip CPU yang sepenuhnya independen berdasarkan arsitektur baru Arsitektur sumber terbuka seperti RISC-V yang belum sepenuhnya dikembangkan dan diverifikasi.
Set instruksi seperti sebidang tanah.Mengembangkan chip berdasarkan set instruksi sama dengan membeli tanah dan membangun rumah. Arsitektur X86 adalah sumber tertutup, dan hanya chip ekologis Intel yang diizinkan.Arsitektur ARM perlu membayar biaya lisensi IP, sedangkan RISC-V adalah arsitektur sumber terbuka gratis.
Industri dan akademisi sudah melihat peluang seperti itu.
Pada tahun 2010, tim peneliti dua profesor dari Berkeley, California, mengembangkan set instruksi baru dari awal, yaitu RISC-V. Set instruksi ini benar-benar open source. Mereka percaya bahwa set instruksi CPU seharusnya tidak dimiliki oleh siapa pun. perusahaan.
"RISC-V mungkin merupakan awal dari CPU Cina," kata Gao Feng. Pada tahun 2018, ia menginkubasi perusahaan chip AI di institut tersebut, saat itu ia mengatakan tidak ingin melewatkan kesempatan untuk pengembangan gelombang AI, kali ini ia masih ingin merebutnya, dan ini titik masuknya adalah RISC-V. Di era model besar dan substitusi domestik, permintaan ini semakin mendesak.Lagipula, jika suatu saat perusahaan China tidak bisa lagi menggunakan A100, apa yang harus mereka lakukan?
"Jika Anda ingin mengganti ARM dan X86, CPU RISC-V harus lebih bertenaga, dan Anda perlu berpartisipasi dalam pengembangan kode dengan orang-orang yang menggunakan sistem operasi komersial di Linux," kata Gao Feng.
Gao Feng bukan orang pertama yang menyadari peluang ini Seorang investor di industri chip mengatakan kepada Tiger Sniff bahwa dia pernah mengobrol dengan pendiri perusahaan rintisan chip tentang peluang menggunakan arsitektur RISC-V untuk membuat GPU. Saat ini, sudah ada beberapa perusahaan di China yang membuat GPU berdasarkan arsitektur RISC-V, namun ekologi masih menjadi masalah terbesar yang mereka hadapi.
“Linux telah menunjukkan bahwa jalur ini layak.” Gao Feng mengatakan bahwa dalam sistem operasi open source Linux ini, perusahaan open source seperti Red Hat lahir, dan banyak layanan cloud kini dibangun di atas sistem Linux. “Dibutuhkan cukup pengembang.” Gao Feng mengusulkan sebuah metode. Jalan ini sulit, tetapi akan menjadi jalan terang jika dilalui.
flywheel berputar terlalu cepat
Di bawah "respons stres" dari model besar, bukan hanya puncak yang terasa mendesak.
Lianchuang, perusahaan model skala besar AI domestik, mengatakan kepada Tiger Sniff bahwa mereka juga sempat meluncurkan model dialog berskala besar di awal tahun ini Banyak permintaan perbaikan.
"Sampai tidak ada kebijakan peraturan khusus, kami tidak akan dengan mudah membuka produk untuk pengguna biasa. Alasan utamanya adalah logika To B." Zhang Chao, CEO Left Hand Doctor, percaya bahwa sebelum "Tindakan Administratif" dikeluarkan , AI generatif Produk ini terbuka untuk pengguna C-end, yang sangat berisiko. “Pada tahap ini, di satu sisi, kami terus melakukan optimalisasi secara iteratif, dan di sisi lain, kami juga terus memperhatikan kebijakan dan regulasi untuk memastikan keamanan teknologi.”
"Pendekatan peraturan untuk AI generatif masih belum jelas, dan produk serta layanan perusahaan model skala besar umumnya sangat sederhana." Penyedia teknologi digital merilis produk aplikasi berdasarkan model skala besar umum yang dikembangkan oleh cloud produsen pada bulan Juni Pada pertemuan tersebut, orang yang bertanggung jawab atas teknologi perusahaan memberi tahu Huxiu bahwa mereka diminta oleh vendor cloud untuk merahasiakannya, dan jika mereka mengungkapkan model besar siapa yang digunakan, mereka akan dianggap telah melanggar kontrak. Adapun mengapa kasus tersebut harus dirahasiakan, penanggung jawab menganalisis bahwa sebagian besar alasannya mungkin untuk menghindari risiko peraturan.
Pada saat dunia meningkatkan kewaspadaannya terhadap AI, tidak ada pasar yang dapat menerima "masa vakum" regulasi.
Pada 13 Juli, tujuh departemen termasuk Cyberspace Administration of China secara resmi merilis "Langkah Sementara untuk Administrasi Layanan Kecerdasan Buatan Generatif" (selanjutnya disebut sebagai "Langkah Administratif"), yang akan mulai berlaku pada 15 Agustus 2023.
"Setelah "Langkah Administratif" dikeluarkan, kebijakan akan berubah dari berorientasi masalah menjadi pembangunan berorientasi tujuan, yang merupakan tujuan kami." Wang Yuwei, mitra Firma Hukum Guantao, percaya bahwa peraturan baru lebih menekankan "drainase". daripada "memblokir".
Menjelajahi perpustakaan manajemen risiko di Amerika Serikat adalah pekerjaan rumah sehari-hari untuk Wang Yuwei."Kami menyediakan kontrol risiko dan solusi kepatuhan untuk aplikasi komersial menggunakan GPT dan model besar lainnya untuk segmen industri, dan membangun kerangka kerja tata kelola kepatuhan." Wang Yuwei berkata .
Raksasa AI Amerika berbaris untuk menunjukkan kesetiaan mereka kepada Kongres. Pada 21 Juli, Google, OpenAI, Microsoft, Meta, Amazon, startup AI Inflection, Anthropic, tujuh perusahaan AI Amerika paling berpengaruh, menandatangani komitmen sukarela di Gedung Putih. Pastikan pakar keamanan independen diizinkan untuk menguji sistem mereka sebelum merilisnya ke publik. Dan berbagi data tentang keamanan sistem mereka dengan pemerintah dan akademisi. Mereka juga akan mengembangkan sistem untuk memperingatkan publik ketika gambar, video, atau teks dihasilkan oleh AI, menggunakan metode yang dikenal sebagai "watermarking".
Perwakilan dari 7 raksasa AI Amerika menandatangani janji AI di Gedung Putih
Sebelumnya, pada sidang kongres AS, pendiri OpenAI Sam Altman mengatakan bahwa serangkaian standar keselamatan untuk model kecerdasan buatan perlu dibuat, termasuk mengevaluasi kemampuan berbahayanya. Misalnya, model harus lulus tes keamanan tertentu, seperti apakah mereka dapat "menggandakan diri" dan "menyusup ke alam liar".
Mungkin Sam Altman sendiri tidak menyangka roda gila AI akan berputar begitu cepat bahkan berisiko kehilangan kendali.
“Kami tidak menyadari urgensi masalah ini pada awalnya,” kata Wang Yuwei, sampai semakin banyak pendiri perusahaan yang datang untuk berkonsultasi. Ia merasa gelombang kecerdasan buatan ini sedang mengalami perubahan yang sama sekali berbeda dari masa lalu.
Awal tahun ini, Wang Yuwei didekati oleh perusahaan Wenshengtu yang pertama kali mengakses model berskala besar.Perusahaan tersebut ingin memperkenalkan bisnisnya ke China, sehingga mereka ingin mengetahui tentang bisnis kepatuhan data di area ini. Segera setelah itu, Wang Yuwei menemukan bahwa semakin banyak konsultasi semacam itu, dan perubahan yang lebih jelas adalah bahwa bukan lagi penasihat hukum perusahaan tetapi pendiri yang datang untuk berkonsultasi. “Dengan munculnya AI generatif, logika pengaturan asli sulit diterapkan,” kata Wang Yuwei.
Wang Yuwei, yang telah terlibat dalam pekerjaan hukum data besar selama bertahun-tahun, menemukan bahwa AI generatif dan gelombang AI sebelumnya menunjukkan perubahan yang lebih mendasar. Misalnya, terakhir kali AI lebih didasarkan pada rekomendasi berbasis algoritme, dan beberapa pengenalan wajah ditujukan untuk satu adegan, dan beberapa model kecil dilatih dalam skenario aplikasi tertentu. Masalah hukum yang terlibat tidak lebih dari hak kekayaan intelektual. , Privasi masalah perlindungan. Peran berbeda dalam ekosistem AI generatif ini, seperti perusahaan yang menyediakan model besar yang mendasarinya, perusahaan yang terhubung ke model besar untuk membuat aplikasi, dan vendor cloud yang menyimpan data, dll., memiliki pengawasan terkait yang berbeda.
Saat ini, ada konsensus tentang risiko terkait yang dibawa oleh model besar. Industri memahami bahwa aplikasi komersial pasti akan memperbesar risiko tersebut. Untuk menjaga kelangsungan bisnis, perlu memperhatikan pengawasan.
Kesulitannya adalah, “Bagaimana menemukan jalur yang dapat mengatur dengan baik tanpa mempengaruhi perkembangan industri.” kata Wang Yuwei.
Kesimpulan
Untuk seluruh industri, selain memperdalam diskusi tentang teknologi, hal ini juga memicu pemikiran yang lebih luas.
Ketika AI secara bertahap menempati posisi dominan dalam industri teknologi, bagaimana memastikan keadilan, keadilan, dan transparansi teknologi? Bagaimana memastikan bahwa usaha kecil dan menengah dan start-up tidak terpinggirkan ketika perusahaan terkemuka mengontrol teknologi dan aliran modal dengan ketat? Pengembangan dan penerapan model skala besar memiliki potensi besar, tetapi apakah mengikuti tren secara membabi buta menyebabkan kita mengabaikan teknologi inovatif lainnya?
"Dalam jangka pendek, model AI besar terlalu dilebih-lebihkan. Namun dalam jangka panjang, model AI besar diremehkan secara serius."
Dalam setengah tahun, gelombang panas AI melonjak. Namun, bagi perusahaan rintisan dan raksasa teknologi China, bagaimana mempertahankan penilaian yang jelas dan membuat perencanaan dan investasi jangka panjang dalam suasana pasar yang panas akan menjadi kunci untuk menguji kekuatan dan visi mereka yang sebenarnya.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
ChatGPT telah meledak dalam enam bulan terakhir: uang panas, raksasa, dan pengawasan
Setelah setengah tahun pembaptisan AI, mungkin sulit untuk menemukan kata yang lebih tepat daripada "respons stres" untuk menggambarkan keadaan setiap orang di industri teknologi saat ini - ketegangan, rangsangan, dan tekanan.
"Respon stres" mengacu pada serangkaian respons yang dihasilkan organisme untuk mempertahankan homeostasis tubuh ketika mereka menghadapi tekanan atau ancaman lingkungan eksternal. Ini adalah respons alami organisme untuk beradaptasi dengan lingkungan dan memastikan kelangsungan hidup. Respons ini bisa berumur pendek atau tahan lama.
Pada 26 Juli, Twitter resmi OpenAI mengumumkan bahwa ChatGPT versi Android telah tersedia untuk diunduh di Amerika Serikat, India, Bangladesh, dan Brasil, dan berencana untuk memperluas ke lebih banyak negara dalam waktu dekat. ChatGPT memperluas saluran, mendapatkan lebih banyak pengguna dan kelekatan penggunaan yang lebih kuat, dan gelombang AI generatif terus meningkat.
Pada awal Juli, di World Artificial Intelligence Conference (WAIC) 2023 di Shanghai, seorang teknisi dari perusahaan rintisan model skala besar bolak-balik melalui ruang pameran. Dia berencana menemukan solusi chip domestik yang hemat biaya untuk perusahaan digunakan untuk pelatihan model skala besar.
"Kami memiliki 1.000 A100, tetapi itu tidak cukup," katanya kepada Huxiu.
A100 adalah GPU kelas atas dari Nvidia dan fondasi perangkat keras untuk pengembangan ChatGPT. Beberapa data publik menunjukkan bahwa dalam proses pelatihan model seri GPT, jumlah GPU Nvidia yang digunakan oleh OpenAI sekitar 25.000. Oleh karena itu, untuk membuat model besar, Anda harus mengevaluasi terlebih dahulu berapa banyak kartu grafis A100 yang bisa Anda dapatkan, yang hampir menjadi praktik di industri ini.
Dimana GPU? Di mana saya dapat menemukan daya komputasi yang murah? Ini hanyalah mikrokosmos dari sekian banyak pertanyaan di konferensi WAIC 2023.
Hampir semua orang yang "stres" dalam enam bulan terakhir sangat ingin menemukan lebih banyak jawaban tentang AI di "acara" ini.
situs 2023WAIC
Seorang teknisi dari peserta pameran chip memberi tahu Tiger Sniff bahwa selama beberapa hari konferensi WAIC, banyak manajer produk datang ke stan "model besar" mereka, berharap menemukan definisi produk untuk bisnis model besar perusahaan di sini.
Di Forum Zhongguancun pada 28 Mei, "Laporan Penelitian Peta Model Skala Besar Kecerdasan Buatan China" yang dirilis oleh Institut Informasi Ilmiah dan Teknologi China menunjukkan bahwa pada akhir Mei, 79 model skala besar dengan skala parameter dari lebih dari 1 miliar di Cina telah dirilis. Dalam dua bulan ke depan, serangkaian model besar AI seperti Tongyi Wanxiang dari Alibaba Cloud, Pangu 3.0 dari Huawei Cloud, dan Youdao "Ziyue" dirilis. Menurut statistik yang tidak lengkap, model besar AI domestik saat ini telah melampaui 100.
Tindakan perusahaan domestik berebut untuk merilis model AI besar adalah perwujudan terbaik dari "respons stres". Kecemasan yang ditimbulkan oleh "reaksi" ini ditransmisikan ke hampir semua personel yang relevan di industri, dari CEO raksasa Internet hingga peneliti di lembaga penelitian AI, dari mitra dana modal ventura hingga pendiri perusahaan. Perusahaan AI, dan bahkan banyak praktisi Hukum terkait AI, serta regulator keamanan data dan jaringan.
Bagi orang di luar industri, ini mungkin hanya karnaval berumur pendek, tetapi berapa banyak orang yang berani mengatakan bahwa mereka berada di luar AI saat ini.
AI mengantarkan era baru, dan semuanya layak dibentuk ulang dengan model besar. Semakin banyak orang mulai berpikir tentang konsekuensi dari difusi teknologi.
Dana mengalir, roda gila ada di sini
Dalam sebulan setelah kelahiran ChatGPT, Li Zhifei, pendiri ChatGPT, pergi ke Silicon Valley dua kali, dan berbicara tentang model besar dengan semua orang.Saat berbicara dengan Huxiu, Li Zhifei dengan blak-blakan mengatakan bahwa ini adalah "All in" terakhirnya.
Pada 2012, Li Zhifei mendirikan Mobwenwen, sebuah perusahaan kecerdasan buatan dengan interaksi suara dan kombinasi perangkat lunak dan perangkat keras sebagai intinya, yang telah mengalami pasang surut dua gelombang kecerdasan buatan China. Selama periode terpanas dari gelombang terakhir kecerdasan buatan, penilaian Momenwenbang pernah didorong ke tingkat unicorn, tetapi juga mengalami masa sepi sejak saat itu. Baru setelah munculnya ChatGPT, industri kecerdasan buatan itu telah diam selama bertahun-tahun Sebuah lubang robek terbuka.
Di pasar primer, "uang panas mengalir masuk".
Ini adalah konsensus industri terkait model besar dalam enam bulan terakhir. Lu Qi, pendiri Forum Qiji, percaya bahwa model skala besar AI adalah "roda gila", dan masa depan akan menjadi era di mana model ada di mana-mana. "Roda gila ini sudah dimulai", dan kekuatan pendorong terbesar adalah modal.
Pada awal Juli, data yang dirilis oleh platform informasi bisnis Crunchbase menunjukkan bahwa perusahaan yang diklasifikasikan sebagai AI mengumpulkan $25 miliar pada paruh pertama tahun 2023, menyumbang 18% dari pembiayaan global. Meskipun angka tersebut mengalami penurunan dibandingkan dengan US$29 miliar pada paruh pertama tahun 2022, jumlah total pembiayaan berbagai industri di dunia pada paruh pertama tahun 2023 mengalami penurunan sebesar 51% dibandingkan dengan periode yang sama pada tahun 2022, yang menunjukkan bahwa jumlah pembiayaan di bidang AI adalah yang terbesar di dunia Proporsi total pembiayaan hampir dua kali lipat. Crunchbase menulis dalam laporannya: "Tanpa ledakan kecerdasan buatan yang dipicu oleh ChatGPT, jumlah pembiayaan pada tahun 2023 akan lebih rendah lagi."
Sejauh ini, pembiayaan terbesar di industri AI pada tahun 2023 adalah investasi Microsoft sebesar $10 miliar di OpenAI pada bulan Januari.
Tiger Sniff Menurut statistik publik, di antara perusahaan rintisan berskala besar di Amerika Serikat, Infleksi AI dapat menjadi perusahaan rintisan terbesar kedua di bidang kecerdasan buatan setelah Open AI, diikuti oleh Anthropic ($1,5 miliar), Cohere ($445 juta), Adept ($415 juta), Runway ($195,5 juta), Character.ai ($150 juta) dan Stability AI (sekitar $100 juta).
Di China, pada paruh pertama tahun 2023, terdapat 456 insiden investasi dan pembiayaan publik di industri kecerdasan buatan dalam negeri. Dan statistik ini adalah 731, 526, 353, 631 dan 648 dalam lima tahun dari 2018 hingga 2022.
Acara investasi dan pembiayaan publik di industri kecerdasan buatan dalam negeri pada paruh pertama tahun ini
Peristiwa lain yang memicu flywheel adalah rilis antarmuka API oleh ChatGPT. Ketika OpenAI membuka antarmuka API ChatGPT untuk pertama kalinya pada bulan Maret, hampir ada konsensus di dalam dan di luar industri AI: industri akan segera berubah. Karena semakin banyak aplikasi yang terhubung ke model besar, semakin banyak hutan lebat tumbuh di atas AI.
"Membangun model skala besar dan membuat aplikasi harus dipisahkan." Investor selalu memiliki indra penciuman yang tajam. Menurut Chen Runze, Direktur Eksekutif Source Code Capital, AI memiliki logika yang sama dengan pembagian kerja di semikonduktor. Setelah kemakmuran model skala besar AI, segera kita akan segera melihat ledakan dalam aplikasi AI.
Di awal tahun ini, ketika Chen Runze dan rekan-rekannya pergi ke Silicon Valley, mereka menemukan bahwa Y Combinator, inkubator startup terkenal di Silicon Valley (CEO OpenAI Sam Altman menjabat sebagai presiden inkubator ini selama bertahun-tahun), setengah dari proyek telah diubah menjadi AI generatif. Antusiasme terhadap model-model besar tidak kalah dengan Cina di seberang lautan.
Namun, ia juga menemukan bahwa baik modal maupun pengusaha di Amerika Serikat lebih optimis tentang aplikasi ekologi berdasarkan model besar daripada kewirausahaan skala besar.Bagaimanapun, perusahaan seperti OpenAI telah muncul di jalur ini.Pada saat yang sama, the Amerika Serikat memiliki tanah ekologis aplikasi ToB yang kuat, sehingga lebih banyak perusahaan Amerika mencoba membuat aplikasi perusahaan berdasarkan ekologi model besar.
Pengamatan Chen Runze sedang dikonfirmasi. Chen Ran, salah satu pendiri platform layanan model skala besar OpenCSG, mengatakan kepada Huxiu bahwa saat ini, lebih dari 90% perusahaan di Bay Area Amerika Serikat telah menggunakan model skala besar kemampuan dalam segala aspek. Sedangkan untuk China, Chen Ran yakin banyak pelanggan yang akan menggunakannya sebelum akhir tahun.
Sekitar bulan Maret tahun ini, Chen Runze dan timnya mulai mencoba mencari perusahaan di China yang membuat aplikasi berdasarkan model besar, tetapi dia menemukan bahwa hanya ada sedikit perusahaan seperti itu. Sejumlah besar modal telah memasuki industri kecerdasan buatan, tetapi jika Anda menelusuri aliran dana ini, Anda akan menemukan bahwa lebih banyak uang masih terkonsentrasi di perusahaan-perusahaan top.
"Bahkan sekarang, dari 10 proyek yang terkait dengan AI generatif, tidak mudah untuk berinvestasi dalam 1-2." Selain Sumber Kode Modal, Huxiu juga berkomunikasi dengan banyak investor teknologi keras, dan mereka semua berkata, meskipun ada banyak proyek untuk dilihat, hanya ada sedikit proyek yang benar-benar andal.
Sikap di sisi aplikasi ini, di mata banyak orang di industri, sudah menjadi norma.
Yu Kai, salah satu pendiri Aspire, percaya bahwa jalur yang tampak hidup di permukaan sebenarnya lebih merupakan kompetisi nominal, dan hasilnya tidak lebih dari dua situasi: "Yang satu murni berorientasi pada modal untuk mengumpulkan uang; yang lain adalah Perusahaan yang membuat model skala besar universal benar-benar perlu berteriak, dan orang lain tidak akan tahu jika mereka tidak berteriak.
Beberapa statistik domestik juga menggambarkan masalah ini Menurut statistik dari organisasi pihak ketiga, Niu, per Juli 2023, ada 242 perusahaan AIGC di China, dan ada 71 insiden pembiayaan jalur AIGC sejak Januari. Ada 67 perusahaan di jalur model skala besar AI, dan hanya ada 21 acara pembiayaan sejak ChatGPT dirilis.
Acara pembiayaan trek AIGC dan trek model besar AI sejak rilis ChatGPT|Sumber data: Enniu Data
“Di pasar AI domestik, hanya ada sedikit target bagus.” Seorang investor memberi tahu Tiger Sniff bahwa proyek bagus terlalu mahal, dan yang murah tidak bisa diandalkan. Meskipun jumlah model skala besar AI yang dirilis di China saat ini melebihi seratus, di antara perusahaan model skala besar di China, tidak banyak, atau bahkan segelintir dari mereka, yang memperoleh pembiayaan besar.
Banyak investasi AI pada akhirnya berubah menjadi investor - mantan pendiri perusahaan unicorn, raksasa internet, orang-orang dengan pengalaman wirausaha terkait model skala besar, dll.
| | | | | | | --- | --- | --- | --- | --- | | Jenis Perusahaan | Perusahaan | Tanggal Pendirian | Model Besar dan Produk Terkait | | Perusahaan internet | Baidu | 2012 | Wenxin Yiyan | Terdaftar | | Aliyun | 2008 | Tongyi Qianwen | Terdaftar | | | Tencent AI Lab| 1998 | Hunyuan| Terdaftar| | | Huawei Cloud | 2019 | Pangu | Tidak Terdaftar | | | ByteDance| 2016 | Volcanic Ark| Tidak Terdaftar| | | JD Cloud | 2012 | Yanxi | Terdaftar | | | Kunlun Wanwei | 2008 | Tiangong | Terdaftar | | | 360 | 1992 | 360 Zhinao | Terdaftar | |
| | | | | | | --- | --- | --- | --- | --- | | Jenis Perusahaan | Perusahaan | Tanggal Pendirian | Model Besar dan Produk Terkait | | Perusahaan AI | SenseTime | 2014 | Harian Baru | Terdaftar | | HKUST Xunfei | 1999 | Xunfei Spark | Terdaftar | | | Teknologi Yuncong| 2015 | Tenang| Terdaftar| | | Data Daguan| 2015 | Cao Zhi| Babak C| | | Keluar dan tanyakan | 2014 | Sequence Monkey | Putaran D | | | Zhipu Al | 2019 | ChatGLM | Putaran B | | | Teknologi Lanzhou | 2021 | Mencius | Babak Pra-A | | | MiniMax | 2021 | Glow | Investasi Ekuitas | | | Teknologi Facewall| 2022 | VisCPM | Angel Wheel| | | Teknologi Shenyan| 2022 | CPM | Investasi Ekuitas| | | Kecerdasan Pikiran | 2021 | Al Utopia | Babak Pra-A | | | Teknologi Lianyuan| 2021 | ProdukGPT | Angel Wheel| | | Aspire | 2007 | DFM-2 | Penghentian IPO | |
| | | | | | | --- | --- | --- | --- | --- | | Jenis Perusahaan | Perusahaan | Tanggal Pendirian | Model Besar dan Produk Terkait | | Perusahaan AI baru akan didirikan pada tahun 2023 | Tahun cahaya | 2023 | Tidak | Putaran | | Baichuan Intelligent | 2023 | baichuan | Investasi Ekuitas | | | Nol Satu Segalanya | 2023 | Tidak Ada | Investasi Ekuitas | |
Sebagian statistik perusahaan yang terkait dengan model skala besar AI domestik
Di antara proyek AI bintang tahun ini, Zhipu AI, Lingxin Intelligence, Shenyan Technology, dan Facewall Intelligence semuanya adalah perusahaan yang diinkubasi oleh Tsinghua Lab. Baik Shenyan Technology dan Facewall Smart didirikan pada tahun 2022, dan mendapat dukungan teknis dari para sarjana terkenal di industri AI.
Waktu pendirian perusahaan AI berbasis Tsinghua ini lebih pendek daripada perusahaan AI yang didirikan oleh beberapa pemimpin industri Internet.Tahun Cahaya Setelahnya, Baichuan Intelligent dan Zero One Wanwu semuanya didirikan setelah dimulainya gelombang model berskala besar ini.
Wang Huiwen, salah satu pendiri Meituan, pernah mengumpulkan US$50 juta tahun cahaya setelah pendiriannya pada awal 2023, yang merupakan salah satu dari sedikit kasus pembiayaan dalam industri model skala besar China pada saat itu. Tidak seperti Zhipu AI dan Xihu Xinchen, yang sudah memiliki perusahaan berbasis model skala besar, Light Years Away akan dimulai pada Februari 2023. Sulit untuk membangun model skala besar dari awal.Pada 29 Juni, Meituan mengumumkan akuisisi semua kepentingan di luar Tahun Cahaya, dengan total pertimbangan sekitar US$233 juta (1,67 miliar yuan) dalam bentuk tunai, sekitar 367 juta yuan dalam bentuk utang, dan 1 yuan dalam bentuk tunai.
"Setidaknya harus ada orang dengan latar belakang pemrosesan bahasa alami, orang dengan sejumlah pengalaman praktis dalam pelatihan model skala besar, dan profesional dalam pemrosesan data, cluster daya komputasi skala besar, dll. Jika Anda ingin melakukannya aplikasi pada saat yang sama, Anda harus memiliki manajer Produk dan bakat operasional yang sesuai di lapangan.” Chen Runze menjelaskan konfigurasi standar tim inti model berskala besar.
AI PERUSAHAAN BESAR LEBIH BAIK
Dalam enam bulan terakhir, berita AI tentang raksasa Internet yang sudah mapan telah bertebaran di langit. Investasi pada model besar AI tampaknya mengejar hot spot, tetapi taruhan yang dibuat oleh perusahaan besar seperti Baidu, Ali, dan Huawei pada AI jelas tidak mengikuti tren.
Taruhan raksasa pada AI sudah dimulai sejak lama Bagi perusahaan-perusahaan ini, AI bukanlah topik baru. Tiger Sniff, menurut statistik yang tidak lengkap dari data pencarian perusahaan, pabrik-pabrik besar telah berinvestasi di berbagai perusahaan terkait kecerdasan buatan sejak 2018. Dari perspektif perusahaan investasi, kebanyakan dari mereka adalah perusahaan dalam penerapan kecerdasan buatan, meskipun beberapa di antaranya melibatkan perusahaan chip AI, tetapi jumlahnya tidak besar, hampir tidak ada perusahaan yang terlibat dalam model skala besar, dan sebagian besar perusahaan terkait kecerdasan buatan yang diinvestasikan oleh pabrikan besar terkait erat dengan bisnis mereka.
| | | | | | | --- | --- | --- | --- | --- | Lembaga Investasi Dachang|Jumlah Perusahaan yang Diinvestasikan|Rasio Kepemilikan Saham Rata-Rata|Rasio Kepemilikan Saham Maksimum|Jumlah Perusahaan Kepemilikan Saham 100%| | Alibaba | 23 | 36,25% | 100% | 5 | | Modal Ventura Baidu | 25 | 5,50% | 15% | 0 | | Investasi Tencent | 54 | 17,54% | 100% | 2 |
Investasi tiga perusahaan Internet besar di perusahaan terkait AI|Sumber data: Qichacha
Pada 2017, Alibaba Dharma Institute didirikan, objek penelitiannya mencakup berbagai bidang industri seperti kecerdasan mesin, jaringan cerdas, dan teknologi keuangan, yang memberdayakan kemampuan kecerdasan buatan ke berbagai lini bisnis Ali. Pada tahun 2018, Baidu mengusulkan strategi "All in AI".
Bedanya, kemunculan AI generatif tampaknya menjadi titik balik. Bagi raksasa teknologi dengan keunggulan dalam data, daya komputasi, dan sumber daya algoritme, kecerdasan buatan tidak hanya merupakan skenario yang memungkinkan bagi mereka, tetapi juga perlu mengambil peran infrastruktur.Bagaimanapun, munculnya AI generatif berarti bahwa industri kecerdasan buatan pembagian kerja telah dimulai.
Perusahaan besar yang diwakili oleh Baidu, Alibaba, Huawei, dan Tencent, empat penyedia cloud, telah mengumumkan strategi AI mereka sendiri, tetapi jelas masing-masing memiliki fokusnya sendiri.
Dalam enam bulan terakhir, raksasa telah merilis produk model skala besar mereka sendiri. Untuk perusahaan besar seperti Baidu dan Ali, belum terlambat bagi mereka untuk masuk ke model besar, pada dasarnya di tahun 2019.
Baidu telah mengembangkan model pra-pelatihan sejak 2019, dan secara berturut-turut merilis seri model Knowledge Enhanced Wenxin (ERNIE). Model Seribu Pertanyaan Tongyi Ali juga dimulai pada 2019. Selain model besar tujuan umum Baidu dan Ali, pada 19 Juni, Tencent Cloud merilis kemajuan penelitian dan pengembangan model besar industri. Pada 7 Juli, HUAWEI CLOUD merilis produk model industri Pangu 3.0.
Fokus ini juga menggemakan bisnis keseluruhan perusahaan, strategi cloud, dan tata letak jangka panjang di pasar AI.
Profitabilitas lini bisnis utama Baidu sangat berfluktuasi dalam lima tahun terakhir. Baidu telah lama melihat masalah bisnis periklanan berbasis pencarian di pasar domestik, dalam hal ini Baidu memilih untuk berinvestasi besar-besaran dalam teknologi AI untuk menemukan peluang baru. Selama bertahun-tahun, Baidu tidak hanya mengundang Wu Enda, Lu Qi, dan pemimpin industri lainnya untuk menjabat sebagai eksekutif, tetapi juga memiliki antusiasme yang jauh lebih tinggi untuk mengemudi secara otonom daripada perusahaan besar lainnya. Baidu, yang sangat peduli dengan AI, pasti akan bertaruh besar-besaran dalam gelombang kompetisi model berskala besar ini.
Ali juga menunjukkan antusiasme yang besar terhadap model besar secara umum. Untuk waktu yang lama, Aliyun menaruh harapan tinggi, dan Ali berharap untuk mengambil jalur teknis untuk menciptakan kurva pertumbuhan kedua grup. Dalam konteks persaingan bisnis e-commerce yang semakin ketat dan pertumbuhan pasar yang melambat, peluang baru di industri AI yang diciptakan oleh Evian tidak diragukan lagi merupakan peluang bagus bagi Alibaba Cloud untuk melakukan upaya lebih lanjut di pasar cloud domestik.
Dibandingkan dengan Baidu dan Ali, Tencent Cloud memilih untuk memprioritaskan model industri skala besar dalam hal model skala besar, sementara Huawei Cloud secara terbuka menyatakan hanya akan fokus pada model industri skala besar.
Bagi Tencent, pertumbuhan bisnis utamanya stabil dan positif dalam beberapa tahun terakhir. Pada tahap ketika masa depan model skala besar tujuan umum masih belum jelas, Tencent relatif berhati-hati dalam bertaruh pada model AI skala besar. Ketika Ma Huateng berbicara tentang model skala besar dalam panggilan konferensi pendapatan sebelumnya, dia berkata: "Tencent tidak terburu-buru untuk menunjukkan produk setengah jadi. Kuncinya adalah melakukan pekerjaan dengan baik dalam algoritme yang mendasarinya, daya komputasi dan data. Adegan jatuh."
Di sisi lain, dari perspektif Tencent Group, Tencent saat ini memiliki 4 AI Labs, dan tahun lalu merilis model elemen campuran berskala besar dengan triliunan parameter. Letakkan semua telur Anda dalam strategi taruhan satu keranjang.
Bagi Huawei, ini selalu menjadi taruhan besar dalam penelitian dan pengembangan.Dalam 10 tahun terakhir, total investasi Huawei dalam penelitian dan pengembangan telah melampaui 900 miliar yuan. Namun, karena kendala yang dihadapi dalam pengembangan bisnis telepon seluler, strategi keseluruhan Huawei dalam banyak penelitian dan pengembangan teknologi mungkin juga menghadapi penyesuaian.
Di satu sisi, bisnis ponsel adalah ekspor terbesar dari teknologi C-end Huawei. Jika bisnis ponsel tidak membayar model skala besar untuk keperluan umum, maka motivasi Huawei untuk mengembangkan skala besar untuk tujuan umum model akan turun secara signifikan. Bagi Huawei, bertaruh pada model industri berskala besar yang bisa diwujudkan dengan cepat tampaknya menjadi solusi optimal dalam permainan AI ini. Seperti yang dikatakan Zhang Pingan, CEO Huawei Cloud, "Huawei tidak punya waktu untuk menulis puisi."
Namun, bagi raksasa teknologi, sebesar apa pun taruhannya, selama mereka dapat membuat taruhan yang tepat, mereka akan dapat merebut pangsa pasar infrastruktur dan mendapatkan hak untuk berbicara di era kecerdasan buatan.
Ambil Palu untuk Paku
Untuk perusahaan komersial, semua keputusan masih jatuh pada buku ekonomi.
Bahkan dengan investasi besar, semakin banyak pendiri perusahaan yang berpandangan jauh ke depan menyadari bahwa ini adalah sesuatu yang harus dilakukan di masa depan, bahkan jika investasi awal mungkin tidak memberikan hasil sama sekali.
Penelitian dan pengembangan model besar AI membutuhkan banyak investasi, tetapi semakin banyak pendiri bisnis dan investor percaya bahwa ini adalah "investasi yang diperlukan", meskipun tidak ada pengembalian sama sekali.
Akibatnya, banyak perusahaan kecerdasan buatan yang lahir di bawah gelombang terakhir AI telah melihat fajar baru setelah lama diam.
“Tiga tahun lalu, semua orang mengatakan bahwa GPT-3 adalah kemungkinan menuju kecerdasan buatan umum.” Li Zhifei memimpin sekelompok orang untuk mempelajari GPT-3 pada tahun 2020. Saat itu, dia berada di titik balik dalam perkembangannya ., mereka ingin menjelajahi bisnis baru, tetapi setelah periode penelitian, proyek model skala besar Li Zhifei ditangguhkan.Salah satu alasannya adalah modelnya tidak cukup besar pada saat itu, dan yang lainnya adalah tidak ada adegan pendaratan komersial.
Namun, setelah ChatGPT keluar pada akhir tahun 2022, Li Zhifei tampaknya diberi kesempatan, karena dia, seperti orang lain, melihat peluang baru untuk model besar. Pada bulan April tahun ini, Going Out and Asking merilis produk model berskala besar yang dikembangkan sendiri - Sequence Monkey. Saat ini, mereka sedang bersiap untuk berlari ke Bursa Efek Hong Kong dengan model skala besar "Serial Monkey" yang baru dirilis, dan mereka telah mengirimkan prospektus pada akhir Mei.
Perusahaan AI lain yang mapan juga menindaklanjuti.Pada Juli tahun lalu, Aspire mengajukan permohonan IPO ke Dewan Inovasi Sains dan Teknologi, yang ditolak oleh komite peninjau daftar pada Mei tahun ini.
Yu Kai berkata terus terang bahwa bahkan OpenAI dilatih dengan Microsoft V100 selama hampir satu tahun di tahap GPT2, dan daya komputasinya beberapa kali lipat lebih buruk daripada A100. Pada tahap akumulasi awal model besar, Aspire juga menggunakan kartu yang lebih ekonomis untuk pelatihan. Tentu saja, ini membutuhkan waktu sebagai harga.
Dibandingkan dengan model besar yang dikembangkan sendiri, beberapa perusahaan berorientasi aplikasi memiliki pilihannya sendiri.
Zhang Wang (nama samaran), presiden sebuah perusahaan pendidikan online, mengatakan kepada Huxiu bahwa dalam enam bulan terakhir, mereka telah berusaha keras dalam mengeksplorasi skenario aplikasi model skala besar, tetapi mereka segera menemukan bahwa ada banyak masalah dalam proses implementasi. seperti biaya dan investasi. Tim R&D perusahaan memiliki 50-60 orang. Sejak mereka mulai melakukan penelitian model skala besar, mereka telah memperluas tim R&D dan merekrut beberapa talenta baru dalam model skala besar. Zhang Wang mengatakan bahwa talenta dalam model tingkat rendah sangat mahal.
Zhang Wang tidak pernah berpikir untuk mengembangkan model besar dari awal, dan mempertimbangkan masalah seperti keamanan data dan stabilitas model, dia tidak bermaksud untuk langsung mengakses API untuk aplikasi. Pendekatan mereka mengacu pada model besar open source dan menggunakan data mereka sendiri untuk pelatihan. Ini juga merupakan praktik saat ini dari banyak perusahaan aplikasi - selain model besar, menggunakan data mereka sendiri untuk membuat model industri kecil. Ke depan, mereka memulai dengan model 7 miliar parameter, mencapai 10 miliar, dan sekarang mencoba model 30 miliar. Tetapi mereka juga menemukan bahwa dengan bertambahnya jumlah data, situasi pelatihan model besar adalah bahwa versi baru mungkin tidak sebagus versi sebelumnya, dan parameternya harus disesuaikan satu per satu. itu harus diambil," kata Zhang Wang.
Zhang Wang memberi tahu Huxiu bahwa persyaratan mereka untuk tim Litbang adalah mengeksplorasi skenario model skala besar AI berdasarkan bisnis perusahaan.
Ini adalah cara untuk menemukan "paku" dengan "palu", tetapi tidak mudah.
"Masalah terbesar saat ini adalah menemukan adegan yang cocok. Faktanya, ada banyak adegan. Bahkan jika AI digunakan, efeknya tidak dapat ditingkatkan banyak," kata Zhang Wang, misalnya, dalam adegan kelas, AI besar model dapat digunakan untuk memberdayakan beberapa mode interaktif, termasuk mengingatkan siswa untuk menghadiri kelas, menjawab pertanyaan, dan memberi label, dll, tetapi setelah mereka mencoba model besar AI, mereka menemukan bahwa akurasinya kurang baik, dan kemampuan untuk memahami dan output tidak ideal. Tim Zhang Wang memutuskan untuk sementara meninggalkan AI dalam adegan ini setelah mencoba beberapa saat.
Penyedia layanan Internet lainnya, Xiaogetong, juga mulai mengeksplorasi bisnis terkait segera setelah merebaknya model AI. Bisnis utama Little Goose adalah menyediakan alat operasi digital untuk pedagang online, termasuk pemasaran, manajemen pelanggan, dan monetisasi komersial.
Fan Xiaoxing, salah satu pendiri dan COO Goose Communication, mengatakan kepada Huxiu bahwa pada bulan April tahun ini, ketika semakin banyak aplikasi lahir berdasarkan AI generatif, Goose Communication melihat potensi di balik teknologi ini. jelas bagi semua.” Fan Xiaoxing dan yang lainnya secara khusus mengatur lini bisnis penelitian AI secara internal, mencari kasus pendaratan yang terkait dengan bisnis mereka sendiri.
Fan Xiaoxing mengatakan bahwa dalam proses mengintegrasikan model besar ke dalam bisnis, yang dianggapnya adalah biaya dan efisiensi, "Biaya input model besar masih cukup tinggi," katanya.
"Paku" industri Internet mudah ditemukan Kesulitan sebenarnya dalam mengimplementasikan AI terletak pada industri fisik seperti industri dan manufaktur.
Yu Kai memberi tahu Huxiu bahwa gelombang AI ini masih berputar ke atas dan maju dalam gelombang, dan kontradiksi dalam penerapan industri tidak berubah sama sekali, hanya mengubah cangkangnya. Jadi dalam pengertian ini, hukum kedua gelombang AI itu sama, dan cara terbaik adalah belajar dari sejarah— "Pelajaran dari gelombang AI terakhir, jangan ulangi kali ini."
Meskipun banyak pabrikan meneriakkan slogan "utamakan industri" dalam penerapan model besar AI, sangat sulit bagi banyak skenario industri fisik untuk menyamai model besar AI saat ini. Misalnya, sistem inspeksi visual AI yang diterapkan dalam beberapa skenario inspeksi industri, meskipun permintaan model AI tidak setinggi 1 miliar parameter, data pelatihan awal masih terbentang.
Mengambil adegan inspeksi tenaga angin sederhana sebagai contoh, jumlah inspeksi di ladang angin mencapai 70.000 unit, tetapi data retakan yang sama mungkin hanya muncul sekali, dan jumlah data yang dapat dipelajari mesin masih jauh dari cukup. Ke Liang, direktur produk Broadbo Intelligent Wind Power Hardware, mengatakan kepada Tiger Sniff bahwa saat ini, robot inspeksi untuk bilah turbin angin tidak dapat menganalisis retakan bilah secara akurat 100%, karena jumlah data yang tersedia untuk pelatihan dan analisis terlalu kecil. identifikasi juga memerlukan sejumlah besar akumulasi data dan analisis manual.
Namun, dalam skenario dengan akumulasi data industri yang baik, model besar AI sudah dapat membantu pengelolaan pustaka komponen model 3D yang kompleks. Perpustakaan suku cadang dari perusahaan manufaktur pesawat terbang domestik telah mengimplementasikan alat bantu pustaka suku cadang berdasarkan model besar dari paradigma keempat "Shishuo". Di antara lebih dari 100.000 bagian pemodelan 3D, pencarian model 3D dapat diwujudkan melalui bahasa alami, model 3D dapat dicari dengan model 3D, dan bahkan perakitan otomatis model 3D dapat diselesaikan. Fungsi-fungsi ini memerlukan operasi multi-langkah di banyak alat CAD dan CAE yang macet di industri manufaktur.
Model skala besar saat ini menghadapi masalah pendaratan yang sama seperti AI beberapa tahun lalu, dan mereka juga harus menemukan paku dengan palu. Beberapa orang secara optimis percaya bahwa palu hari ini benar-benar berbeda dari masa lalu, tetapi ketika harus membayar AI dengan uang sungguhan, hasilnya agak berbeda.
Menurut survei Markets Live Pulse yang dirilis oleh Bloomberg pada 30 Juli, di antara 514 investor yang disurvei, sekitar 77% berencana untuk meningkatkan atau mempertahankan investasi pada saham teknologi dalam enam bulan ke depan, dan hanya kurang dari 10% investor yang percaya bahwa teknologi tersebut industri sedang menghadapi krisis gelembung yang serius. Namun, hanya setengah dari investor yang optimis dengan perkembangan industri teknologi yang terbuka terhadap teknologi AI.
50,2% responden mengindikasikan bahwa mereka tidak berniat untuk membayar pembelian alat AI saat ini, dan sebagian besar perusahaan investasi tidak memiliki rencana untuk menerapkan AI pada transaksi atau investasi dalam skala besar.
Sekop Sekop
"Jika Anda pergi ke California untuk mendulang emas selama demam emas pada tahun 1848, banyak orang akan mati, tetapi orang yang menjual sendok dan sekop selalu dapat menghasilkan uang," kata Lu Qi dalam pidatonya.
Gao Feng (nama samaran) ingin menjadi "penjual sekop", tepatnya, orang yang bisa "menjual sekop bagus di China".
Sebagai peneliti chip, Gao Feng menghabiskan sebagian besar waktu penelitian ilmiahnya pada chip AI. Dalam satu atau dua bulan terakhir, dia merasakan semacam urgensi - dia ingin menjadi perusahaan CPU yang berbasis arsitektur RISC-V. Di kedai teh, Gao Feng menjelaskan masa depan kepada Huxiu.
Namun, membuat chip AI dari awal, baik di industri chip maupun di lingkaran teknologi, seperti "Arabian Nights".
Saat roda gila model besar AI mulai dengan cepat, daya komputasi di belakangnya secara bertahap mulai gagal mengimbangi kecepatan para pemain di trek ini. Permintaan daya komputasi yang melonjak telah menjadikan Nvidia sebagai pemenang terbesar. Tapi GPU bukanlah solusi keseluruhan untuk daya komputasi. CPU, GPU, dan berbagai chip AI inovatif membentuk pusat catu daya komputasi utama model besar.
"Anda dapat membandingkan CPU dengan daerah perkotaan, dan GPU adalah pengembangan pinggiran." Gao Feng mengatakan bahwa CPU dan chip AI harus dihubungkan melalui saluran yang disebut PCIE, dan data dikirim ke chip AI, dan kemudian chip AI mengirimkan data kembali ke CPU. Jika volume data dari model besar menjadi lebih besar, saluran akan menjadi padat dan kecepatan tidak akan meningkat, oleh karena itu jalan ini perlu diperlebar, dan hanya CPU yang dapat menentukan lebar saluran ini, dan berapa banyak jalur yang diperlukan. diatur.
Artinya, meskipun China berhasil menembus chip AI pada model besar, masih sulit untuk menembus CPU yang paling kritis. Bahkan dalam pelatihan AI, semakin banyak tugas yang dapat diberikan ke GPU, tetapi CPU masih merupakan peran "manajer" yang paling penting.
Beberapa chip domestik dipamerkan di area pameran model besar 2023WAIC
Sudah lebih dari 50 tahun sejak Intel menciptakan CPU pertama di dunia pada tahun 1971. Di pasar server sipil dan PC, Intel dan AMD telah lama menjadi dunia. Intel telah membangun sistem yang mencakup hak kekayaan intelektual, akumulasi teknologi, biaya skala, dan ekologi perangkat lunak Seluruh penghalang model bisnis, dan penghalang ini tidak pernah menurun.
Penting untuk sepenuhnya meninggalkan arsitektur X86 dan arsitektur ARM, dan mengembangkan chip CPU yang sepenuhnya independen berdasarkan arsitektur baru Arsitektur sumber terbuka seperti RISC-V yang belum sepenuhnya dikembangkan dan diverifikasi.
Set instruksi seperti sebidang tanah.Mengembangkan chip berdasarkan set instruksi sama dengan membeli tanah dan membangun rumah. Arsitektur X86 adalah sumber tertutup, dan hanya chip ekologis Intel yang diizinkan.Arsitektur ARM perlu membayar biaya lisensi IP, sedangkan RISC-V adalah arsitektur sumber terbuka gratis.
Industri dan akademisi sudah melihat peluang seperti itu.
Pada tahun 2010, tim peneliti dua profesor dari Berkeley, California, mengembangkan set instruksi baru dari awal, yaitu RISC-V. Set instruksi ini benar-benar open source. Mereka percaya bahwa set instruksi CPU seharusnya tidak dimiliki oleh siapa pun. perusahaan.
"RISC-V mungkin merupakan awal dari CPU Cina," kata Gao Feng. Pada tahun 2018, ia menginkubasi perusahaan chip AI di institut tersebut, saat itu ia mengatakan tidak ingin melewatkan kesempatan untuk pengembangan gelombang AI, kali ini ia masih ingin merebutnya, dan ini titik masuknya adalah RISC-V. Di era model besar dan substitusi domestik, permintaan ini semakin mendesak.Lagipula, jika suatu saat perusahaan China tidak bisa lagi menggunakan A100, apa yang harus mereka lakukan?
"Jika Anda ingin mengganti ARM dan X86, CPU RISC-V harus lebih bertenaga, dan Anda perlu berpartisipasi dalam pengembangan kode dengan orang-orang yang menggunakan sistem operasi komersial di Linux," kata Gao Feng.
Gao Feng bukan orang pertama yang menyadari peluang ini Seorang investor di industri chip mengatakan kepada Tiger Sniff bahwa dia pernah mengobrol dengan pendiri perusahaan rintisan chip tentang peluang menggunakan arsitektur RISC-V untuk membuat GPU. Saat ini, sudah ada beberapa perusahaan di China yang membuat GPU berdasarkan arsitektur RISC-V, namun ekologi masih menjadi masalah terbesar yang mereka hadapi.
“Linux telah menunjukkan bahwa jalur ini layak.” Gao Feng mengatakan bahwa dalam sistem operasi open source Linux ini, perusahaan open source seperti Red Hat lahir, dan banyak layanan cloud kini dibangun di atas sistem Linux. “Dibutuhkan cukup pengembang.” Gao Feng mengusulkan sebuah metode. Jalan ini sulit, tetapi akan menjadi jalan terang jika dilalui.
flywheel berputar terlalu cepat
Di bawah "respons stres" dari model besar, bukan hanya puncak yang terasa mendesak.
Lianchuang, perusahaan model skala besar AI domestik, mengatakan kepada Tiger Sniff bahwa mereka juga sempat meluncurkan model dialog berskala besar di awal tahun ini Banyak permintaan perbaikan.
"Sampai tidak ada kebijakan peraturan khusus, kami tidak akan dengan mudah membuka produk untuk pengguna biasa. Alasan utamanya adalah logika To B." Zhang Chao, CEO Left Hand Doctor, percaya bahwa sebelum "Tindakan Administratif" dikeluarkan , AI generatif Produk ini terbuka untuk pengguna C-end, yang sangat berisiko. “Pada tahap ini, di satu sisi, kami terus melakukan optimalisasi secara iteratif, dan di sisi lain, kami juga terus memperhatikan kebijakan dan regulasi untuk memastikan keamanan teknologi.”
"Pendekatan peraturan untuk AI generatif masih belum jelas, dan produk serta layanan perusahaan model skala besar umumnya sangat sederhana." Penyedia teknologi digital merilis produk aplikasi berdasarkan model skala besar umum yang dikembangkan oleh cloud produsen pada bulan Juni Pada pertemuan tersebut, orang yang bertanggung jawab atas teknologi perusahaan memberi tahu Huxiu bahwa mereka diminta oleh vendor cloud untuk merahasiakannya, dan jika mereka mengungkapkan model besar siapa yang digunakan, mereka akan dianggap telah melanggar kontrak. Adapun mengapa kasus tersebut harus dirahasiakan, penanggung jawab menganalisis bahwa sebagian besar alasannya mungkin untuk menghindari risiko peraturan.
Pada saat dunia meningkatkan kewaspadaannya terhadap AI, tidak ada pasar yang dapat menerima "masa vakum" regulasi.
Pada 13 Juli, tujuh departemen termasuk Cyberspace Administration of China secara resmi merilis "Langkah Sementara untuk Administrasi Layanan Kecerdasan Buatan Generatif" (selanjutnya disebut sebagai "Langkah Administratif"), yang akan mulai berlaku pada 15 Agustus 2023.
"Setelah "Langkah Administratif" dikeluarkan, kebijakan akan berubah dari berorientasi masalah menjadi pembangunan berorientasi tujuan, yang merupakan tujuan kami." Wang Yuwei, mitra Firma Hukum Guantao, percaya bahwa peraturan baru lebih menekankan "drainase". daripada "memblokir".
Menjelajahi perpustakaan manajemen risiko di Amerika Serikat adalah pekerjaan rumah sehari-hari untuk Wang Yuwei."Kami menyediakan kontrol risiko dan solusi kepatuhan untuk aplikasi komersial menggunakan GPT dan model besar lainnya untuk segmen industri, dan membangun kerangka kerja tata kelola kepatuhan." Wang Yuwei berkata .
Raksasa AI Amerika berbaris untuk menunjukkan kesetiaan mereka kepada Kongres. Pada 21 Juli, Google, OpenAI, Microsoft, Meta, Amazon, startup AI Inflection, Anthropic, tujuh perusahaan AI Amerika paling berpengaruh, menandatangani komitmen sukarela di Gedung Putih. Pastikan pakar keamanan independen diizinkan untuk menguji sistem mereka sebelum merilisnya ke publik. Dan berbagi data tentang keamanan sistem mereka dengan pemerintah dan akademisi. Mereka juga akan mengembangkan sistem untuk memperingatkan publik ketika gambar, video, atau teks dihasilkan oleh AI, menggunakan metode yang dikenal sebagai "watermarking".
Perwakilan dari 7 raksasa AI Amerika menandatangani janji AI di Gedung Putih
Sebelumnya, pada sidang kongres AS, pendiri OpenAI Sam Altman mengatakan bahwa serangkaian standar keselamatan untuk model kecerdasan buatan perlu dibuat, termasuk mengevaluasi kemampuan berbahayanya. Misalnya, model harus lulus tes keamanan tertentu, seperti apakah mereka dapat "menggandakan diri" dan "menyusup ke alam liar".
Mungkin Sam Altman sendiri tidak menyangka roda gila AI akan berputar begitu cepat bahkan berisiko kehilangan kendali.
“Kami tidak menyadari urgensi masalah ini pada awalnya,” kata Wang Yuwei, sampai semakin banyak pendiri perusahaan yang datang untuk berkonsultasi. Ia merasa gelombang kecerdasan buatan ini sedang mengalami perubahan yang sama sekali berbeda dari masa lalu.
Awal tahun ini, Wang Yuwei didekati oleh perusahaan Wenshengtu yang pertama kali mengakses model berskala besar.Perusahaan tersebut ingin memperkenalkan bisnisnya ke China, sehingga mereka ingin mengetahui tentang bisnis kepatuhan data di area ini. Segera setelah itu, Wang Yuwei menemukan bahwa semakin banyak konsultasi semacam itu, dan perubahan yang lebih jelas adalah bahwa bukan lagi penasihat hukum perusahaan tetapi pendiri yang datang untuk berkonsultasi. “Dengan munculnya AI generatif, logika pengaturan asli sulit diterapkan,” kata Wang Yuwei.
Wang Yuwei, yang telah terlibat dalam pekerjaan hukum data besar selama bertahun-tahun, menemukan bahwa AI generatif dan gelombang AI sebelumnya menunjukkan perubahan yang lebih mendasar. Misalnya, terakhir kali AI lebih didasarkan pada rekomendasi berbasis algoritme, dan beberapa pengenalan wajah ditujukan untuk satu adegan, dan beberapa model kecil dilatih dalam skenario aplikasi tertentu. Masalah hukum yang terlibat tidak lebih dari hak kekayaan intelektual. , Privasi masalah perlindungan. Peran berbeda dalam ekosistem AI generatif ini, seperti perusahaan yang menyediakan model besar yang mendasarinya, perusahaan yang terhubung ke model besar untuk membuat aplikasi, dan vendor cloud yang menyimpan data, dll., memiliki pengawasan terkait yang berbeda.
Saat ini, ada konsensus tentang risiko terkait yang dibawa oleh model besar. Industri memahami bahwa aplikasi komersial pasti akan memperbesar risiko tersebut. Untuk menjaga kelangsungan bisnis, perlu memperhatikan pengawasan.
Kesulitannya adalah, “Bagaimana menemukan jalur yang dapat mengatur dengan baik tanpa mempengaruhi perkembangan industri.” kata Wang Yuwei.
Kesimpulan
Untuk seluruh industri, selain memperdalam diskusi tentang teknologi, hal ini juga memicu pemikiran yang lebih luas.
Ketika AI secara bertahap menempati posisi dominan dalam industri teknologi, bagaimana memastikan keadilan, keadilan, dan transparansi teknologi? Bagaimana memastikan bahwa usaha kecil dan menengah dan start-up tidak terpinggirkan ketika perusahaan terkemuka mengontrol teknologi dan aliran modal dengan ketat? Pengembangan dan penerapan model skala besar memiliki potensi besar, tetapi apakah mengikuti tren secara membabi buta menyebabkan kita mengabaikan teknologi inovatif lainnya?
"Dalam jangka pendek, model AI besar terlalu dilebih-lebihkan. Namun dalam jangka panjang, model AI besar diremehkan secara serius."
Dalam setengah tahun, gelombang panas AI melonjak. Namun, bagi perusahaan rintisan dan raksasa teknologi China, bagaimana mempertahankan penilaian yang jelas dan membuat perencanaan dan investasi jangka panjang dalam suasana pasar yang panas akan menjadi kunci untuk menguji kekuatan dan visi mereka yang sebenarnya.