Dachang menyusul ChatGPT

2023-07-21 06:38:44

Asli: Magnolia Luozhi

Sumber: Ulasan Bisnis Kutipan Baru

Sumber gambar: Dihasilkan oleh alat AI Tak Terbatas

Dalam dua ratus hari sejak peluncuran ChatGPT, pengembangan model skala besar domestik telah memulai mode "badai".

Dikatakan bahwa 79 model skala besar dengan skala lebih dari 1 miliar parameter di China telah dirilis.

Bidang evolusi model skala besar berfokus pada jarak dekat dari seratus model: model skala besar Baidu Wenxin telah berevolusi menjadi 3,5 bentuk; Ali Tongyi Qianwen telah membangun model keluarga; Model skala besar JD Yanxi adalah model skala besar industri yang "dibuat khusus" untuk dirinya sendiri;

Teori evolusi model skala besar pabrik besar kejam dan realistis, dan mereka harus mengejar atau dihilangkan.

Baidu Wenxin Big Model 3.5, yang berlari ke depan dan berlatih keras, baru-baru ini mengumumkan bahwa versi terbaru dari kemampuan Yiyan Wenxin telah melampaui ChatGPT 3.5.

Seleksi alam, survival of the fittest, pabrikan besar, dan model besar telah mengambil alih ChatGPT.

Model pabrik besar, lebih dari ChatGPT3.5

Mengenakan jas hitam dalam dan luar putih dengan rambut pendek rapi, ia muncul di Konferensi Laporan Penilaian Kemampuan Teknis Model Besar AI.

Topik tersebut masih direvisi pada malam sebelumnya.Wu Tian, wakil presiden Grup Baidu, yang baru saja kembali dari perjalanan bisnis, mengatakan pada pertemuan tersebut: "Versi baru Wenxin Yiyan telah melampaui ChatGPT 3.5. Ini juga merupakan tonggak penting bagi kami untuk melakukan pekerjaan teknis terkait di China."

Ini adalah pabrikan besar lainnya yang secara resmi mengonfirmasi bahwa model besar melampaui ChatGPT setelah Liu Qingfeng dari HKUST Xunfei menyebutkan bahwa model besar Spark akan melampaui ChatGPT.

Pada bulan Maret tahun ini, model bahasa skala besar yang ditingkatkan pengetahuan generasi berikutnya dari Baidu "Wenxin Yiyan" diundang secara publik untuk pengujian. Model ini didasarkan pada versi 3.0 dari model skala besar Wenxin. Setelah lebih dari 3 bulan, model Wenxin telah ditingkatkan ke versi 3.5, dan efek, fungsi, dan kinerjanya telah ditingkatkan secara komprehensif.

Wenxin Yiyan 3.5 telah melampaui ChatGPT3.5, kemungkinan besar karena mekanisme plug-in baru dalam hal fungsi Wenxin Large Model 3.5 telah memperluas batas kemampuan model besar melalui plug-in.

Model besar menekankan kekuatan teknis dan kemampuan dasar model besar. Pada bulan Mei tahun ini, model dasar besar baru yang diluncurkan oleh Baidu adalah Wenxin Large Model 3.5. Model ini adalah model dasar dari sistem Wenxin Yiyan.

Perlu disebutkan bahwa dalam pelatihan model dasar, versi 3.5 juga mengadopsi teknologi pelatihan paralel hibrida adaptif tercanggih dan strategi perhitungan presisi campuran FlyPaddle, yang sangat mempercepat kecepatan iterasi model.

Seperti yang kita semua tahu, Baidu telah sangat mengembangkan penelitian dan pengembangan teknologi kecerdasan buatan full-stack, dengan total empat lapisan: lapisan chip, lapisan kerangka kerja, lapisan model dan lapisan aplikasi.

Lapisan chip memiliki Kunlun Core; lapisan kerangka kerja memiliki platform pembelajaran mendalam Paddle, yang sangat mendukung pelatihan efisien dan penalaran model besar; lapisan model memiliki model besar Wenxin; pada lapisan aplikasi, 150.000 perusahaan saat ini mengajukan akses ke tes Wenxin Yiyan.

Di antara mereka, platform Flying Paddle memiliki 7,5 juta pengembang, dibandingkan dengan 8 juta hingga 10 juta praktisi perangkat lunak di China.Meskipun praktisi perangkat lunak dan pengembang pembelajaran mendalam tidak persis sama, keunggulan jumlah talenta juga memberikan think tank berkapasitas besar bagi Wenxin 3.5 untuk mengejar ChatGPT, mirip dengan keberadaan Ultrain.

Dibandingkan dengan perusahaan asing, perusahaan China memiliki keunggulan alami dalam memperoleh korpus China dan pemahaman tentang budaya China.Industri manufaktur China memiliki kategori paling lengkap, dan memiliki kondisi yang menguntungkan untuk melatih AIGC untuk industri nyata.

Banyak faktor yang berkontribusi pada promosi tersebut. Wenxin Big Model 3.0 berdasarkan Wenxin Yiyan dirilis lebih dari 100 hari yang lalu. Di bawah pengoptimalan kolaboratif FlyPaddle dan Wenxin, Wenxin Big Model 3.5 telah berkembang pesat. Efek model terbaru meningkat sebesar 50%, kecepatan pelatihan meningkat 2 kali lipat, dan kecepatan penalaran meningkat 30 kali lipat. Ini berhasil melampaui ChatGPT.

Di atas teknologi dasar, Baidu telah mengembangkan tiga teknologi peningkatan tambahan: peningkatan pengetahuan, peningkatan pengambilan, dan peningkatan dialog.

Membandingkan model besar dengan manusia, jika orang belajar dengan cara struktur pengetahuan dan sistem pengetahuan, efisiensi pembelajarannya lebih tinggi. Kemudian belajar menggunakan alat untuk mencari, mewujudkan pengambilan end-to-end yang sangat disederhanakan, dan meningkatkan ketepatan waktu.

Setelah model besar selesai belajar sendiri, ia harus belajar pelatihan intensif umpan balik. Peningkatan dialog seperti membiarkan model besar melakukan pertanyaan terus menerus, memberi tahu model besar apa yang benar dan apa yang salah dalam dialog, dan melalui cara mendorong, biarkan model besar memperkuat mekanisme memori, biarkan dia menjawab pertanyaan dengan cara yang kita inginkan, dan ajarkan anak bagaimana menjawab dengan lebih baik.

Selain kekuatan teknis, model besar perlu di-ground.

Dalam hal aplikasi industri, model skala besar Baidu Wenxin berasal dari dan melayani praktik industri, telah menjelajahi jalur kunci untuk implementasi industri model skala besar, dan juga telah merilis model skala besar yang mencakup banyak industri dan bidang untuk mempercepat transformasi cerdas industri.

Saat ini, perusahaan seperti State Grid, Pudong Development, Taikang, Geely, Harbin, Shenzhen Gas, TCL, dan Baidu Wenxin telah bekerja sama satu sama lain.

Selain itu, Baidu telah menginvestasikan lebih dari 100 miliar yuan dalam penelitian dan pengembangan dalam sepuluh tahun terakhir, dan investasi inti R&D-nya akan mencapai lebih dari 23% pada tahun 2021. Jumlah aplikasi dan otorisasi untuk jurusan kecerdasan buatan menempati peringkat pertama di China selama lima tahun berturut-turut, dan jumlah aplikasi paten pembelajaran mendalam menduduki peringkat pertama di dunia. Terobosan Baidu di bidang model skala besar AI juga terkait erat dengan investasi kuat Baidu dalam sumber daya elemen.

Terlihat sudah saatnya pabrik besar dan model besar berjuang untuk penelitian dan pengembangan.

Pabrik besar dan model besar mana yang lebih baik?

Pada paruh pertama tahun ini, ada hampir seratus perusahaan yang secara resmi mengumumkan untuk membuat model skala besar, dan setiap model skala besar berada dalam pertempuran sengit. Di antara mereka, ada pemain Internet besar seperti Ali, Baidu, Tencent, JD.com, dan ByteDance, serta perusahaan AI seperti HKUST Xunfei dan SenseTime, dan "pasukan tanpa nama" lainnya juga ikut campur.

Dalam setengah tahun, trek model skala besar telah menyelesaikan proses dari konsep hingga pendaratan, yang sangat eksplosif di trek mana pun.

Namun, sejauh ini, tidak ada indikator atau pedoman yang jelas untuk memverifikasi model skala besar siapa yang lebih baik. Satu demi satu, penilaian diri "Wang Po menjual melon, menjual melon dan membual" menyilaukan, dan tidak ada banyak objektivitas.

Jadi, dalam pertarungan seratus model, siapa yang lebih baik?

Dalam "Laporan Penilaian Kemampuan Teknis Model Skala Besar AI terbaru, 2023" yang dirilis oleh IDC, kerangka penilaian kemampuan teknis model skala besar AI diusulkan untuk pertama kalinya.

Ada tiga dimensi dalam model evaluasi: teknologi produk, ekologi layanan, dan aplikasi industri.

Ada hingga 12 indikator subdivisi spesifik: model algoritme, kapabilitas layanan, kapabilitas umum, kapabilitas inovasi, kapabilitas platform, keamanan dan penjelasan, kerja sama ekologis, cakupan industri, keuangan, industri, perawatan medis, dan energi.

Diantaranya, model algoritme dan cakupan industri adalah dua indikator terpenting untuk mengukur kemampuan model besar, khususnya, keduanya dapat membentuk roda gila untuk peningkatan berulang yang berkelanjutan.

Di antara kemampuan teknis produk, dimensi "model algoritme" adalah elemen inti dari kemampuan model besar, dan juga akar yang menentukan efek penerapan model besar.

Alasannya adalah bahwa hanya melalui terobosan teknologi model algoritme dan realisasi basis model besar dengan keunggulan efek umum yang dapat mendukung cakupan industri yang lebih luas, memungkinkan semua lapisan masyarakat untuk sepenuhnya menikmati dividen yang dibawa oleh terobosan teknologi, dan menyelesaikan dilema ambang batas tinggi untuk penerapan AI.

Dalam hal kemampuan aplikasi industri, luasnya cakupan aplikasi merupakan indikator yang paling diperhatikan bagi produsen model skala besar, dan ini merupakan cerminan menyeluruh dari kepemimpinan universal efek model skala besar dan kemampuan penggabungan industri.

Oleh karena itu, "cakupan industri" mencerminkan kekuatan model besar dalam implementasi industri melalui jumlah pelanggan tingkat perusahaan dan jumlah industri pendaratan.

Model skala besar arus utama domestik, termasuk 14 pabrikan termasuk Baidu, Ali, Tencent, Huawei, iFlytek, 360, SenseTime, dan 4Paradigm, berpartisipasi dalam evaluasi ini.

Pabrikan besar dan model besar memiliki tingkat persaingan yang tinggi. Baidu memiliki keunggulan unik dari tata letak lengkap dari tumpukan teknologi empat lapis "aplikasi-model-kerangka-chip": lapisan chip-inti Kunlun, dayung terbang lapisan bingkai, model besar lapisan-Wenxin, dan berbagai aplikasi AI. Diantaranya, platform pembelajaran mendalam yang dikembangkan sendiri oleh Baidu, Flying Paddle memberikan dukungan kuat untuk pelatihan dan penalaran yang efisien dari model-model besar.

Aliyun juga sangat eye-catching, dengan 6 dari 12 indikator mendapatkan nilai penuh, dan merupakan satu-satunya vendor yang mendapat nilai penuh untuk "kemampuan layanan". Sebagai penyedia model dasar, kemampuan platform, kemampuan layanan, dan tingkat kerja sama ekologis dari produsen model besar sangat penting untuk pengembangan industri. Alibaba Cloud mencetak nilai penuh di ketiga indikator tersebut.

Saat ini, keluarga model besar tujuan umum Alibaba Cloud memiliki kemampuan untuk memproses atau menghasilkan teks, suara dan gambar, serta modalitas lainnya. Dalam tiga bulan terakhir, Alibaba Cloud telah berturut-turut meluncurkan model dasar "Tongyi Thousand Questions", produk model skala besar audio dan video "Tongyi Tingwu", dan model berskala besar kreasi lukisan AI "Tongyi Wanxiang". Keluarga model skala besar Tongyi masih dalam iterasi dan evolusi yang konstan.

Tencent Cloud dan JD Cloud, keduanya perusahaan Internet besar, telah memilih untuk fokus pada sisi industri dan merilis model industri skala besar berdasarkan karakteristik mereka sendiri.

Atas dasar membangun model industri besar, Tencent Cloud menggunakan datanya sendiri untuk penyempurnaan guna membuat model eksklusif dengan akurasi data yang lebih tinggi serta privasi dan keamanan yang lebih kuat.

Bagi JD.com yang sudah beberapa tahun menggeluti supply chain, lebih baik fokus pada supply chain dengan berfokus pada bisnis e-commerce dan bisnis logistik sejak lama. Seperti yang dikatakan JD.com pada konferensi pers model skala besar Yanxi, "Hanya dengan membuat rantai pasokan menjadi nyata, model besar dapat dibuat nyata."

Pabrikan AI seperti HKUST iFLYTEK juga telah mencetak nilai penuh di jalur vertikal. Para pemain ini memiliki peluang untuk menembus industri vertikal. Dalam persaingan antar pabrikan, perusahaan dengan keunggulan nyata di bidang vertikal akan memimpin.

Ambil IFLYTEK sebagai contoh. IFLYTEK telah berfokus pada bidang kecerdasan buatan selama lebih dari 20 tahun, dan banyak teknologi inti berada di tingkat internasional terdepan. Model Besar Spark menggabungkan kemampuan pemahaman bahasa dan kemampuan ekspresi umum model besar dengan plug-in pencarian, yang secara efektif memecahkan masalah industri seperti kesulitan memperbarui pengetahuan baru dan fakta bahwa pertanyaan dan jawaban fakta mudah untuk "membuat perbedaan".

Karena biaya pelatihan model besar yang sangat tinggi, pengembang biasa dan perusahaan kecil dan menengah tidak memiliki cara untuk memulai. Hal ini juga dapat dilihat dari hasil laporan: pabrik lain juga bekerja keras, tetapi masa depan panjang. Singkatnya, mungkin hanya ada sedikit kesempatan untuk makan di meja.

Kemana perginya model besar di masa depan?

Pada konferensi WAIC belum lama ini, para pemain yang memasuki model besar telah menarik poin-poin penting: pertama selesaikan masalah teknis, lalu implementasikan adegan, dan akhirnya wujudkan bisnis dan skala.

Saat ini, kami telah melihat bahwa model besar mulai terintegrasi secara mendalam dengan skenario dan industri.Misalnya, model besar di bidang seperti pembuatan kode dan prediksi struktur protein telah memverifikasi bahwa model besar tidak hanya diterapkan di perusahaan teknologi, tetapi juga telah mengambil langkah ke semua lapisan masyarakat.

Model skala besar domestik dengan cepat melompati tahap stok konsep skala besar, dan model skala besar AI telah berkembang dari persaingan parameter menjadi persaingan aplikasi.

Misalnya, model besar Pangu Huawei telah diimplementasikan di bidang-bidang seperti meteorologi, penelitian dan pengembangan medis, tenaga listrik, dan bahasa, dan telah menghadirkan beberapa model besar dengan ratusan miliar parameter. Kemampuan model industri skala besar Tencent Cloud akan diterapkan pada skenario seperti kontrol risiko keuangan, terjemahan interaktif, dan layanan pelanggan cerdas digital, yang meningkatkan efisiensi aplikasi cerdas, dan layanan MaaS satu atap mengurangi beban perusahaan.

Khusus untuk skenario aplikasi, mengambil bidang keuangan sebagai contoh, model industri skala besar dapat mendukung solusi pengendalian risiko keuangan, yang memiliki peningkatan efisiensi 10 kali lipat dibandingkan sebelumnya.

Model skala besar menggabungkan akumulasi pengalaman anti-penipuan selama bertahun-tahun dan ribuan skenario bisnis nyata Dibandingkan dengan model tradisional, efek anti-penipuan secara keseluruhan telah meningkat sekitar 20%. Perusahaan dapat mengulangi kemampuan pengendalian risiko berdasarkan model, mulai dari pengumpulan sampel, pelatihan model hingga penerapan dan peluncuran, untuk mencapai nol partisipasi manual dalam keseluruhan proses, dan waktu pemodelan dikurangi dari 2 minggu menjadi hanya 2 hari.

Bahkan dengan akumulasi sampel terbatas, konstruksi cepat dapat diselesaikan dan proses "mulai dingin" dapat dilewati.

Cara mendarat dan mengkomersialkan menjadi fokus pabrikan.

Ini berarti bahwa AI telah memasuki tahap implementasi industri skala besar yang dapat ditiru, dan hasil yang baik hanya dapat dicapai dengan menggunakan pembelajaran sampel kecil atau nol sampel hilir, sehingga mengurangi biaya pengembangan AI. Setelah model besar Baidu Wenxin ditingkatkan, biaya berhasil dikurangi menjadi 10% dari sebelumnya.

Industri apa pun pada akhirnya akan membentuk oligopoli, tidak terkecuali model besar.

Dalam beberapa bulan terakhir, sejumlah besar model skala besar baru telah muncul.Apakah itu keinginan gila untuk merebut peluang dan takut tertinggal, atau tata letak trek jangka panjang dan penelitian khusus, setiap pemain hanya mengetahuinya dengan baik.

Huru-hara seratus model hanya akan menjadi fenomena bertahap, dan hasil akhirnya masih terkonsentrasi pada sejumlah kecil model besar. Alasannya tidak lain adalah sebagai berikut:

Pertama, dalam proses evolusi, berbagai perusahaan dan institusi secara bertahap menemukan posisinya sendiri, secara bertahap bergerak menuju subdivisi, dan akhirnya dimasukkan ke dalam model skala besar yang lebih lengkap.

Kedua, dibutuhkan akumulasi bertahun-tahun. Model skala besar yang benar-benar dibangun dari bawah sangat mahal, membutuhkan kemampuan yang sangat komprehensif, dan harus memiliki mentalitas jangka panjang yang absolut, yang berarti bahwa pemain tanpa kekuatan ekonomi absolut akan tertinggal di tengah jalan atau "mati" di jalan menuju cahaya.

Yang ketiga adalah banyak ruang untuk imajinasi di masa depan model besar di tingkat aplikasi. Dengan asumsi bahwa setiap industri memiliki ruang besar untuk pengembangan, teknologi AI baru dapat digunakan untuk meningkatkan efisiensi, dan nilai di tingkat aplikasi pasti akan dialihkan.Mengandalkan beberapa model kepala besar akan memiliki ekologi aplikasi yang sangat luas.

Tidak dapat disangkal bahwa di masa depan semua perusahaan akan sangat bergantung pada model besar, dan semua produk akan dikembangkan berdasarkan model besar.

Tingkat penetrasi industri dan pangsa pasar telah menjadi elemen tantangan terpenting bagi model perusahaan besar untuk menjadi oligopoli.

Lihat Asli

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

Hadiah
suka
Komentar
Bagikan

Komentar

0/400

Tidak ada komentar

Topik
BTC Hits New High
64k Popularitas
ETH Breaks $3,000
21k Popularitas
VIP Exclusive Airdrop Carnival
6k Popularitas
4Pump.Fun Debuts on Gate
4k Popularitas
5Fed June Meeting Minutes
4k Popularitas
6Join Gate VIP to Win MacBook
29k Popularitas
7Trump Tariff Hikes
16k Popularitas
8Gate xStocks Trading Share
22k Popularitas
9HK Stablecoin Rules
12k Popularitas
10Truth Social Crypto ETF
2k Popularitas

Sematkan

peta situs