Model besar bukan hewan peliharaan raksasa

Sumber artikel: Tiger Sniff

Penulis: Creek

Sumber gambar: Dihasilkan oleh Unbounded AI

Perang 100 model semakin intensif, tetapi banyak praktisi memiliki lebih banyak pertanyaan tentang model besar.

Di bidang model besar dasar, Tencent, Alibaba, Baidu dan raksasa Internet lainnya telah mengalir, dan Alibaba, Baidu, iFLYTEK dan produsen besar lainnya telah berturut-turut merilis versi terbaru dari produk model besar dalam sebulan terakhir, dan kemampuan teknis mereka juga telah sangat ditingkatkan; Startup mengulangi versi baru pada saat yang sama, tetapi juga pembiayaan "gila", Zhipu AI baru-baru ini mengumumkan bahwa tahun ini telah menerima total 2,5 miliar yuan dalam pembiayaan, didirikan hampir setengah tahun Baichuan Intelligence telah menerima 350 juta dolar AS dalam pembiayaan, di antara investor startup ini, ada juga Tencent, Alibaba, Meituan dan raksasa Internet lainnya.

Apakah China benar-benar membutuhkan begitu banyak model dasar? Semua perusahaan model besar dasar tergila-gila pada parameter teknis "bergulir", tetapi model besar seperti apa yang dibutuhkan pasar? Dalam situasi pertempuran yang hidup dan kacau, pertanyaan-pertanyaan ini diajukan oleh semakin banyak orang.

Untuk menjawab pertanyaan ini, pertama-tama kita harus memahami bagaimana model besar dasar menghasilkan uang di pasar Cina. Meskipun sebagian besar persepsi orang tentang model besar adalah chatbot, dan banyak pengguna mulai menggunakan produk ini ketika mencari informasi dan mengatur dokumen, sulit bagi perusahaan terkait untuk menghasilkan uang dari produk C-end ini, dan bahkan semakin besar skala pengguna, semakin banyak perusahaan yang merugi. Saat ini, arah yang paling pragmatis untuk komersialisasi model besar dasar masih di sisi-B, melayani perusahaan di bidang ritel, keuangan, manufaktur dan bidang lainnya untuk mengurangi biaya dan meningkatkan efisiensi, untuk memperoleh pendapatan komersial yang stabil. **

Hanya ada tiga jenis kebutuhan untuk model besar dasar: ** Langsung memanggil API model besar untuk mendapatkan kemampuan model besar yang relevan; Berdasarkan model besar, pengembangan sekunder dilakukan sejalan dengan bisnis yang sebenarnya; Kembangkan aplikasi AI berdasarkan model besar. **Persyaratan ini menguji kemampuan teknis platform model besar dasar, dan juga menguji kemampuan layanan perusahaannya.

Dari perspektif kemampuan layanan, startup model skala besar dan raksasa Internet harus memulai dari awal, dan tidak ada yang memiliki keunggulan bawaan. Platform yang dapat memperoleh wawasan lebih cepat tentang kebutuhan pelanggan dan memberikan layanan yang stabil dan andal dapat menonjol.

Model besar tidak "meledak"

Dengan popularitas ChatGPT sebagai titik demarkasi, pengembangan model besar domestik telah mengalami dua hari.

Sebelum ChatGPT menjadi populer, hanya sejumlah kecil perusahaan domestik yang terlibat dalam penelitian dan pengembangan model besar dasar, karena kemampuan teknologi dan layanan model besar belum diterima secara luas oleh pasar, dan perusahaan-perusahaan ini terutama berfokus pada penelitian dan pengembangan teknologi dan akumulasi kemampuan layanan. Ketika ChatGPT menjadi populer, sejumlah besar investor dan praktisi berdatangan, dan model besar menjadi outlet baru.

Pasar panas mudah memunculkan spekulan, yang tidak mempelajari teknologi, tetapi bercerita, konsep hype, terlepas dari kemampuan teknologi dan layanan, pertama-tama menceritakan kisah itu ke langit, dan dengan cara ini mendapatkan pengakuan dari pasar modal dan pelanggan. Seorang praktisi model besar bercanda mengatakan kepada Tiger Sniff bahwa banyak perusahaan model besar di China mengklaim bahwa kesenjangan antara mereka dan GPT-4 hanya beberapa bulan, dan ini karena mereka telah melakukan beberapa pelatihan berdasarkan GPT-2 yang telah open source dan keluar untuk bercerita.

Faktanya, evolusi kemampuan teknis model besar tidak dapat dicapai dengan pelatihan selama beberapa bulan, karena ini adalah sistem yang kompleks, dan sangat penting untuk memiliki skala besar, dan tidak mungkin menghasilkan evolusi yang lebih cerdas tanpa skala tertentu. Namun, meningkatkan skala pelatihan model besar membutuhkan banyak waktu dan debugging berulang. Teknisi yang telah men-debug parameter pelatihan model besar memahami kesulitan ini: tidak ada yang memberi tahu Anda apa yang harus dilakukan, Anda harus mencari tahu sendiri, dan segala macam situasi tak terduga muncul dalam proses yang membutuhkan waktu untuk dipecahkan.

Di Cina, model besar dasar yang benar-benar memiliki kepercayaan pada kemampuan teknis dilatih sebelum ChatGPT menjadi populer, pada saat itu, model besar tidak dikenal semua orang, dan banyak orang tidak mengerti dan tidak optimis tentang model besar, dan perusahaan yang bersikeras berinvestasi dalam model besar sangat yakin dengan teknologi baru.

Misalnya, pada tahun 2020, KLCII meluncurkan proyek penelitian model pra-pelatihan skala besar pertama, Wudao, dan versi 2.0-nya menjadi model tingkat triliun terbesar di dunia. Setelah peningkatan tahun ini, "Wudao" mencakup model besar dasar seperti bahasa, visi, dan multimodalitas, dan telah memasuki tahap open source penuh.

Zhipu AI juga mengembangkan arsitektur pra-pelatihan GLM pada tahun 2020, dan juga melatih model GLM-10B dengan puluhan miliar parameter. Pada tanggal 27 Oktober, Zhipu AI merilis model dialog generasi ketiga yang dikembangkan sendiri ChatGLM3, yang telah sangat meningkatkan kinerja, kemampuan inferensi, dan kapasitas konteksnya dibandingkan dengan generasi sebelumnya. Dibandingkan dengan ChatGLM2, ChatGLM3 menempati peringkat pertama di antara 44 kumpulan data publik Tiongkok dan Inggris di Tiongkok. Diantaranya, MMLU meningkat 36%, C meningkat 33%, GSM8K meningkat 179%, dan BBH meningkat 126%.

Selain itu, dalam hal fungsi, sejumlah model besar yang dikembangkan di dalam negeri (ChatGLM, CodeGeeX, WebGLM, CogVLM, dll.) yang dirilis oleh Zhipu AI juga merupakan model besar seri OpenAI pembandingan terlengkap di Cina, dan berlaku untuk asisten AI generatif "Zhipu Qingyan".

Kelompok perusahaan pertama yang membuat model besar ini pada dasarnya berbeda dari perusahaan yang berspekulasi tentang konsep dan mengejar angin. Ketika teknologi model skala besar belum meledak dan pasar belum begitu fluktuatif, mereka terlibat di dalamnya karena mereka telah menemukan nilai teknis dan logika bisnis dari model skala besar dasar. Perbedaan ini juga sangat jelas setelah popularitas model besar, banyak perusahaan terlibat dalam produk C-end demi lalu lintas dan aktualitas, sedangkan perusahaan paling awal seperti Zhipu AI lebih fokus pada bidang layanan perusahaan, dan semua kemampuan R&D dan kemampuan layanan juga diletakkan di sekitar ide ini, dan mereka terakumulasi dengan cara yang membumi, dan berkembang ke arah menciptakan nilai bagi pelanggan.

** Kompleksitas model besar menentukan bahwa perusahaan yang telah mengumpulkan teknologi dan kemampuan layanan untuk waktu yang lebih lama memiliki keuntungan yang lebih kuat. Ketika semakin banyak orang di pasar menyadari kompleksitas model besar dan waktu yang dibutuhkan untuk evolusi model besar, perusahaan model besar yang mengandalkan penceritaan untuk menggoreng konsep akan memiliki semakin sedikit ruang untuk bertahan hidup, dan perusahaan yang secara serius mengumpulkan teknologi dan kemampuan layanan dapat bertahan dalam ujian gelombang pertama persaingan.

Tidak ada model besar ekologi yang makmur, tidak ada masa depan

** Dalam proses komersialisasi model besar, siapa pun yang dapat mendarat dalam skenario aplikasi yang memiliki kebutuhan masyarakat yang kaku akan menjadi yang pertama membentuk lingkaran hematopoiesis diri yang baik. **

Model besar umum memiliki jangkauan aplikasi yang lebih luas, tetapi tidak cukup khusus untuk memecahkan masalah spesifik dalam domain vertikal. Model besar vertikal memiliki kemampuan yang lebih kuat untuk memecahkan masalah khusus domain, tetapi ruang lingkup layanan sangat terbatas, yang menyulitkan banyak model besar vertikal untuk mencapai keseimbangan antara biaya dan manfaat bisnis, dan ruang pengembangan terbatas.

Poin terakhir dari penerapan model besar adalah untuk digunakan dalam kehidupan dan produksi, untuk memecahkan masalah praktis dalam pekerjaan dan kehidupan, dan untuk meningkatkan efisiensi dan produktivitas kerja. Berdasarkan kelebihan dan kekurangan model umum dan model vertikal saat ini, ide yang lebih tepat dalam proses komersialisasi model saat ini adalah untuk membuka sumber kemampuan teknologi dan layanan untuk ritel, keuangan, manufaktur dan bidang lainnya, dan model umum dan perusahaan di bidang terkait bekerja sama untuk membangun skenario aplikasi. **

Tunduk pada keterbatasan seperti data, daya komputasi, dan skenario, tidak terlalu banyak model besar yang benar-benar dapat dijalankan melalui open source. Pada saat yang sama, sebagai basis teknologi dasar, peran model besar sangat mirip dengan sistem operasi PC dan ponsel, dan akan menghadirkan pola kompetitif "di bawah pohon besar, bukan satu inci rumput", yaitu, satu atau dua basis teknis menempati posisi dominan di industri, dan semua pengembang aplikasi harus berkembang berdasarkan dua basis teknis ini. Jika model alas tidak dapat membentuk ekologi yang berkembang, tidak akan ada kemampuan pembangunan berkelanjutan.

Dilihat dari sejarah perkembangan sistem operasi PC dan ponsel, keunggulan penggerak pertama sangat penting. Ketika Windows mendominasi pasar PC, dan iOS dan Android dibagi menjadi dua dunia di bidang ponsel, sulit bagi sistem operasi lain untuk memiliki ruang untuk perubahan haluan.

Tren yang sama juga diamati di bidang model besar. Model besar akan membuka ekosistem aplikasi AI yang makmur, dan data, kemampuan, atau aplikasi pribadi dan perusahaan dapat dengan cepat menjadi plug-in AI, meningkatkan kemampuan model besar dan membuat model besar lebih praktis dan mudah digunakan.

Saat ini, Baidu, iFLYTEK dan perusahaan raksasa lainnya telah berkomitmen untuk konstruksi ekologis, platform model besar awan cerdas Baidu Qianfan 2.0 perusahaan aktif bulanan hampir 10.000, mencakup lebih dari 400 skenario di bidang keuangan, pendidikan, manufaktur, energi, urusan pemerintahan, transportasi dan industri lainnya, skala pengembang platform model besar Spark iFLYTEK telah melampaui 700.000.

Beberapa startup yang telah mengumpulkan waktu lama di bidang model besar juga yang pertama makan kepiting. Saat ini, Zhipu AI memiliki lebih dari 1.000 pelanggan dan lebih dari 100 mitra untuk membangun ekosistem, yang mencakup berbagai skenario seperti media, SaaS, pendidikan, dan kantor. Misalnya, di balik kemampuan pembuatan dokumen cerdas WPS dari konten presentasi dan penulisan siaran pers, ada kemampuan teknis Zhipu AI sebagai pendukung.

Dalam persaingan ekologis berbagai platform model skala besar, ujian terpenting dari platform ini adalah nilai yang dibawanya kepada mitra dan kemampuan untuk tumbuh bersama dengan mitra. Sejauh menyangkut skenario kantor, pembuatan konten presentasi, penulisan konten artikel, dan penulisan ulang gaya memiliki persyaratan yang sangat tinggi untuk akurasi dan kemampuan penalaran platform model besar, dan hanya model besar yang telah mencapai tingkat teknis tertentu yang dapat memiliki kemampuan untuk mendukung aplikasi ini, dan platform model besar juga perlu memperbaiki kesalahan dan iterasi sesuai dengan umpan balik pengguna dalam aplikasi aktual.

**Apakah itu perusahaan raksasa atau perusahaan pemula, tidak peduli seberapa kuat modal dan kekuatan sumber dayanya, perlu untuk mengumpulkan dan mengulangi langkah demi langkah dari awal. Oleh karena itu, dalam proses membangun ekosistem untuk platform model besar, keuntungan waktu sangat penting. Ini juga alasan mengapa start-up dengan keunggulan penggerak pertama dan raksasa Internet dengan sumber daya keuangan yang lebih kuat dapat bersaing secara setara.

**100 model perang, siapa yang lebih cocok untuk pasar Cina? **

Meskipun situasi pertempuran perang 100 model hidup dan kacau, arah persaingan di belakangnya sangat jelas, dan kemampuan teknis dan layanan serta kemampuan platform model besar untuk membangun ekosistem secara langsung menentukan arah persaingan.

Pembangunan kemampuan ini membutuhkan waktu untuk menumpuk, dan sulit untuk mencapainya dalam semalam, tetapi tidak cukup untuk mengumpulkannya dari waktu ke waktu. Keuntungan penggerak pertama, selain perbedaan waktu yang dibawa oleh tindakan awal, juga memiliki kemampuan untuk secara akurat memahami permintaan pasar, yaitu, untuk bertindak tegas dan cepat di sepanjang strategi yang benar, ayunan strategis dan jalan memutar dapat dengan mudah menghabiskan semua keuntungan waktu yang diakumulasikan oleh tindakan awal.

Ketika semakin banyak platform model besar telah mengalihkan fokus mereka ke konstruksi ekologis, penentuan strategis dan pelaksanaan platform akan menjadi semakin penting dalam persaingan ekologis. ** Ketika beberapa platform menyelesaikan perubahan kualitatif ke platform super, lanskap kompetitif pada dasarnya ditentukan.

Di pasar domestik yang besar dan kompleks, perusahaan jasa B-end rentan terhadap ayunan dan jalan memutar yang strategis. Di satu sisi, wilayah dan skala bisnis perusahaan di pasar domestik berbeda, dan persepsi nilai model besar untuk kecerdasan perusahaan sangat berbeda, dan sumber daya serta biaya yang ingin mereka investasikan juga berbeda, sehingga sulit untuk menemukan solusi standar; Di sisi lain, perusahaan di bidang yang berbeda memiliki kebutuhan yang berbeda untuk kemampuan model besar, dan bahkan perusahaan yang berbeda di bidang yang sama memiliki kebutuhan yang berbeda untuk model besar.

Dalam lingkungan seperti itu, dibandingkan dengan rencana komersialisasi OpenAI, komersialisasi platform model skala besar domestik membutuhkan lebih banyak perhatian terhadap detail. Kami melihat tren seperti itu dalam ide komersialisasi beberapa platform.

Misalnya, selain layanan API platform terbuka umum, Zhipu AI juga menyediakan dua solusi: privatisasi cloud dan privatisasi lokal. ** Privatisasi cloud dapat membantu perusahaan membangun model besar mereka sendiri berdasarkan data pribadi dengan keamanan yang lebih kuat, sementara privatisasi lokal adalah solusi unik di pasar Cina, selain menyediakan model yang lebih kuat, ia juga menyediakan matriks model lengkap untuk memenuhi berbagai skenario dan kebutuhan. **

Menanggapi kebutuhan pelanggan yang berbeda seperti pembuatan artikel, layanan pelanggan cerdas, dan anotasi data, serta skala perusahaan besar, menengah, dan kecil, Zhipu AI memberikan solusi berbeda, yang dapat digabungkan dengan bebas oleh pelanggan sesuai dengan kebutuhan mereka sendiri. Model layanan yang lebih rinci dan fleksibel ini juga didasarkan pada wawasan akurat jangka panjang ke pasar Cina.

Dalam menghadapi ketidakpastian lingkungan eksternal, Zhipu AI juga telah meluncurkan rencana adaptasi chip domestik, bekerja sama dengan produsen perangkat keras dalam negeri dan produsen chip untuk memberikan tingkat sertifikasi dan pengujian yang berbeda untuk berbagai jenis pengguna dan berbagai jenis chip, sehingga dapat membuat layanan model besar lebih aman dan andal. Saat ini, seri ChatGLM telah mendukung lebih dari 10 jenis ekosistem perangkat keras domestik, termasuk Ascend, Shenwei Supercomputer, Haiguang DCU, Haifeike, Muxi Xiyun, Computing Technology, Tiantian Zhixin, Cambrian, Moore Threads, Baidu Kunlun Core, Lingxi Technology, Great Wall Chaoyun, dan model uji akhir ponsel yang dapat digunakan secara bersamaan ChatGLM3-1.5B dan dukungan 3B Xiaomi, vivo, Samsung dan ponsel serta platform kendaraan lainnya.

Semakin sengit pertempuran dalam perang model 100, semakin penting detail yang tampaknya tidak mencolok ini, karena detail ini menentukan tingkat pengakuan mitra eksternal, dan juga mempengaruhi kecepatan pendaratan model besar dalam skenario yang berbeda. Ambang batas untuk hanya merilis model besar tidak setinggi yang dibayangkan pasar, tetapi dimungkinkan untuk memiliki skenario data berkualitas tinggi untuk terus mengulangi dan membentuk hambatan kompetitif, dan kunci skenario data berkualitas tinggi terletak pada mitra eksternal - platform yang lebih banyak mitra bersedia untuk memilih membuatnya lebih mudah untuk dijalankan melalui siklus bisnis ini.

Dalam kompetisi ini, banyak praktisi percaya bahwa pemenangnya haruslah perusahaan raksasa dengan sumber daya dan kemampuan finansial yang lebih kuat, tetapi sebenarnya tidak. Startup dan raksasa sama-sama perlu menjalankan trik dan sampai ke bagian bawah detail, dan tidak ada jalan pintas. Adapun pendanaan, itu bukan akar dari pertempuran yang menentukan, karena startup dengan daya saing inti tidak akan kekurangan uang - bahkan jika Zhipu AI telah menerima jumlah pembiayaan tertinggi dari startup model skala besar, ada lebih banyak investor baru yang ingin memasuki permainan.

Jika Anda memikirkannya dari sudut lain, pada kenyataannya, pasar modal sudah memilih dengan kakinya tentang siapa yang lebih cocok untuk model alas perusahaan Cina.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)