Baichuan VS Zhipu, siapa OpenAI China?

Question

*Sumber artikel: Light Cone Intelligence**Teks: Hao Xin**Editor: Liu Yuqi*Pada awal Juni, media asing mengeluarkan siksaan "siapa OpenAI China", dan setelah mengalami gelombang kewirausahaan model besar, ombak besar bergegas ke pasir, dan hanya beberapa orang yang tersisa pada akhirnya.Gedung Xaar, beberapa persimpangan di luar Universitas Tsinghua, adalah Intelijen Baichuan dari pengusaha bintang Wang Xiaochuan, dan Gedung Jaringan Sohu adalah AI spektrum kebijaksanaan yang dikirim oleh akademi. Setelah melalui ujian pasar, mereka menjadi dua kandidat yang paling menjanjikan.Pertempuran untuk dua bangunan tampaknya telah dimulai dengan tenang.** Dari perspektif pembiayaan, Zhipu AI dan Baichuan Intelligent telah menyelesaikan beberapa putaran pembiayaan skala besar tahun ini. **![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-7e2e2823fa-dd1a6f-69ad2a) (Light Cone Intelligent Mapping: Diatur sesuai dengan informasi publik)Tahun ini, jumlah total pembiayaan kumulatif Zhipu AI melebihi 2,5 miliar yuan, dan jumlah total pembiayaan Baichuan Intelligent mencapai 350 juta dolar AS (sekitar 2,3 miliar yuan). Menurut informasi publik, penilaian terbaru **Zhipu AI telah melampaui 10 miliar yuan, tertinggi atau 15 miliar, yang merupakan salah satu perusahaan domestik tercepat dengan penilaian lebih dari 10 miliar yuan; **Setelah putaran pembiayaan terbaru, Baichuan Intelligent telah bernilai lebih dari 1 miliar dolar AS (sekitar 6,6 miliar yuan).Dari perspektif komposisi tim, Zhipu AI dan Baichuan Intelligent Master keluar dari rumah yang sama, dan Wang Shaolan, presiden Zhipu AI, dan Wang Xiaochuan, pendiri Sogou, keduanya adalah tim wirausaha dari Departemen Tsinghua.** Dari perspektif kecepatan mengejar ketinggalan teknologi, keduanya juga tidak dapat dibedakan. GLM-130B Zhipu AI mengalahkan GPT-3 segera setelah keluar, dan Baichuan 2 yang baru dirilis berada di depan Llama 2 dalam semua dimensi, memelopori pengembangan ekosistem open source China.Semua indikasi menunjukkan bahwa Zhipu AI dan Baichuan Intelligence telah menjadi "kuda hitam" dari trek model besar China, dan di bawah persaingan sengit, siapa rusa yang mati?  ## **Orang Percaya pada OpenAI: AI Kebijaksanaan**  Hubungan antara Zhipu AI dan OpenAI dapat ditelusuri kembali ke tahun 2020, yang dianggap oleh Zhang Peng, CEO Zhipu AI, sebagai "tahun pertama model bahasa besar AI" yang sebenarnya di dalam hatinya.Hubungan antara Zhipu AI dan OpenAI dapat ditelusuri kembali ke tahun 2020, yang dianggap oleh Zhang Peng, CEO Zhipu AI, sebagai "tahun pertama model bahasa besar AI" yang sebenarnya di dalam hatinya.Pada hari jadi Zhipu AI, dalam suasana yang menyenangkan, Anda dapat mencium kecemasan yang ditimbulkan oleh kelahiran GPT-3 dari waktu ke waktu. GPT-3, yang mencapai 175 miliar parameter, adalah model bahasa besar pertama dalam arti sempit.Pada saat itu, Zhang Peng tidak hanya terkejut dengan kemampuan kemunculan GPT-3, tetapi juga jatuh ke dalam pemikiran "apakah akan mengikuti", apakah dulu atau sekarang, semua ke arah model besar parameter skala ultra-besar adalah hal yang sangat berisiko. Setelah mempertimbangkan, Zhipu AI memutuskan untuk mengambil OpenAI sebagai tolok ukurnya dan berinvestasi dalam pengembangan model pra-pelatihan skala ultra-besar.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-e41f17dbae-dd1a6f-69ad2a) (Light Cone Intelligent Mapping: Diatur sesuai dengan informasi publik)**Dalam hal pemilihan jalur teknologi, Zhipu AI memiliki pemikiran independen yang sama dengan OpenAI. **Pada saat itu, ada beberapa kerangka kerja pra-pelatihan model besar seperti BERT, GPT dan T5. Ketiga jalur tersebut memiliki kelebihan dan kekurangan masing-masing dalam hal target pelatihan, struktur model, sumber data pelatihan, dan ukuran model.Jika proses pelatihan model besar dibandingkan dengan ujian bahasa Inggris, BERT pandai mengerjakan pertanyaan melalui hubungan antara kata dan kalimat, dan mengikuti ujian melalui pemahaman, dan materi ulasannya terutama berasal dari buku teks dan Wikipedia; GPT pandai memprediksi kata berikutnya untuk mengerjakan pertanyaan, mempersiapkan ujian melalui banyak latihan menulis, dan materi ulasannya terutama berasal dari berbagai halaman web; T5 mengadopsi strategi memformalkan pertanyaan, pertama-tama menerjemahkan pertanyaan ke dalam bahasa Cina dan kemudian menyelesaikan pertanyaan, dan ketika meninjau, tidak hanya membaca buku teks, tetapi juga menyikat sejumlah besar bank soal.Seperti yang kita semua tahu, Google memilih BERT, OpenAI memilih GPT, dan Zhipu AI tidak mengikuti secara membabi buta, ** berdasarkan dua rute ini diusulkan kerangka algoritma GLM (General Language Model). Kerangka kerja ini sebenarnya menyadari kelebihan dan kekurangan BERT dan GPT yang saling melengkapi, "yang dapat dipahami sambil melanjutkan dan mengisi kekosongan". **GLM dengan demikian telah menjadi kepercayaan terbesar bagi Zhipu AI untuk mengejar OpenAI, dan di bawah kerangka kerja ini, model seri GLM seperti GLM-130B, ChatGLM-6B, dan ChatGLM2-6B telah tumbuh secara berturut-turut. Data eksperimental menunjukkan bahwa model besar seri GLM lebih unggul daripada GPT dalam hal akurasi pemahaman bahasa, kecepatan inferensi, proporsi memori, dan aplikasi adaptasi model besar.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-dc70c8e5d7-dd1a6f-69ad2a) (Sumber: Internet)OpenAI saat ini adalah institusi terlengkap yang dapat menyediakan layanan model dasar di luar negeri, dan komersialisasinya terutama dibagi menjadi dua kategori, satu adalah biaya pengumpulan API, dan yang lainnya adalah biaya berlangganan ChatGPT. Dalam hal komersialisasi, Zhipu AI juga mengikuti gagasan umum dan berada di eselon perusahaan dengan komersialisasi model besar domestik yang relatif matang.Menurut sisir cerdas kerucut optik, dikombinasikan dengan pendaratan perusahaan Cina, model bisnis **Zhipu AI dibagi menjadi biaya pengumpulan API dan mode biaya privatisasi. **Jenis keseluruhan model yang disediakan adalah model besar bahasa, model besar super-antropomorfik, model besar vektor dan model besar kode, dan di bawah setiap opsi model besar, termasuk harga standar, harga pribadi cloud, dan harga pribadi lokal. Dibandingkan dengan OpenAI, Zhapu AI tidak memiliki penyediaan layanan model besar suara dan gambar, tetapi menambahkan model besar super-antropomorfik, yang juga memenuhi kebutuhan manusia digital China, NPC cerdas, dan industri lainnya.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-d5dc94c153-dd1a6f-69ad2a) (Light Cone Intelligent Mapping: Diatur sesuai dengan informasi publik)Light Cone Intelligence belajar dari pengembang bahwa "saat ini, karakteristik platform Baidu Wenxin Qianfan sempurna, karakteristik Tongyi Qianwen fleksibel, dan Zhipu AI adalah salah satu perusahaan dengan biaya API termurah di antara produsen utama di pasar."Biaya untuk ChaGLM-Pro adalah 0,01 yuan / seribu token, dan 18 yuan diberikan, dan biaya ChaGLM-Lite dikurangi menjadi 0,002 yuan / seribu token. Sebagai referensi, OpenAI GPT-3.5 mengenakan biaya 0,014 yuan / seribu token, Ali Tongyi Qianwen-turbo mengenakan biaya 0,012 yuan / seribu token, dan Baidu Wenxin One Word emie-bot-turbo mengenakan biaya 0,008 yuan / seribu token.Seperti yang dikatakan Zhang Peng, Zhipu AI juga sedang melalui tahap baru "tidak lagi mengikuti OpenAI" dengan OpenAI sebagai tujuannya.Dalam hal bisnis produk, tidak seperti OpenAI, yang hanya berfokus pada peningkatan dan pembangunan ChatGPT, Zhipu AI telah memilih untuk menyerang di tiga sisi.Menurut situs resminya, bisnis Zhipu AI saat ini terutama dibagi menjadi tiga blok, yaitu platform MaaS model besar, platform kecerdasan teknologi AMiner dan manusia digital kognitif. Akibatnya, tiga matriks produk AI utama telah terbentuk, produk model besar, produk AMiner dan produk manusia digital. Diantaranya, produk model besar tidak hanya mencakup robot dialog dasar, tetapi juga pemrograman, penulisan, pengecatan divisi robot liontin.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-0bf9c101e1-dd1a6f-69ad2a) (Sumber: Zhipu AI official website)Pada saat yang sama, Zhipu AI terus mengeksplorasi sisi aplikasi melalui investasi. Hingga saat ini, Zhipu AI telah berinvestasi di Lingxin Intelligence dan Painting Wall Intelligence, dan meningkatkan kepemilikannya atas Lingxin Intelligent lagi pada bulan September tahun ini.Lingxin Intelligence juga diinkubasi dari Departemen Ilmu Komputer Universitas Tsinghua, meskipun departemennya homolog, tetapi Lingxin Intelligence lebih cenderung ke aplikasi, dan komunitas interaktif minat AiU yang dikembangkan olehnya adalah model besar super-antropomorfik berdasarkan Zhipu AI. Ide pengembangan produknya mirip dengan AI Karakter asing, dengan menciptakan karakter AI dengan kepribadian dan karakter yang berbeda, berinteraksi dan mengobrol dengan mereka, lebih condong ke aplikasi C-end dan menekankan atribut hiburan.  ## ** Pindah dari OpenAI ke LIama: Baichuan Intelligence **  Light Cone Intelligence menemukan bahwa dibandingkan dengan OpenAI, Baichuan Intelligence lebih seperti Llama.**Pertama-tama, berdasarkan teknologi dan pengalaman asli, kecepatan rilis dan iterasi sangat cepat. **Setengah tahun setelah didirikan, Baichuan Intelligent telah berturut-turut merilis empat model komersial open source baichuan-7B / 13B, Baichuan2-7B / 13B dan dua model besar sumber tertutup Baichuan-53B dan Baichuan2-53B. Pada pembukaan antarmuka API Baichuan2-53B pada 25 September, dalam 168 hari terakhir, Baichuan Intelligent telah merilis model besar dengan kecepatan rata-rata bulan.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-e27cb1a5a0-dd1a6f-69ad2a) (Light Cone Intelligent Mapping: Diatur sesuai dengan informasi publik)Meta mengandalkan LLama2 untuk memenangkan kembali posisi AI, dan Baichuan Intelligent terkenal karena mengalahkan LLama2 dengan seri model open source Baichuan2.Menurut hasil pengujian, Baichuan2-7B-Base dan Baichuan2-13B-Base lebih unggul dari LLaMA2 dalam beberapa tolok ukur evaluasi otoritatif seperti MMLU, CMMLU, GSM8K, dll., Dan kinerjanya juga sangat cerah dibandingkan dengan model lain dengan jumlah besar parameter yang sama, dan kinerjanya secara signifikan lebih baik daripada pesaing LLaMA2 dan model lain dengan ukuran yang sama.Fakta telah membuktikan bahwa model besar cerdas Baichuan memang telah teruji. Menurut data resmi, Baichuan telah diunduh lebih dari 5 juta kali di komunitas open source dan lebih dari 3 juta kali sebulan.Light Cone Intelligent menemukan bahwa model seri cerdas Baichuan memiliki jumlah unduhan tertinggi di komunitas open source Hugging Face lebih dari 110.000, yang masih kompetitif di antara model open source Cina dan asing.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-d6975a90e4-dd1a6f-69ad2a) (Sumber: situs resmi Hugging Face)Alasan mengapa open source-nya memiliki keunggulan juga terkait dengan kompatibilitasnya yang kuat, Baichuan Intelligent telah memperkenalkan di depan umum bahwa seluruh struktur dasar modelnya yang besar lebih dekat dengan struktur LLAMA Meta, sehingga sangat ramah bagi perusahaan dan produsen dari desain open source.** "Setelah open source, ekologi akan dibangun di sekitar LLaMA, dan ada banyak proyek open source di luar negeri yang mengikuti LLaMA untuk mempromosikan, itulah sebabnya struktur kami lebih dekat dengan LLaMA." Kata Wang Xiaochuan.Menurut kecerdasan kerucut optik, Baichuan Intelligent mengadopsi hot-pluggable dalam desain arsitektur, yang dapat mendukung peralihan acak antara modul yang berbeda dari model Baichuan dan model LLAMA dan model Baichuan, seperti melatih model dengan LLAMA, tanpa modifikasi, model dapat langsung dimasukkan ke Baichuan untuk digunakan. Ini juga menjelaskan mengapa sebagian besar produsen Internet sekarang menggunakan model Baichuan, dan vendor cloud memperkenalkan model seri Baichuan.Jalan yang telah dilalui sejarah mengarah ke masa lalu dan masa depan, dan kewirausahaan model besar Wang Xiaochuan seperti ini.Berdasarkan identitas pendiri Sogou dan pengalaman teknologi pencarian, pada masa-masa awal kewirausahaan, Wang Xiaochuan menerima evaluasi banyak orang, "Xiaochuan, adalah yang paling cocok untuk model besar."** Membangun model besar dalam pengalaman pencarian dan kerangka kerja telah menjadi warna latar belakang Baichuan Intelligence. **Chen Weipeng, salah satu pendiri Baichuan Intelligent Technology, pernah berkata bahwa R&D pencarian memiliki banyak kesamaan dengan pengembangan model besar, "Baichuan Intelligent dengan cepat mentransfer pengalaman pencarian ke penelitian dan pengembangan model besar, yang mirip dengan proyek sistematis 'pembangunan roket', membongkar sistem yang kompleks, mempromosikan kolaborasi tim dan meningkatkan efektivitas tim melalui evaluasi proses. "Wang Xiaochuan juga berbicara pada konferensi pers: "Karena Baichuan Intelligence memiliki gen pencarian sebelumnya, ia secara alami tahu bagaimana memilih halaman terbaik dari tengah triliunan halaman web, yang dapat diduplikasi dan anti-sampah." Dalam pemrosesan data, Baichuan Intelligent juga memanfaatkan pengalaman pencarian sebelumnya, dan dapat menyelesaikan pembersihan dan deduplikasi ratusan miliar data dalam satu jam."Inti dari pencarian model besarnya ditampilkan dengan jelas di Baichuan-53B. Dalam menangani masalah "ilusi" model besar, dikombinasikan dengan pengendapan teknologi pencarian, Baichuan Intelligent telah melakukan pengoptimalan dalam akuisisi informasi, peningkatan kualitas data, dan peningkatan pencarian.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-e8c8a50de0-dd1a6f-69ad2a) Dalam hal meningkatkan kualitas data, ide inti Baichuan Intelligent adalah "selalu mengambil yang terbaik", mengklasifikasikan data dengan kualitas rendah dan kualitas tinggi sebagai standar, dan memastikan bahwa Baichuan2-53B selalu menggunakan data berkualitas tinggi untuk pra-pelatihan; Dalam hal akuisisi informasi, Baichuan2-53B telah meningkatkan beberapa modul, termasuk komponen utama seperti pemahaman maksud instruksi, pencarian cerdas dan peningkatan hasil, melalui pemahaman mendalam tentang instruksi pengguna, secara akurat mendorong pencarian istilah kueri, dan akhirnya menggabungkan teknologi model bahasa besar untuk mengoptimalkan keandalan pembuatan hasil model.Meskipun dimulai dengan open source, Baichuan Intelligent telah mulai mengeksplorasi jalur komersialisasi. Menurut informasi resmi, tujuan Baichuan Intelligence adalah untuk "membangun basis model besar terbaik di China", dan tujuan dari dimensi vertikal adalah untuk meningkatkan pencarian, multi-modalitas, pendidikan, medis, dan bidang lainnya.Komersialisasi hari ini terkonsentrasi di Baichuan2-53B, dan situs web resmi menunjukkan bahwa panggilan API model mengadopsi standar pengisian berbasis waktu. Biaya 0:00-8:00 0,01 yuan / ribu token, biaya 8:00-24:00 0,02 yuan / seribu token, sebagai perbandingan, harga biaya siang hari lebih tinggi dari malam.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-4543fd2d4b-dd1a6f-69ad2a) (Sumber: situs web resmi Baichuan Intelligent)  ## **Selesai**  Memperdebatkan siapa OpenAI China tidak masuk akal pada hari-hari awal pengembangan model besar. Banyak startup seperti Zhipu AI dan Baichuan Intelligent telah menyadari bahwa mengikuti jejak OpenAI secara membabi buta tidak disarankan, misalnya, Zhipu AI telah mengklarifikasi jalur teknis "tidak melakukan GPT Cina". Selain itu, pada saat open source menjadi populer dan membentuk pengepungan, keunggulan teknologi absolut OpenAI tampaknya tidak dapat dipecahkan.Zhipu AI, Baichuan Intelligent telah menyebutkan bahwa aplikasi super adalah pasar yang lebih luas, tetapi juga zona nyaman perusahaan model besar China, tidak lagi tinggal di tempatnya, misalnya, seseorang yang dekat dengan Zhipu AI pernah menyampaikan berita kepada media, tim Zhipu AI telah dengan tegas menentukan rute 2B, yang bertujuan untuk pasar informasi dan inovasi, dan dalam 5 bulan, dengan cepat memperluas tim, dari 200 menjadi 500 orang, untuk tenaga cadangan bisnis 2B berikutnya.Di jalur komersialisasi, Baichuan Intelligent telah memilih untuk merujuk pada ekologi open source Llama2, dan juga mulai mengulangi langkah-langkah kecil.Dapat dilihat dengan mata telanjang bahwa hanya dalam waktu setengah tahun, Baichuan Intelligent dan Zhipu AI telah melalui teknologi tanah tak bertuan dan sampai pada tahap komersialisasi untuk pendaratan industri. Dibandingkan dengan ledakan kewirausahaan AI 1.0, periode pemolesan teknologi selama 3 tahun (2016-2019), dan justru karena hambatan dalam pendaratan komersial, sejumlah besar perusahaan AI secara kolektif akan menurun pada tahun 2022 dan jatuh sebelum fajar.Belajar dari pelajaran tahap sebelumnya, tetapi juga karena fleksibilitas teknologi model besar lebih nyaman untuk mendarat, startup yang diwakili oleh Baichuan Intelligence dan Zhipu AI mengumpulkan pasukan dan kuda untuk mempersiapkan teknologi, produk, dan cadangan bakat untuk tahap berikutnya.Namun, suara tembakan pertama hanya terdengar di maraton, dan masih terlalu dini untuk mengatakan bahwa hasilnya terlalu dini. Tapi setidaknya tahap pertama trek telah terurai, dan setelah tujuannya jelas, persaingan bahkan lebih sabar dan ketekunan. Ini sama untuk Baichuan Intelligence, Zhipu AI atau OpenAI.