Setelah lebih dari 200 hari kewirausahaan skala besar, mentalitas penjelajah China telah berubah dari kegembiraan yang ideal menjadi kenyataan.
Sebelumnya, selain perusahaan itu sendiri, kewirausahaan model AI diberkahi dengan lebih banyak makna seperti sentimen nasional dan tren zaman Menghadapi munculnya model tujuan umum ChatGPT, pengusaha China dengan cepat mencapai konsensus tentang cara membangun OpenAI dan ChatGPT versi China.
Tidak diragukan lagi bahwa ChatGPT adalah pemain top dunia tahun ini. Karena itu, lalu lintas situs web OpenAI melebihi 1,8 miliar pada bulan April, menempati peringkat 20 teratas dalam peringkat lalu lintas global. Namun, menurut data yang dirilis oleh perusahaan analisis web, Similarweb, setelah enam bulan mengalami pertumbuhan pesat, kunjungan ChatGPT mengalami pertumbuhan negatif untuk pertama kalinya, dan kunjungan di bulan Juni turun sebesar 9,7% dari bulan sebelumnya.
Penurunan lalu lintas ChatGPT yang tiba-tiba telah memicu kekhawatiran dan diskusi di komunitas teknologi global tentang risiko gelembung di industri AI.Majalah The Economist bahkan membuat kesimpulan bahwa "jalan menuju AI yang lebih besar dan lebih baik tidak lagi dapat dilakukan". Ide untuk menjadi "ChatGPT versi China" juga menjauh dari lingkaran wirausaha China.
Zhu Xiaohu, mitra pendiri GSR, menulis di Moments: "Jangan percaya takhayul tentang model umum, karena tahun depan GPT-3.5 akan menjadi komoditas (infrastruktur umum), dan tiga tahun kemudian, GPT-4 juga akan menjadi. Bagi kebanyakan pengusaha, pemandangan adalah prioritas, dan data adalah raja!"
Bersamaan dengan perubahan mentalitas para praktisi, pasar kewirausahaan skala besar mulai terpecah.
Perusahaan model skala besar China tidak lagi terobsesi dengan tujuan ideal "menjadi OpenAI China", juga tidak terobsesi dengan mengejar model parametrik dan kekuatan komputasi. Mereka memiliki jawaban yang lebih pragmatis dan lebih memperhatikan penyelesaian masalah dalam skenario industri aktual.
Persaingan model besar AI telah mengantarkan simpul lintasan baru.
Pragmatisme Kolektif
Di awal tahun ini, Liang Jianzhang, pendiri dan ketua dewan direksi Ctrip, mulai menghubungi ChatGPT. Dalam beberapa tahun terakhir, dia telah aktif di lingkungan akademik dan bisnis sebagai ahli demografi, tetapi dia juga programmer paling awal dan termuda di China, dan dia hampir menjadi Ph.D. dalam kecerdasan buatan.
Pada usia 13 tahun, Liang Jianzhang merancang program untuk menulis puisi metrik dan memenangkan penghargaan nasional. Pada usia 15 tahun, ia diterima di kelas junior Universitas Fudan. Setelah lulus, ia pergi ke Amerika Serikat untuk belajar dan memperoleh gelar master dalam ilmu komputer dari Institut Teknologi Georgia pada usia 21 tahun. Pada usia 22 tahun, Liang Jianzhang, yang sedang belajar untuk mendapatkan gelar Ph.D., tiba-tiba menyadari keterbatasan pengetahuan teoretis, dan memilih melepaskan gelar Ph.D-nya untuk bergabung dengan Oracle di Amerika Serikat.
Munculnya ChatGPT membuat Liang Jianzhang senang bahwa dia tidak melanjutkan studi untuk gelar doktor dalam kecerdasan buatan, karena "Semua algoritme pemrosesan bahasa alami ini benar-benar dikalahkan olehnya (ChatGPT)". Dia ingat bahwa ketika pertama kali berhubungan dengan ChatGPT, dia "sangat, sangat terkejut", dan perasaan kedua adalah kerendahan hati, "Algoritme paling cerdas yang akhirnya kami buat sangat dekat dengan struktur biologis otak manusia."
Liang Jianzhang mulai memikirkan kombinasi model besar AI dan bisnis Ctrip.
Dalam pandangan Liang Jianzhang, di bawah latar belakang masyarakat cerdas, pariwisata, sebagai "industri permintaan spiritual yang sulit diotomatisasi", permintaannya akan meningkat dengan peningkatan kemakmuran sosial secara keseluruhan, dan proporsinya dalam perekonomian juga akan meningkat. Dia memusatkan perhatian pada model vertikal industri pariwisata.
Dalam enam bulan terakhir, anggota dari berbagai bisnis Ctrip membentuk tim teknis model skala besar Ctrip. Pada tahap awal pengembangan model besar, Ctrip menyesuaikan struktur organisasinya sesuai dengan persyaratan strategis model besar, dan membentuk departemen yang berbeda termasuk tim teknis umum, tim strategi konten, tim daftar, dll., dan mengadaptasi tim teknis sesuai dengan peningkatan berkelanjutan dan iterasi produk model besar.
Liang Jianzhang mengatakan bahwa Ctrip tidak akan menyia-nyiakan upaya untuk berinvestasi dalam model besar, "Kami harus berinvestasi dengan sangat kuat dalam jangka panjang jika ini berharga bagi pelanggan atau merchant kami. (Model besar) ini sangat baru, dan tim teknis terus mengoptimalkan jumlah investasi mereka, tetapi kami tidak membatasinya."
Pada pertengahan Juli, Ctrip secara resmi merilis model vertikal besar industri pariwisata. Asked telah menyaring 20 miliar data pariwisata tidak terstruktur, digabungkan dengan data terstruktur real-time Ctrip yang ada, dan robot yang dilatih secara historis serta algoritme pencarian Ctrip, dan melakukan pelatihan model vertikal yang dikembangkan sendiri. "Pada saat yang sama, kami telah menginvestasikan banyak tenaga untuk membuat dan memverifikasi konten balasan perjalanan umum."
Sebelum pertanyaan dirilis, Ctrip telah melakukan pengujian internal, dan staf layanan pelanggan Wang Yun jelas merasa bahwa pekerjaannya telah mengalami perubahan besar. Di masa lalu, dia harus menjawab lebih dari 150 panggilan sehari untuk menjawab pertanyaan pelanggan tentang pembatalan pesanan purna jual dan kehilangan bagasi; sekarang, Wang Yun telah berubah menjadi merekomendasikan layanan pelanggan sebelum perjalanan, dan berjalan ke ruang siaran langsung dari belakang layar untuk memberikan layanan dan saran kepada netizen yang perlu disiapkan sebelum bepergian.
Dalam pandangan Liang Jianzhang, berdasarkan model skala besar tujuan umum, memecahkan masalah akurasi dalam industri pariwisata masih menjadi kuncinya: "Perjalanan adalah industri yang padat konsumsi. Bahkan jika perencanaan menghemat setengah jam, mungkin ada 5% kemungkinan bahwa hasil hotel atau rencana perjalanan yang direkomendasikan akan salah."
Meskipun tidak sebagus model besar umum dalam hal parameter, juga tidak memiliki persyaratan keras untuk daya komputasi dan kondisi lain dari model besar umum, tetapi model besar vertikal mengedepankan persyaratan yang lebih tinggi untuk data dan skenario.
Tantangan terbesar dalam pelatihan model skala besar Ask adalah bahwa dalam adegan nyata, dalam proses pengguna memperoleh informasi perjalanan, beberapa putaran pengumpulan dan pembersihan data interaktif, volume data dan keakuratan data perlu terus diperbaiki, terutama industri pariwisata telah mengalami perubahan yang luar biasa, dan informasi tujuan tiga tahun lalu mungkin sudah benar-benar ketinggalan jaman sekarang, terutama dampak epidemi pada industri pariwisata global telah memperburuk ketepatan waktu data.
Seperti Ctrip, semakin banyak perusahaan menempatkan jejak model besar di bidang vertikal.
Lembar jawaban model skala besar Yanxi yang diserahkan oleh JD.com juga menjadikan model skala besar industri sebagai fitur penting. Menurut Xu Ran, CEO baru Grup Jingdong, pengembangan teknologi kecerdasan buatan di masa lalu telah berada di ambang ledakan aplikasi beberapa kali, tetapi pada akhirnya seringkali berumur pendek, dan salah satu alasan penting adalah bahwa teknologi tersebut belum membentuk aplikasi yang solid di industri**.
Pada konferensi pers Huawei Pangu Large Model 3.0 pada 7 Juli, Zhang Pingan, CEO Huawei Cloud, bahkan mengatakan secara blak-blakan, "Pangu Large Model tidak punya waktu untuk menulis puisi dan mengobrol. Berapa pun parameter dan seberapa bagus kemampuan dialognya, jika tidak bisa menyelesaikan masalah praktis, itu tidak akan banyak berguna."
Tencent belum mengumumkan kemajuan model skala besar umum Hunyuan, tetapi telah mengumumkan rute model skala besar industri dengan cara yang terkenal, membuang lebih dari 50 solusi untuk 10 industri besar sekaligus. Li Qiang, wakil presiden Tencent dan presiden pemerintah dan bisnis perusahaan Tencent, juga mengatakan: "Model besar umum bukan satu-satunya arah untuk aplikasi model, dan model untuk industri vertikal akan menjadi titik kritis dari nilai model besar."
Pergeseran Pola Pikir
Sebuah simpul yang jelas dalam perubahan mentalitas pengusaha skala besar dimulai ketika Wang Huiwen didiagnosis menderita depresi dan diakuisisi oleh Meituan tahun cahaya dari pendiriannya. Semua orang tiba-tiba menyadari bahwa bahkan perusahaan bintang yang telah diharapkan oleh semua orang dan memiliki harapan tinggi mungkin harus berhenti bekerja karena berbagai kecelakaan.
Setengah tahun yang lalu, outlet lain sepertinya menghilang dalam semalam, dan hanya model besar yang berada di posisi C. Pengusaha dan investor di lingkaran teknologi China terbang ke Silicon Valley untuk belajar dari OpenAI.Zhang Yiming, Ma Huateng, dan Wang Xing, No.1 atau tokoh sentral pembuat keputusan dari raksasa ini, kembali dalam semalam dengan kegembiraan dan keingintahuan ketika mereka pertama kali memulai bisnis, membaca makalah, dan bertukar teknologi larut malam.
Pada saat itu, tampaknya setiap penjelajah model skala besar Tiongkok memikirkan masalah perasaan keluarga dan negara. Menghadapi iterasi ChatGPT yang cepat, tujuan yang ditetapkan oleh pengusaha China adalah bagaimana mencapai overtaking dalam berapa lama.
Li Yanhong berkata, "Baidu Wenxinyiyan sedang dalam tahap penelitian dan pengembangan, dan tim teknis Baidu melakukan uji komparatif dengan ChatGPT. Saat itu, selisihnya 40 poin, dan bisa menyusul dalam sebulan. "Wang Xiaochuan juga mengatakan bahwa dia akan membuat model bahasa besar terbaik di China pada akhir tahun.
Zhou Hongyi, pendiri 360, mengatakan dalam sebuah wawancara dengan "Pengusaha Cina" bahwa model besar tidak lagi menjadi dimensi persaingan komersial. Jika penutupan Internet Cina dan masalah pulau data antara APP yang disebabkan oleh Internet seluler tidak diselesaikan, kemungkinan akan mengarah pada keterbatasan pelatihan mesin kecerdasan buatan, yang dapat menyebabkan babak baru revolusi AI antara Cina dan Amerika Serikat. Kesenjangan antar generasi.
Adapun mengapa tidak ada perusahaan seperti OpenAI yang lahir di China, pengusaha China bahkan mulai bercermin pada saat itu, di masa lalu eksplorasi kecerdasan buatan dalam negeri terlalu pragmatis, dan semuanya berorientasi pada KPI, sehingga setiap orang tidak memiliki tekad dan kesabaran untuk berinvestasi di dalamnya, sehingga mereka melewatkan simpul yang begitu penting.
Di bawah antusiasme, setelah Baidu Wenxin melepaskan tembakan pertama, lebih dari 80 model AI berskala besar muncul dalam waktu setengah tahun, dan lebih dari 30 model berskala besar muncul di Konferensi Kecerdasan Buatan Dunia 2023 yang diadakan di Shanghai saja.Tidaklah berlebihan untuk menggambarkan popularitas model berskala besar sebagai "perang seratus model".
Tapi apakah kita benar-benar membutuhkan begitu banyak model besar? Model besar seperti apa yang kita butuhkan?
Faktanya, Robin Li mengusulkan sejak awal, "Tidak masuk akal bagi startup untuk membuat ulang ChatGPT. Saya pikir ada peluang besar untuk mengembangkan aplikasi berdasarkan model bahasa yang besar ini. Tidak perlu menemukan kembali kemudi. Setelah roda tersedia, nilai pembuatan mobil dan pesawat mungkin lebih besar daripada roda."
He Xiaodong, wakil presiden teknologi di JD.com, juga menyadari sejak awal, "Jika model besar ingin bernilai, model itu harus ditempatkan di industri, dan yang terbaik adalah berinvestasi di bidang dengan nilai industri tinggi. Hanya dengan cara ini model ini benar-benar dapat menjadi hal yang berkelanjutan dalam jangka panjang, jika tidak, model tersebut mungkin akan berumur pendek."
VARIABEL BARU
Tepat ketika pengusaha domestik sedang berjuang untuk mengeksplorasi model AI, langkah besar Zuckerberg membawa variabel baru ke bidang yang selalu berubah ini.
Pada dini hari tanggal 19 Juli, waktu Beijing, Meta merilis model besar sumber terbuka Llama 2, yang sekali lagi meledakkan lingkaran AI: Llama 2 tidak hanya memiliki kinerja yang sama dengan GPT-3, tetapi juga gratis, sumber terbuka, dan tersedia secara komersial. Llama 2 merupakan tindak lanjut dari model Llama yang dirilis oleh Meta awal Maret ini.
Pada konferensi mitra Microsoft Inspire berikutnya, CEO Microsoft Satya Nadella mengumumkan kabar kerja sama antara Meta dan Microsoft.Kerja sama ini memungkinkan Llama 2 berjalan di layanan cloud Microsoft, Microsoft Azure. Pada saat yang sama, Amazon AWS cloud juga bergabung dalam kerjasama dengan Meta.
Pentingnya Llama 2 bagi pengusaha model skala besar adalah, seperti halnya sistem Android bagi pengembangan APP, pengembang tidak perlu menemukan kembali roda, dan langsung mendapatkan infrastruktur model skala besar dengan biaya terendah, sehingga mereka dapat lebih fokus pada skenario industri mereka sendiri.
Sampai batas tertentu, ini juga berarti bahwa bagi sebagian besar pengusaha, memilih untuk fokus pada aplikasi vertikal industri telah terbukti menjadi jalan yang lebih praktis.
Namun, berbeda dari model besar pada umumnya, **Model besar industri juga mengedepankan ambang batas dan persyaratan yang berbeda untuk peserta industri:**Di satu sisi, model besar industri mengharuskan pengembang untuk memiliki akumulasi dan kekuatan teknis tertentu; di sisi lain, model besar industri juga mengharuskan operator untuk memiliki skenario praktik aplikasi industri yang kaya.
Liang Jianzhang mengatakan kepada "Pengusaha Cina": "Indikator paling penting dari model besar umum mungkin adalah berapa banyak parameter atau berapa banyak GPU yang digunakan, dll., tetapi model besar vertikal dan model bahasa besar hanyalah satu bagian darinya. Ini juga memiliki kombinasi dengan data lain, termasuk verifikasi manual, dll. Ini lebih penting. Pada akhirnya, ini menunjukkan apakah mungkin untuk menguji seberapa besar efisiensi, akurasi, dan keandalan pertanyaan dan jawaban dari pelanggan ini dapat ditingkatkan."
"Masalah terbesar dalam pariwisata adalah keandalan. Ini memang lebih rumit daripada AI menulis puisi, artikel, dan novel. Ini juga merupakan pekerjaan jangka panjang. Apa pun yang dapat meningkatkan ini hingga 80%, 90%, 95%, atau bahkan 99% layak dilakukan," kata Liang Jianzhang akhirnya.
Lihat Asli
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
modelnya, keren
Setelah lebih dari 200 hari kewirausahaan skala besar, mentalitas penjelajah China telah berubah dari kegembiraan yang ideal menjadi kenyataan.
Sebelumnya, selain perusahaan itu sendiri, kewirausahaan model AI diberkahi dengan lebih banyak makna seperti sentimen nasional dan tren zaman Menghadapi munculnya model tujuan umum ChatGPT, pengusaha China dengan cepat mencapai konsensus tentang cara membangun OpenAI dan ChatGPT versi China.
Tidak diragukan lagi bahwa ChatGPT adalah pemain top dunia tahun ini. Karena itu, lalu lintas situs web OpenAI melebihi 1,8 miliar pada bulan April, menempati peringkat 20 teratas dalam peringkat lalu lintas global. Namun, menurut data yang dirilis oleh perusahaan analisis web, Similarweb, setelah enam bulan mengalami pertumbuhan pesat, kunjungan ChatGPT mengalami pertumbuhan negatif untuk pertama kalinya, dan kunjungan di bulan Juni turun sebesar 9,7% dari bulan sebelumnya.
Penurunan lalu lintas ChatGPT yang tiba-tiba telah memicu kekhawatiran dan diskusi di komunitas teknologi global tentang risiko gelembung di industri AI.Majalah The Economist bahkan membuat kesimpulan bahwa "jalan menuju AI yang lebih besar dan lebih baik tidak lagi dapat dilakukan". Ide untuk menjadi "ChatGPT versi China" juga menjauh dari lingkaran wirausaha China.
Zhu Xiaohu, mitra pendiri GSR, menulis di Moments: "Jangan percaya takhayul tentang model umum, karena tahun depan GPT-3.5 akan menjadi komoditas (infrastruktur umum), dan tiga tahun kemudian, GPT-4 juga akan menjadi. Bagi kebanyakan pengusaha, pemandangan adalah prioritas, dan data adalah raja!"
Bersamaan dengan perubahan mentalitas para praktisi, pasar kewirausahaan skala besar mulai terpecah.
Perusahaan model skala besar China tidak lagi terobsesi dengan tujuan ideal "menjadi OpenAI China", juga tidak terobsesi dengan mengejar model parametrik dan kekuatan komputasi. Mereka memiliki jawaban yang lebih pragmatis dan lebih memperhatikan penyelesaian masalah dalam skenario industri aktual.
Persaingan model besar AI telah mengantarkan simpul lintasan baru.
Pragmatisme Kolektif
Di awal tahun ini, Liang Jianzhang, pendiri dan ketua dewan direksi Ctrip, mulai menghubungi ChatGPT. Dalam beberapa tahun terakhir, dia telah aktif di lingkungan akademik dan bisnis sebagai ahli demografi, tetapi dia juga programmer paling awal dan termuda di China, dan dia hampir menjadi Ph.D. dalam kecerdasan buatan.
Pada usia 13 tahun, Liang Jianzhang merancang program untuk menulis puisi metrik dan memenangkan penghargaan nasional. Pada usia 15 tahun, ia diterima di kelas junior Universitas Fudan. Setelah lulus, ia pergi ke Amerika Serikat untuk belajar dan memperoleh gelar master dalam ilmu komputer dari Institut Teknologi Georgia pada usia 21 tahun. Pada usia 22 tahun, Liang Jianzhang, yang sedang belajar untuk mendapatkan gelar Ph.D., tiba-tiba menyadari keterbatasan pengetahuan teoretis, dan memilih melepaskan gelar Ph.D-nya untuk bergabung dengan Oracle di Amerika Serikat.
Munculnya ChatGPT membuat Liang Jianzhang senang bahwa dia tidak melanjutkan studi untuk gelar doktor dalam kecerdasan buatan, karena "Semua algoritme pemrosesan bahasa alami ini benar-benar dikalahkan olehnya (ChatGPT)". Dia ingat bahwa ketika pertama kali berhubungan dengan ChatGPT, dia "sangat, sangat terkejut", dan perasaan kedua adalah kerendahan hati, "Algoritme paling cerdas yang akhirnya kami buat sangat dekat dengan struktur biologis otak manusia."
Liang Jianzhang mulai memikirkan kombinasi model besar AI dan bisnis Ctrip.
Dalam pandangan Liang Jianzhang, di bawah latar belakang masyarakat cerdas, pariwisata, sebagai "industri permintaan spiritual yang sulit diotomatisasi", permintaannya akan meningkat dengan peningkatan kemakmuran sosial secara keseluruhan, dan proporsinya dalam perekonomian juga akan meningkat. Dia memusatkan perhatian pada model vertikal industri pariwisata.
Dalam enam bulan terakhir, anggota dari berbagai bisnis Ctrip membentuk tim teknis model skala besar Ctrip. Pada tahap awal pengembangan model besar, Ctrip menyesuaikan struktur organisasinya sesuai dengan persyaratan strategis model besar, dan membentuk departemen yang berbeda termasuk tim teknis umum, tim strategi konten, tim daftar, dll., dan mengadaptasi tim teknis sesuai dengan peningkatan berkelanjutan dan iterasi produk model besar.
Liang Jianzhang mengatakan bahwa Ctrip tidak akan menyia-nyiakan upaya untuk berinvestasi dalam model besar, "Kami harus berinvestasi dengan sangat kuat dalam jangka panjang jika ini berharga bagi pelanggan atau merchant kami. (Model besar) ini sangat baru, dan tim teknis terus mengoptimalkan jumlah investasi mereka, tetapi kami tidak membatasinya."
Pada pertengahan Juli, Ctrip secara resmi merilis model vertikal besar industri pariwisata. Asked telah menyaring 20 miliar data pariwisata tidak terstruktur, digabungkan dengan data terstruktur real-time Ctrip yang ada, dan robot yang dilatih secara historis serta algoritme pencarian Ctrip, dan melakukan pelatihan model vertikal yang dikembangkan sendiri. "Pada saat yang sama, kami telah menginvestasikan banyak tenaga untuk membuat dan memverifikasi konten balasan perjalanan umum."
Sebelum pertanyaan dirilis, Ctrip telah melakukan pengujian internal, dan staf layanan pelanggan Wang Yun jelas merasa bahwa pekerjaannya telah mengalami perubahan besar. Di masa lalu, dia harus menjawab lebih dari 150 panggilan sehari untuk menjawab pertanyaan pelanggan tentang pembatalan pesanan purna jual dan kehilangan bagasi; sekarang, Wang Yun telah berubah menjadi merekomendasikan layanan pelanggan sebelum perjalanan, dan berjalan ke ruang siaran langsung dari belakang layar untuk memberikan layanan dan saran kepada netizen yang perlu disiapkan sebelum bepergian.
Dalam pandangan Liang Jianzhang, berdasarkan model skala besar tujuan umum, memecahkan masalah akurasi dalam industri pariwisata masih menjadi kuncinya: "Perjalanan adalah industri yang padat konsumsi. Bahkan jika perencanaan menghemat setengah jam, mungkin ada 5% kemungkinan bahwa hasil hotel atau rencana perjalanan yang direkomendasikan akan salah."
Meskipun tidak sebagus model besar umum dalam hal parameter, juga tidak memiliki persyaratan keras untuk daya komputasi dan kondisi lain dari model besar umum, tetapi model besar vertikal mengedepankan persyaratan yang lebih tinggi untuk data dan skenario.
Tantangan terbesar dalam pelatihan model skala besar Ask adalah bahwa dalam adegan nyata, dalam proses pengguna memperoleh informasi perjalanan, beberapa putaran pengumpulan dan pembersihan data interaktif, volume data dan keakuratan data perlu terus diperbaiki, terutama industri pariwisata telah mengalami perubahan yang luar biasa, dan informasi tujuan tiga tahun lalu mungkin sudah benar-benar ketinggalan jaman sekarang, terutama dampak epidemi pada industri pariwisata global telah memperburuk ketepatan waktu data.
Seperti Ctrip, semakin banyak perusahaan menempatkan jejak model besar di bidang vertikal.
Lembar jawaban model skala besar Yanxi yang diserahkan oleh JD.com juga menjadikan model skala besar industri sebagai fitur penting. Menurut Xu Ran, CEO baru Grup Jingdong, pengembangan teknologi kecerdasan buatan di masa lalu telah berada di ambang ledakan aplikasi beberapa kali, tetapi pada akhirnya seringkali berumur pendek, dan salah satu alasan penting adalah bahwa teknologi tersebut belum membentuk aplikasi yang solid di industri**.
Pada konferensi pers Huawei Pangu Large Model 3.0 pada 7 Juli, Zhang Pingan, CEO Huawei Cloud, bahkan mengatakan secara blak-blakan, "Pangu Large Model tidak punya waktu untuk menulis puisi dan mengobrol. Berapa pun parameter dan seberapa bagus kemampuan dialognya, jika tidak bisa menyelesaikan masalah praktis, itu tidak akan banyak berguna."
Tencent belum mengumumkan kemajuan model skala besar umum Hunyuan, tetapi telah mengumumkan rute model skala besar industri dengan cara yang terkenal, membuang lebih dari 50 solusi untuk 10 industri besar sekaligus. Li Qiang, wakil presiden Tencent dan presiden pemerintah dan bisnis perusahaan Tencent, juga mengatakan: "Model besar umum bukan satu-satunya arah untuk aplikasi model, dan model untuk industri vertikal akan menjadi titik kritis dari nilai model besar."
Pergeseran Pola Pikir
Sebuah simpul yang jelas dalam perubahan mentalitas pengusaha skala besar dimulai ketika Wang Huiwen didiagnosis menderita depresi dan diakuisisi oleh Meituan tahun cahaya dari pendiriannya. Semua orang tiba-tiba menyadari bahwa bahkan perusahaan bintang yang telah diharapkan oleh semua orang dan memiliki harapan tinggi mungkin harus berhenti bekerja karena berbagai kecelakaan.
Setengah tahun yang lalu, outlet lain sepertinya menghilang dalam semalam, dan hanya model besar yang berada di posisi C. Pengusaha dan investor di lingkaran teknologi China terbang ke Silicon Valley untuk belajar dari OpenAI.Zhang Yiming, Ma Huateng, dan Wang Xing, No.1 atau tokoh sentral pembuat keputusan dari raksasa ini, kembali dalam semalam dengan kegembiraan dan keingintahuan ketika mereka pertama kali memulai bisnis, membaca makalah, dan bertukar teknologi larut malam.
Pada saat itu, tampaknya setiap penjelajah model skala besar Tiongkok memikirkan masalah perasaan keluarga dan negara. Menghadapi iterasi ChatGPT yang cepat, tujuan yang ditetapkan oleh pengusaha China adalah bagaimana mencapai overtaking dalam berapa lama.
Li Yanhong berkata, "Baidu Wenxinyiyan sedang dalam tahap penelitian dan pengembangan, dan tim teknis Baidu melakukan uji komparatif dengan ChatGPT. Saat itu, selisihnya 40 poin, dan bisa menyusul dalam sebulan. "Wang Xiaochuan juga mengatakan bahwa dia akan membuat model bahasa besar terbaik di China pada akhir tahun.
Zhou Hongyi, pendiri 360, mengatakan dalam sebuah wawancara dengan "Pengusaha Cina" bahwa model besar tidak lagi menjadi dimensi persaingan komersial. Jika penutupan Internet Cina dan masalah pulau data antara APP yang disebabkan oleh Internet seluler tidak diselesaikan, kemungkinan akan mengarah pada keterbatasan pelatihan mesin kecerdasan buatan, yang dapat menyebabkan babak baru revolusi AI antara Cina dan Amerika Serikat. Kesenjangan antar generasi.
Adapun mengapa tidak ada perusahaan seperti OpenAI yang lahir di China, pengusaha China bahkan mulai bercermin pada saat itu, di masa lalu eksplorasi kecerdasan buatan dalam negeri terlalu pragmatis, dan semuanya berorientasi pada KPI, sehingga setiap orang tidak memiliki tekad dan kesabaran untuk berinvestasi di dalamnya, sehingga mereka melewatkan simpul yang begitu penting.
Di bawah antusiasme, setelah Baidu Wenxin melepaskan tembakan pertama, lebih dari 80 model AI berskala besar muncul dalam waktu setengah tahun, dan lebih dari 30 model berskala besar muncul di Konferensi Kecerdasan Buatan Dunia 2023 yang diadakan di Shanghai saja.Tidaklah berlebihan untuk menggambarkan popularitas model berskala besar sebagai "perang seratus model".
Tapi apakah kita benar-benar membutuhkan begitu banyak model besar? Model besar seperti apa yang kita butuhkan?
Faktanya, Robin Li mengusulkan sejak awal, "Tidak masuk akal bagi startup untuk membuat ulang ChatGPT. Saya pikir ada peluang besar untuk mengembangkan aplikasi berdasarkan model bahasa yang besar ini. Tidak perlu menemukan kembali kemudi. Setelah roda tersedia, nilai pembuatan mobil dan pesawat mungkin lebih besar daripada roda."
He Xiaodong, wakil presiden teknologi di JD.com, juga menyadari sejak awal, "Jika model besar ingin bernilai, model itu harus ditempatkan di industri, dan yang terbaik adalah berinvestasi di bidang dengan nilai industri tinggi. Hanya dengan cara ini model ini benar-benar dapat menjadi hal yang berkelanjutan dalam jangka panjang, jika tidak, model tersebut mungkin akan berumur pendek."
VARIABEL BARU
Tepat ketika pengusaha domestik sedang berjuang untuk mengeksplorasi model AI, langkah besar Zuckerberg membawa variabel baru ke bidang yang selalu berubah ini.
Pada dini hari tanggal 19 Juli, waktu Beijing, Meta merilis model besar sumber terbuka Llama 2, yang sekali lagi meledakkan lingkaran AI: Llama 2 tidak hanya memiliki kinerja yang sama dengan GPT-3, tetapi juga gratis, sumber terbuka, dan tersedia secara komersial. Llama 2 merupakan tindak lanjut dari model Llama yang dirilis oleh Meta awal Maret ini.
Pada konferensi mitra Microsoft Inspire berikutnya, CEO Microsoft Satya Nadella mengumumkan kabar kerja sama antara Meta dan Microsoft.Kerja sama ini memungkinkan Llama 2 berjalan di layanan cloud Microsoft, Microsoft Azure. Pada saat yang sama, Amazon AWS cloud juga bergabung dalam kerjasama dengan Meta.
Pentingnya Llama 2 bagi pengusaha model skala besar adalah, seperti halnya sistem Android bagi pengembangan APP, pengembang tidak perlu menemukan kembali roda, dan langsung mendapatkan infrastruktur model skala besar dengan biaya terendah, sehingga mereka dapat lebih fokus pada skenario industri mereka sendiri.
Sampai batas tertentu, ini juga berarti bahwa bagi sebagian besar pengusaha, memilih untuk fokus pada aplikasi vertikal industri telah terbukti menjadi jalan yang lebih praktis.
Namun, berbeda dari model besar pada umumnya, **Model besar industri juga mengedepankan ambang batas dan persyaratan yang berbeda untuk peserta industri:**Di satu sisi, model besar industri mengharuskan pengembang untuk memiliki akumulasi dan kekuatan teknis tertentu; di sisi lain, model besar industri juga mengharuskan operator untuk memiliki skenario praktik aplikasi industri yang kaya.
Liang Jianzhang mengatakan kepada "Pengusaha Cina": "Indikator paling penting dari model besar umum mungkin adalah berapa banyak parameter atau berapa banyak GPU yang digunakan, dll., tetapi model besar vertikal dan model bahasa besar hanyalah satu bagian darinya. Ini juga memiliki kombinasi dengan data lain, termasuk verifikasi manual, dll. Ini lebih penting. Pada akhirnya, ini menunjukkan apakah mungkin untuk menguji seberapa besar efisiensi, akurasi, dan keandalan pertanyaan dan jawaban dari pelanggan ini dapat ditingkatkan."
"Masalah terbesar dalam pariwisata adalah keandalan. Ini memang lebih rumit daripada AI menulis puisi, artikel, dan novel. Ini juga merupakan pekerjaan jangka panjang. Apa pun yang dapat meningkatkan ini hingga 80%, 90%, 95%, atau bahkan 99% layak dilakukan," kata Liang Jianzhang akhirnya.