Kekecewaan AI: model setengah tahun, masih terbang di langit

2023-08-04 06:52:59

Sumber: "Planet Foton" (ID: TMTweb), penulis: Wu Kunyan, editor: Wu Xianzhi

Sumber gambar: Dihasilkan oleh AI Tak Terbatas

Api model besar telah membakar tanah ini selama setengah tahun. Saat konferensi pers Huawei, JD.com, dan Ctrip menyusul episode malam, menurut paradigma konsisten Internet, "hal baru" dari model skala besar domestik juga telah memulai pengujian setengah tahunnya sendiri.

Hanya saja berbeda dengan pemeriksaan tengah tahunan pada bisnis lain, pemeriksaan tengah tahunan terhadap bentuk usaha seperti kendaraan energi baru, ponsel, dan platform e-commerce didukung oleh informasi data publik yang cukup untuk memudahkan analisis tekstual. kotak hitam", tidak ada model bisnis yang jelas, sehingga apa yang disebut informasi data dan argumen lainnya tidak mungkin.

Cukup ironis, bahkan dari segi fungsi produk, model besar tersebut belum menghasilkan metode evaluasi yang bersifat umum. Menghadapi tujuan akhir AGI, tentu saja ada berbagai metode evaluasi, seperti "metode ikan tupai mandarin" klasik yang diandalkan oleh pengguna C-end domestik untuk "mengevaluasi" model besar.

Atau karena itu, sebagian besar pabrikan dalam negeri gagal membuka model besar mereka sendiri untuk digunakan seperti OpenAI, tetapi menerapkan mekanisme pengujian internal.

Eksplorasi model skala besar lebih terfokus pada sisi-B dan sisi-G, seperti model skala besar terkemuka di industri Tencent, Huawei Pangu 3.0, Jingdong Lingxi, dll. Sebagai jalur saat ini yang menjadi fokus para pemain top, model besarnya berfokus untuk menunjukkan bentuk produk yang matang sebanyak mungkin, dengan komersialisasi sebagai tujuan dasarnya. Misalnya, untuk mempopulerkan dan mempromosikan komersialisasi model besar dengan cepat, selain orientasi pendaratan bisnis, kemampuan penyebaran lokal juga menjadi indikator referensi penting.

Meski begitu, di mata orang dalam industri, model industri skala besar yang "mengantar mangkuk ke depan" masih kekurangan perusahaan yang membelinya.Angin model industri telah bertiup selama sebulan sejak Juni, dan sudah ada belum ada kerjasama komersial skala besar sejauh ini. .

Oleh karena itu, tidak sulit untuk melihat bahwa di pasar investasi saat ini, investasi yang terkait dengan model besar terkonsentrasi di pasar sekunder daripada di pasar primer. Bahkan jika tingkat sapi besar Wang Huiwen memasuki pasar, sumber publik mengatakan bahwa putaran A pembiayaannya jauh lebih tinggi dari 230 juta dolar AS, dan kemampuan pembiayaannya tidak sama dengan OpenAI, yang menerima puluhan miliar dolar. dari Microsoft dari waktu ke waktu.

Pasar investasi adalah barometer yang mumpuni. Jelas, lembar jawaban yang diajukan oleh model skala besar domestik pada simpul waktu ujian setengah tahunan tidak memuaskan, dan akan membutuhkan waktu dormansi dan pemolesan untuk membuat "cerita" menjadi kenyataan.

Model besar tanpa model bisnis?

Ketika model skala besar domestik perlu menanggapi keraguan pasar, model bisnis harus ditempatkan di tempat pertama.

ChatGPT, yang telah menempati posisi teratas di benak pengguna, telah mengalami penurunan popularitas yang signifikan.Baidu dan Ali, model besar tujuan umum pertama yang dirilis di dalam negeri, juga "diam" setelah sejumlah besar pemain mengikuti ke atas. Alasannya adalah model bisnis model besar umum gagal berfungsi. Meskipun telah memenangkan persetujuan pengguna di bidang opini publik, loop tertutup komersial tidak pernah muncul.

Mengambil model skala besar Baidu dengan berbagai pengujian sebagai contoh, model pembayaran aplikasi komersialnya Wenxin Qianfan didasarkan pada jumlah token yang dihasilkan dengan menelepon, standarnya adalah 0,012 yuan per seribu token, dan biayanya 0,12 yuan untuk menghasilkan naskah seribu karakter.

Terlepas dari kecepatan biaya pemulihannya, biaya 0,012 yuan/ribu token tampaknya murah, tetapi pembuatan teks sering kali memerlukan banyak interaksi untuk mendapatkan hasil yang diinginkan. Banyak interaksi akan meningkatkan biaya tersembunyi tanpa batas. Lagi pula, Wenxin Qianfan bukanlah jenis staf yang datang dan pergi.

Skenario serupa adalah komunitas tanya jawab.Sun Quan (nama samaran), seorang akademisi, mengatakan kepada Photon Planet bahwa pengalaman menggunakan aplikasi model serupa dengan mencari jawaban berkualitas tinggi di komunitas tanya jawab. Pemikiran pengguna adalah perincian pertanyaan, dan kesediaan untuk membayar seringkali hanya ditemukan dalam jawaban berkualitas tinggi. JAWABAN BERKUALITAS akan dihasilkan setelahnya. Oleh karena itu, Baidu memilih jumlah teks inferensi sebagai standar pembayaran, tetapi masih tidak dapat menutupi biaya tersembunyi dari penggunaan komersial.

Jika Anda mengadopsi pembayaran bulanan yang suka dilihat oleh sisi-B, itu hanya akan mengalihkan pengeluaran biaya dari pengguna ke Anda sendiri, yang jelas bukan solusi jangka panjang. Bukti terbaiknya adalah bahwa ChatGPT masih diduga mengambil jalan pintas dengan harga $20 per bulan untuk pengguna C-end.

Saat ini, komersialisasi model besar serba guna sulit untuk mencapai keseimbangan impas apakah itu di sisi B atau sisi C. Pada saat yang sama, kemungkinan akan menghadapi risiko kepatuhan seperti etika AI dan pengawasan. Oleh karena itu, industrialisasi dan vertikalisasi model besar telah menjadi pergeseran paradigma di bawah tuntutan pendaratan.

Berbeda dengan model industri skala besar, meskipun bentuk produknya dimulai dengan permintaan pendaratan, masalah yang muncul dalam pendaratan sebenarnya masih perlu diselesaikan.

Salah satu jenis kasus yang patut dirujuk adalah model vertikal ke C yang dibangun berdasarkan ekologi produknya sendiri, seperti Zhihaitu AI, yang sebelumnya diumumkan Zhihu untuk melakukan pengujian internal pada produk, dan Ctrip.com, yang dirilis tidak lama kemudian. yang lalu.

Keuntungan dari keduanya memasuki jalur model skala besar adalah sama, yaitu terletak pada ekologi komunitasnya sendiri dan konten komunitas berkualitas tinggi yang berasal darinya. Konten, sebagai data industri, dapat menjadi korpus pelatihan model besar setelah pembersihan sederhana. Perbedaan tipis antara keduanya adalah bahwa Zhihu telah menjadi komunitas konten sejak awal, sedangkan Ctrip baru mulai fokus pada konten dalam beberapa tahun terakhir.

Tetapi dari sudut pandang saat ini, apakah itu Zhihu atau Ctrip, bentuk produk dari model besarnya tampaknya telah gagal untuk memenuhi kekurangan pengguna, juga tidak cukup meningkatkan fungsi yang ada.

Produk Zhihaitu AI yang saat ini diumumkan "Ringkasan Daftar Populer" menggunakan AI untuk menangkap pertanyaan dan jawaban berkualitas tinggi dan memoles dan menulis ulang ringkasan untuk disajikan kepada pengguna, sementara aplikasi lain "Agregasi Pencarian" mengumpulkan pendapat dari jawaban mandiri untuk meningkatkan informasi akuisisi pengguna dan efisiensi dalam pengambilan keputusan.

Fungsi agregasi seperti rekomendasi diri dan daftar panas adalah "keterampilan seni tradisional" Zhihu, dan kinerja pemberdayaan model besar tidak menyebabkan percikan di tingkat pengguna. Selain itu, proses penulisan ulang dan pemolesan AI juga mencakup fitur yang dipersonalisasi dari jawaban populer. Bagi pengguna, fungsi aplikasi ini hanya untuk memahami informasi dengan cepat, yang bertentangan dengan komunikasi yang dibedakan dan dipersonalisasi yang dianjurkan oleh komunitas konten.

Berdasarkan OTA, Ctrip bertanya, dalam pandangan Liang Jianzhang, ketua dewan direksi Ctrip, bahwa ini adalah "perpustakaan jawaban yang andal" untuk industri pariwisata. Perlu waktu untuk menguji keefektifan produknya, tetapi dari perspektif positioning, juga diduga "mengorbankan dasar-dasar dan mengejar yang terakhir".

Di mata pengguna muda, tidak ada jawaban standar untuk pariwisata, munculnya bentuk-bentuk pariwisata yang beragam seperti "pasukan khusus", "meninju" dan "menyelam" membuktikan hal ini. Misalnya, dengan asumsi bahwa sejumlah besar pengguna menggunakan AI untuk merumuskan perencanaan rute perjalanan, perencanaan rute yang sama justru akan memengaruhi komunikasi dan suasana komunitas, bahkan menyebabkan penurunan waktu tinggal pengguna.

Secara umum, upaya pendaratan model vertikal di ujung C tidak mulus, dan bahkan dapat menjadi "biaya hangus". Mungkin dipengaruhi oleh mitos "meningkatkan efisiensi" dari model besar itu sendiri, pemosisian produk sebagian besar terbatas pada kata "efisiensi", tetapi efisiensi hanyalah dimensi non-inti dalam pengalaman pengguna.

Paradigma yang sama juga telah ditunjukkan di bidang to B, dan di sisi B yang mengejar efisiensi, model bisnis dan masalah implementasi model besar industri telah ditunjukkan secara lebih mendalam.

Kotak hitam tidak jelas

"AI bukan fisika. Ada beberapa terobosan teknologi besar dalam teori, tetapi lebih banyak penyesuaian dan pengoptimalan kecil dalam dimensi struktur model dan kualitas data. Dalam banyak kasus, keluaran model bahkan lebih baik, tetapi tim tidak dapat temukan alasannya."

Menurut pendapat orang dalam industri, ada bias kognitif yang sangat besar pada model besar di luar industri, dan alasannya adalah pelatihan model besar dan industri AI adalah "kotak hitam" bagi dunia luar, dan sulit untuk memeriksa model besar Proses penalaran yang menghasilkan keluaran tidak terlihat dan tidak berwujud.

Hal ini menyebabkan dunia luar mengambil sikap hati-hati terhadap "kotak hitam" model besar setelah mereka tenang setelah periode hiruk pikuk yang dibawa oleh ChatGPT. Ini akan menimbulkan dilema model besar di lapangan, dan fenomena ini lebih terlihat jelas dalam proses perubahan ke rute B.

Ambil contoh produk yang diproduksi oleh pabrikan besar yang sekarang telah dengan jelas menentukan rute ke B sebagai contoh, termasuk solusi teknologi MaaS yang diluncurkan oleh Tencent Cloud, dan model besar Pangu yang diluncurkan oleh Huawei Cloud.Penyebaran cloud, penerapan cepat yang dilokalkan, dll. Ada juga pencapaian dalam interaksi, operasi, dan penambahan selanjutnya dari pengoptimalan iteratif data industri baru.Dapat dikatakan bahwa demi pendaratan, ambang batas untuk model besar telah dikurangi ke tingkat yang sangat rendah.

Namun, tembok kognitif yang ditimbulkan oleh "kehati-hatian" belum dipatahkan, meskipun ChatGPT telah meledak selama setengah tahun, banyak perusahaan tidak memiliki motivasi atau minat untuk mempelajari cara mengimpor model besar.

Logika serupa dapat dilihat di industri komputasi awan beberapa tahun yang lalu. Komputasi awan adalah layanan dan turunannya berdasarkan pengenalan nilai data Adapun nilai model besar untuk perusahaan, secara relatif nilai data telah melonjak. Itu juga kemampuan teknis yang tidak dimiliki pelanggan perusahaan, bahkan mempopulerkan komputasi awan di perusahaan domestik masih jauh dari akhir, belum lagi model besar.

Apakah model industri berguna atau tidak sebenarnya tidak penting lagi, bagaimanapun, nilai guna produk perlu diketahui oleh pengguna pada akhirnya. Terlebih lagi, dunia luar secara kasar akan mengukur tingkat model melalui tes dan kinerja tertentu, seperti "metode ikan tupai mandarin" atau Huawei Pangu, yang baru-baru ini dipertanyakan karena kesalahan dalam memprediksi lokasi pendaratan dan intensitas gelombang. topan super "Dusuri" Model cuaca.

Mungkin karena ini, model skala besar Jingdong Lingxi yang dirilis baru-baru ini memilih untuk memprioritaskan menjalankan skenario bisnisnya sendiri, dan diharapkan akan terbuka untuk "skenario bisnis eksternal yang serius" awal tahun depan.

Yang lebih penting untuk disebutkan adalah bahwa di bawah "tren industri", apa yang disebut model industri yang berorientasi pada komersialisasi telah menggantikan narasi "universal" asli dari model besar, dan pada saat yang sama, hal itu juga menyebabkan banyak orang "kehilangan ".

Definisi dari apa yang disebut model industri tidak jelas. Konotasi model besar (Foundation Model) tidak terletak pada jumlah parameter tetapi pada kemampuan umum yang muncul dari pelatihan data umum. Jika arsitektur model yang sama diadopsi, tetapi data domain tunggal digunakan pada data, tidak hanya kemampuan umum akan hilang, tetapi bahkan masalah domain tidak dapat diselesaikan karena diskon yang muncul.

Jika data industri digunakan untuk pra-pelatihan sekunder berdasarkan model besar asli, itu setara dengan menyempurnakan model asli, maka produk itu sendiri masih dalam lapisan model, yang dapat disebut model besar industri ; jika pengetahuan domain ditambahkan melalui atau database eksternal, Itu hanya untuk merangsang kemampuan model asli, dan produk juga harus menjadi bagian dari lapisan aplikasi di atas model. Terlalu berlebihan untuk menyebutnya sebagai model industri.

Saat ini, sebagian besar model industri berskala besar di pabrik-pabrik besar adalah yang pertama, seperti Tencent, Jingdong, Huawei, dan sebagainya. Yang terakhir akan lebih banyak muncul di komunitas open source karena investasi yang lebih ringan dan peningkatan kinerja model yang cepat, seperti ChatLaw, model hukum besar yang memicu diskusi hangat beberapa waktu lalu.

"Dibandingkan dengan yang pertama, yang terakhir lebih matang dalam hal bentuk produk, yang memfasilitasi konstruksi cepat dari kemampuan model, tetapi yang terakhir seringkali memiliki batas atas yang lebih tinggi setelah menyelesaikan proses menanamkan pengetahuan domain," kata orang dalam industri.

Ancaman Sumber Terbuka

Baru-baru ini, Meta menyediakan model besar open source Llama2 terbaru secara gratis di bawah lisensi komersial terbuka, dan memperkenalkannya ke platform Microsoft Azure.Langkah ini dipuji sebagai tonggak penting untuk LLM open source, dan bahkan mulai mengancam status closed source produsen terkemuka OpenAI.

Melalui Microsoft, sponsor model besar, Meta menantang OpenAI dengan sikap yang lebih terbuka.

Nyatanya, "faksi open source" diam-diam telah bangkit sebagai pihak ketiga jauh sebelum ini. “Kami tidak memiliki parit, begitu pula OpenAI,” kata sebuah dokumen internal Google yang bocor secara tidak sengaja pada bulan Mei. Gagasan umumnya adalah bahwa di permukaan, OpenAI dan Google mengejar satu sama lain dalam model besar, tetapi pemenang sebenarnya mungkin tidak datang dari keduanya Alasan penilaian ini terletak pada ekologi open source yang semakin kaya.

Ekologi open source menjadi semakin aktif, dan bahkan Llama2, yang mewakili kemampuan model, dan LORA, teknologi perwakilan dari paradigma Finetune (model fine-tuning), telah muncul. Semua ini telah membuat pabrikan raksasa yang berjuang untuk "berjuang untuk keajaiban" merasakan kedinginan yang jelas.

Faktor-faktor seperti berbagi teknologi open source dan transfer bakat juga membuat kotak hitam model besar lebih "bervitrifikasi". Hasil yang tak terhindarkan dari kurangnya hambatan adalah Konw How, yang diinvestasikan oleh pabrik besar dengan jumlah uang yang besar dan waktu, mudah dibatalkan oleh komunitas open source. .

Sebagian besar pabrikan dalam negeri terkemuka menanggapi hal ini dengan "menggenggam dengan kedua tangan". Tangan kiri "menutup pintu untuk membuat mobil", terus memoles bentuk dan kemampuan produk dalam bentuk pengujian internal skala kecil, dan tangan kanan "bertukar pendapat", membangun komunitas open source dalam ekologi berbasis cloud ekologi pengembang, tetapi ini hanya membutuhkan lapisan daya komputasi pabrikan sendiri dan lapisan model Tata letak tumpukan penuh ke lapisan aplikasi. Alibaba Cloud telah meluncurkan GPT komunitas open source skala besar, dan Huawei Cloud, Baidu Cloud, dan Tencent Cloud juga telah membuat rencana.

Secara umum, apakah itu industri atau GM, ke C atau ke B, pengujian setengah tahun dari model besar memberi kita perasaan langsung bahwa itu sulit untuk diterapkan, dan ekspektasi laba terus bergerak mundur; risikonya semakin besar. lebih kuat, dan sulit untuk mengatakan hambatan teknis. Jadi, di mana cara untuk memecahkan situasi saat ini?

Untuk saat ini, ada dua arah yang menarik. Salah satunya adalah database vektor yang dikenal sebagai "Memori di era AI", dan yang lainnya adalah perangkat keras cerdas yang diberkahi oleh kecerdasan model.

Yang disebut vektor mengacu pada data multidimensi yang dapat mewakili apa saja, termasuk teks, gambar, video, dan suara yang paling penting dalam pelatihan LLM saat ini. Bentuk konten ini secara jelas terwakili dalam database dan mendukung pengambilan semantik, yaitu pengambilan berdasarkan kesamaan, misalnya laki-laki vs laki-laki. Dengan kata lain, untuk model besar, pengambilan vektor adalah SEO model besar.

Seperti disebutkan di atas, pengetahuan domain dapat meningkatkan konstruksi dan penggunaan model industri melalui kemampuan basis data vektor, atau penyempurnaan atau plug-in.Untuk pabrikan besar, ini tentu saja menjadi fokus tahap berikutnya. Sejak Mei, modal mengalir ke jalur terkait data vektor. Sebagai produk lapisan aplikasi dengan prospek yang lebih pasti, data vektor juga mendapat perhatian besar dari banyak VC.

Adapun model perangkat keras pintar bawaan, ini merupakan lompatan kemampuan dibandingkan dengan asisten pintar sebelumnya seperti "siri" dan "Xiaoai", dan ini juga merupakan perpanjangan dari perangkat pintar nyata (ponsel, komputer). Dalam komunitas open source, ada upaya untuk membangun model parameter besar ke dalam MAC, sementara pabrikan besar telah mengumpulkan sejumlah kapasitas produksi perangkat keras di era Internet seluler sebelumnya, dan secara relatif, keunggulan penggerak pertama mereka lebih jelas. .

Tanpa gaya penulisan musim semi dan musim gugur ala PR, model skala besar yang telah menjadi persyaratan inti tidak lagi misterius, dan ceritanya menjadi semakin berkurang.Pemain trek yang sudah mulai "menyelam dalam" masih bekerja keras. Industri membutuhkan momen "ChatGPT" berikutnya sebelum kita melihat penyelam muncul dan menghadapi mereka secara langsung.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

1 Suka