Saya menyarankan Alibaba, Baidu, dan Huawei untuk tidak terburu-buru mengambil "pekerjaan" model-model besar di industri ini!

2023-09-27 02:57:19

Asli: Yibi Yanyu

Sumber: Data Kera

Media layanan inovasi industri big data

——Fokus pada data·Mengubah bisnis

Dalam beberapa bulan terakhir, tren perkembangan yang sangat jelas di bidang model besar dalam negeri adalah semua orang berkumpul untuk membangun model besar di industri. Tidak hanya perusahaan di berbagai bidang vertikal yang merilis berbagai model industri besar, tetapi raksasa terkemuka seperti Baidu, Alibaba, Huawei, Tencent, dan JD.com juga menganggap model industri besar sebagai fokus utama.

Secara khusus, pabrikan ini dapat dibagi menjadi dua kategori berdasarkan proporsi model besar dalam strategi mereka:

Baidu, Alibaba, Tencent, dan iFlytek memberikan perhatian yang sama terhadap model umum besar dan model industri besar.

Di satu sisi, mereka lebih memperhatikan model umum besar dan membuka model besar umum untuk pengguna C-end. Baidu Wenxinyiyan dan iFlytek Spark dari iFlytek bahkan membuat aplikasi seluler untuk mempromosikan penerapan model umum yang besar.

Di sisi lain, mereka juga menaruh perhatian besar pada model industri besar. Umumnya diekspor ke luar negeri dalam bentuk solusi industri. Bahkan pada 19 September, Baidu langsung meluncurkan model besar industri medis – Model Pengobatan Spiritual, yang langsung melayani rumah sakit, pasien, dan perusahaan alat kesehatan.

Kategori lainnya diwakili oleh Huawei dan JD.com, yang sejak awal berfokus pada model industri skala besar dan berorientasi langsung pada aplikasi industri.

Slogan model Pangu Huawei sejak awal adalah "Jangan menulis puisi, lakukan saja." Perusahaan ini tidak antusias dengan aplikasi C-end, dan hampir semua fokus strategisnya adalah pada industri.

Model besar Yanxi JD.com serupa.Mengikuti konsep JD Cloud tentang "cloud yang lebih memahami industri", JD.com juga berfokus pada aplikasi industri di bidang model besar. Selain itu, JD Health juga merilis model besar Jingyi Qianxun sebagai pionir memasuki industri.

Dapat diketahui bahwa apakah Baidu, Alibaba, Tencent, dan iFlytek yang "memberikan perhatian yang sama pada kedua sisi", atau Huawei dan JD.com, yang hampir "berjuang di satu sisi", mereka semua menganggap model besar industri ini. sebagai medan pertempuran bagi para ahli strategi militer.

Penulis berpendapat bahwa hal ini merupakan suatu permasalahan. Raksasa teknologi ini harus fokus pada model umum yang besar, dan aplikasi industri harus diserahkan kepada mitra di berbagai bidang industri.Mereka hanya boleh membangun "infrastruktur" model besar dan tidak menyentuh aplikasi lapisan atas.

Mengapa kami mengatakan ini? Selanjutnya, mari kita analisis pro dan kontra secara detail.

Raksasa harus fokus pada penelitian dan pengembangan model umum yang besar

Model besar secara umum ibarat pondasi dari keseluruhan industri model besar, kokoh atau tidaknya pondasi akan menentukan seberapa tinggi bangunan tersebut dapat dibangun. Lantas, apakah fondasi yang ada saat ini kokoh?

Sayangnya, meskipun model-model besar pada awalnya telah mencapai "kemunculan" kecerdasan dan telah membuat kemajuan besar dalam pemahaman bahasa alami, pembuatan konten, dan penalaran logis, model-model tersebut tidak cukup baik. Apalagi jika kita ingin mengimplementasikan model besar secara komersial di berbagai industri, kemampuan model yang ada saat ini saja tidak cukup.

Kemampuan yang disebutkan di sini tidak cukup kuat, dan tidak merujuk secara khusus pada model besar tertentu.

Bahkan GPT-4 masih memiliki kekurangan kemampuan yang cukup signifikan jika ingin diimplementasikan di bidang komersial. Mari kita lihat beberapa contoh.

Mesin pencari adalah skenario aplikasi penting untuk model besar. Microsoft Bing telah membuat perubahan besar dengan mengubah metode pencarian kata kunci asli karena aksesnya ke ChatGPT. Lantas, bagaimana sebenarnya performa Bing dengan bantuan ChatGPT?

Kami mencobanya dan sejujurnya cukup mengecewakan.

Berikut contohnya, misalkan Bing mencari berita tentang model besar hari ini (26 September), keempat berita yang diberikan adalah, setelah diklik, isi item 1 dan 3 sebenarnya berasal dari artikel berita, dan ini adalah Yang pertama berita tersebut diterbitkan pada tanggal 21 Februari; konten kedua dan keempat juga berasal dari artikel berita yang sama, yang diterbitkan pada tanggal 27 Juli.

Dengan kata lain berita yang diberikan salah, kita mencari berita hari ini, namun hasilnya adalah konten beberapa bulan yang lalu. Apalagi kami sedang mencari kejadian-kejadian penting di bidang model besar.Di antara empat jawaban yang diberikan, terdapat dua laporan, satu artikel analisis berita, dan satu kegiatan forum. Sebenarnya laporan dan artikel analisis bukanlah berita penting, dari sudut pandang ini, hasil yang diberikan Bing sama sekali tidak memenuhi persyaratan.

Penulis kemudian bertanya lebih lanjut dan memintanya menggunakan tabel untuk memilah isi berita yang diberikan. Alhasil, pada tabel yang diberikannya, waktu pemberitaan berubah menjadi 26 September, dan jika menyangkut waktu spesifiknya, hal tersebut jelas tidak masuk akal.

Penulis pernah memiliki ekspektasi yang tinggi terhadap mesin pencari baru seperti Bing dan mencobanya berkali-kali. Tapi perasaan keseluruhannya - pada dasarnya tidak dapat digunakan. Ini adalah performa sebenarnya ChatGPT di bidang penelusuran. Sampai batas tertentu, ini mewakili level tertinggi yang dapat dicapai model besar.

Baidu juga telah meluncurkan fungsi serupa. Selain pencarian web biasa, Anda juga dapat melakukan kueri melalui percakapan. Kami tidak sabar untuk mencobanya.

Dibandingkan dengan Bing, Baidu memiliki pemahaman yang lebih baik tentang berita peristiwa, Bing memberikan beberapa laporan, sedangkan Baidu memberikan hasil berdasarkan rilis model besar.Nilai berita dari peristiwa tersebut jelas lebih tinggi.

Namun, apakah hasil yang diberikan oleh Baidu dapat diandalkan? Demikian pula, kami mengizinkannya untuk dikompilasi dalam bentuk tabel dan memberikan waktu berita serta tautan. Ternyata waktunya semua tanggal 11 Mei, yang jelas bermasalah, yang kita inginkan adalah berita tanggal 26 September, bukan 11 Mei.

Selain itu, ada juga masalah dengan link berita yang diberikan pada tabel, saat membuka halaman web terkait, langsung menampilkan "404". Tentu saja Bing Microsoft juga mengalami masalah ini, link berita yang diberikannya tidak dapat dibuka atau tidak ada.

Kembali ke ChatGPT, salah satu keterbatasan pentingnya adalah tidak dapat terhubung ke Internet, dan datanya tidak dapat diperbarui secara real time.Dataset pelatihan GPT-3 adalah per September 2021, dan data pelatihan GPT -4 adalah pada Januari 2022 bulan.

Terlebih lagi, ChatGPT sering melakukan kesalahan dalam penghitungan dan pemrosesan data yang rumit. Kemampuan mengunggah dan memahami teks yang diklaimnya juga tidak ideal.

Mari kita coba kemampuan pemahaman dokumen GPT-4. Kami mengunggah laporan tengah tahunan Loongson Zhongke tahun 2023 dan mencoba melakukan analisis SWOT sederhana. Setelah dokumen diunggah, ChatGPT mulai menulis kode untuk mengurai dokumen, yang tampaknya sangat berguna.

Apakah hasilnya?

Pada akhirnya ChatGPT gagal mengurai dokumen PDF, kami mencoba beberapa kali tetapi gagal menguraikannya.

Bayangkan saja, dengan mengandalkan model besar ini, jika ingin menerapkannya dalam skenario industri yang kompleks, efeknya pasti tidak ideal, dan model tersebut sudah menjadi model umum besar terbaik di pasar.

Memang benar bahwa telah terjadi beberapa "kemunculan kecerdasan" pada model-model besar, dan kemampuannya telah ditingkatkan secara kualitatif, tetapi mereka saat ini berada dalam tahap awal "teratai kecil baru saja menunjukkan sisi tajamnya". Karena penemuan model besar merupakan arah yang menjanjikan, hal terpenting yang harus dilakukan saat ini adalah mempercepat dan memupuk potensi “anak” ini daripada membiarkannya menghidupi keluarga sebelum waktunya.

Dilihat dari pengalaman sejarah, setiap kegilaan terhadap kecerdasan buatan akan diikuti dengan periode diam yang lama.Alasan utamanya adalah ekspektasi masyarakat yang terlalu tinggi pada tahap awal, dan mereka akan kecewa begitu ekspektasi mereka tidak terpenuhi.

Demikian pula, jika kita terburu-buru menerapkan model besar di berbagai industri sekarang, kita akan segera menghadapi masa masalah, dan masyarakat akan segera berubah dari ekspektasi yang besar menjadi keluhan yang gila-gilaan.Naik turun seperti ini tidak kondusif bagi perkembangan industri yang sehat. .

Oleh karena itu, tugas inti raksasa teknologi seperti Alibaba, Huawei, Baidu, dan Tencent adalah membina “anak” General Model. Asalkan kapabilitasnya benar-benar ditingkatkan, implementasi skala besar sebenarnya akan sangat cepat, jadi tidak perlu terburu-buru menunggu hingga saat ini.

Terdapat kurva kemunculan kecerdasan yang terkenal di bidang model besar, yaitu kinerja model tidak berhubungan secara linier dengan skala parameter.Model dengan 20 miliar parameter tidak dua kali lebih baik dari model dengan 10 miliar parameter.

Terdapat ambang batas pada kurva kemunculan kecerdasan ini, saat ini ambang batas tersebut adalah sekitar 100 miliar parameter. Sebelum ambang batas ini, tingkat kecerdasan yang ditampilkan oleh model tidak berubah secara signifikan seiring dengan peningkatan skala parameter. Model dengan 20 miliar parameter memiliki performa yang hampir sama dengan model dengan 2 miliar parameter. Namun, ketika skala parameter melewati ambang batas 100 miliar, performa model meningkat secara eksponensial.

Meskipun ukuran model tidak dapat mewakili segalanya, dilihat dari pengalaman pengembangan kecerdasan buatan dalam sepuluh tahun terakhir, “kekerasan kuantitatif” sering kali menjadi arah utama. Model yang lebih besar, jaringan saraf yang lebih dalam, dan lebih banyak data akan menghasilkan kinerja yang lebih baik.

Dilihat dari kurva kemunculan intelijen saat ini, setelah skala ratusan miliar parameter, maka akan memasuki periode kemacetan intelijen.Mungkin tidak ada perbedaan yang signifikan dalam "kecerdasan" antara model dengan 500 miliar parameter dan model dengan 100 miliar parameter . Namun, jika kita ingin mencapai "ambang batas darurat" berikutnya, cara terbaik saat ini adalah terus memperluas ukuran parameter. Mungkin, setelah skala parameter diperluas hingga puluhan triliun, ambang kemunculan berikutnya akan tercapai, dan kemampuan model besar akan mencapai tingkat yang baru.

Pemetaan data prediksi kemunculan cerdas model besar kera

Tentu saja, seiring dengan perluasan skala model, biayanya juga akan meningkat secara signifikan, jadi ini hanya bisa menjadi permainan bagi para raksasa. Selain itu, memperluas ukuran model juga akan menyebabkan masalah over-fitting. Oleh karena itu, perluasan skala model juga perlu diimbangi dengan optimalisasi dan penyesuaian arsitektur model, di sinilah kemampuan teknis benar-benar diuji.

Sebagai langkah mundur, model besar saat ini semuanya didasarkan pada arsitektur Transformer, dan arsitektur ini diusulkan dalam sebuah makalah oleh beberapa peneliti Google lima tahun lalu. Jadi apakah arsitektur Transformer benar-benar yang terbaik? Apakah ada arsitektur model yang lebih baik? Pertanyaan-pertanyaan ini perlu dijawab oleh raksasa teknologi seperti Huawei, Baidu, Alibaba, dan Tencent.

Selain skala parameter dan arsitektur model, model besar juga perlu memecahkan masalah "ilusi", masalah interpretabilitas, dan masalah multimodal. Masalah-masalah ini belum terselesaikan dengan baik, yang merupakan masalah umum yang dihadapi oleh seluruh industri. Kunci untuk memecahkan masalah ini terletak pada terobosan teknologi yang mendasari model-model besar secara umum, bukan pada model-model industri besar.

Tentu saja, siapa pun yang benar-benar dapat memecahkan masalah-masalah utama ini akan diberi imbalan yang sesuai oleh pasar.

Jangan menjadi wasit dan pemain pada saat yang bersamaan

Alasan mengapa raksasa teknologi disarankan untuk tidak menyentuh model-model besar di industri adalah karena selain masalah model-model besar secara umum yang belum terselesaikan, alasan lain yang sangat penting adalah untuk menghindari konflik kepentingan dengan mitra.

Bagi raksasa teknologi, mereka memainkan permainan ekologis dan berbagi manfaat infrastruktur.

Di bidang model besar, jalur transmisi nilai harus berupa model besar umum - model industri besar - pelanggan industri. Dalam tahap model industri besar, produsen model besar secara umum seperti Huawei, Baidu, dan Alibaba dapat mengembangkan sendiri model industri besar atau membiarkan mitra pihak ketiga melakukan penelitian dan pengembangan berdasarkan model besar umum mereka sendiri.

Pemetaan kera data mekanisme transmisi nilai aplikasi industri model besar

Model besar secara umum menguji kemampuan teknis, sedangkan ambang batas teknis untuk model industri besar tidak terlalu tinggi.Elemen intinya adalah data dan pengalaman industri, dan kedua poin ini merupakan kelemahan raksasa teknologi. Untuk mengumpulkan kumpulan data berkualitas tinggi dari berbagai industri seperti keuangan, perawatan medis, manufaktur, dan ritel, serta untuk memahami skenario bisnis berbagai industri, jelas bukan sesuatu yang dapat dilakukan oleh satu perusahaan. Ia harus mengandalkan kekuatan dari ekosistem dan menggunakan ribuan data dari seluruh ekosistem. Mitralah yang melakukannya.

Tentu saja, produsen model besar secara umum seperti Baidu, Huawei, dan Tencent juga dapat menempati kedua jalur transmisi nilai tersebut. Misalnya, di bidang medis, Baidu tidak hanya dapat menggunakan model pengobatan spiritual berskala besar miliknya untuk melayani rumah sakit, pasien, dan perusahaan peralatan medis secara langsung, tetapi juga mempromosikan pembangunan sistem mitra model medis vertikal berskala besar.

Namun keadaan ini akan menghadapi masalah “bersaing dengan masyarakat untuk mendapatkan keuntungan”, yang merupakan hal yang tabu dalam bisnis.

Bayangkan sebuah perusahaan model medis berskala besar A membangun model umum perusahaan B berskala besar, membuka data medis intinya ke B, dan melatih model medis berskala besar. Beberapa bulan kemudian, A mengetahui bahwa perusahaan B juga telah meluncurkan model medis besar, dan fungsinya serupa dengan miliknya. Ketika seorang pelanggan industri memesan, dia menemukan bahwa Perusahaan B juga menawar, dan mitranya tiba-tiba menjadi pesaing. Jika demikian, apakah Perusahaan A masih bersedia bekerja sama dengan Perusahaan B?

Dalam suatu ekosistem, kepercayaan mitra terhadap pemilik ekosistem sama berharganya dengan emas. Hanya ketika mitra aplikasi tingkat atas sangat yakin bahwa pemilik lingkungan tidak akan memiliki konflik kepentingan dengannya atau mencuri bisnisnya, barulah dia akan merasa percaya diri menempatkan bisnisnya di platform yang dibangun oleh pemilik lingkungan.

Hal ini agak mirip dengan hubungan antara vendor IaaS dan vendor SaaS di bidang komputasi awan. Alasan paling penting mengapa banyak perusahaan SaaS di Tiongkok merasa tidak nyaman dengan vendor cloud seperti Alibaba Cloud, Tencent Cloud, Baidu Cloud, dan Huawei Cloud adalah karena mereka takut akan konflik kepentingan. Saat ini, batasan bisnis vendor cloud IaaS belum cukup jelas, mereka tidak hanya menyediakan produk IaaS dan PaaS, tetapi juga memasuki banyak bidang SaaS, yang merupakan hal paling tabu bagi mitra SaaS mereka.

Pada tahap awal Internet di Tiongkok, para investor memiliki pertanyaan yang sangat mendalam bagi perusahaan-perusahaan baru – apa yang akan Anda lakukan jika Tencent membuat produk yang sama?

Dengan cara yang sama, jika produsen model besar pada umumnya ingin membangun ekosistem aplikasi, maka produsen model industri besar di bidang perawatan medis, keuangan, urusan pemerintahan, manufaktur, dan bidang lainnya juga akan bertanya - apakah Anda membuat sesuatu seperti saya di masa depan, apa yang harus saya lakukan?

Jadi ekosistem model besar seperti apa yang lebih masuk akal? Kita bisa belajar dari ekosistem komputasi awan, model besar secara umum setara dengan IaaS, dan model besar industri setara dengan SaaS.

Baidu, Huawei, Alibaba, Tencent, JD.com, ByteDance, iFlytek dan produsen model umum terkemuka lainnya fokus pada model umum yang besar (IaaS+PaaS) dan berusaha untuk tidak menyentuh model industri besar (SaaS). Batasi batasan bisnis.

Perlu dicatat bahwa meskipun mereka tidak membuat model industri yang besar, produsen model besar secara umum masih dapat berbagi dividen penerapan model besar dalam industri. Sama seperti aplikasi SaaS yang menggunakan sumber daya IaaS dan membayar IaaS, model industri lapisan atas akan memanggil kemampuan model umum lapisan bawah, dan model bisnis yang masuk akal dapat dibangun berdasarkan jumlah panggilan dan penggunaan.

Misalnya, Baidu tidak membuat model medis skala besar, tetapi memiliki 10 mitra model medis skala besar berdasarkan Wen Xinyiyan, dan masing-masing mitra melayani 1,000 rumah sakit. Asumsikan setiap rumah sakit membayar 1 juta yuan per tahun, dan Baidu berbagi 20% dari 1 juta yuan tersebut. Kemudian setiap perusahaan model medis skala besar dapat memperoleh 1 miliar yuan per tahun, dan pendapatan Baidu adalah 1 miliar*20%*10=2 miliar yuan. Dengan cara ini, Baidu hanya perlu melayani 10 mitranya, bukan melayani 10.000 rumah sakit.

Dengan analogi, jika ekosistem model besar industri yang makmur dapat dibangun, penerapan model besar dalam industri juga dapat menghasilkan pendapatan puluhan miliar bagi produsen model besar secara umum.

Untuk produsen model besar pada umumnya seperti Baidu, Huawei, Tencent, dan Alibaba, tidak perlu khawatir kehilangan keuntungan dari aplikasi model industri besar. Sama seperti di bidang cloud computing, pendapatan vendor SaaS manakah yang bisa menandingi Alibaba Cloud, Tencent Cloud, dan Huawei Cloud yang menyediakan IaaS?

Selama Anda berkonsentrasi pada peletakan fondasi model umum yang besar, Anda kemudian dapat menjual "tanah" tersebut tanpa harus susah payah memindahkan batu bata untuk membangun rumah. Mari kita pikirkan kembali bidang real estate. Apakah pengembang real estate seperti Vanke dan Evergrande adalah yang paling menguntungkan? Jelas lebih menguntungkan dan lebih mudah menjual tanah.

Bagi produsen model besar di industri vertikal, keadaan paling ideal mereka adalah belajar dari strategi penerapan lintas cloud SaaS untuk mencapai penerapan model lintas umum dari model industri besar, dan untuk dengan lancar memigrasikan bisnis dari satu platform model umum ke platform model umum lainnya. Hal ini untuk menghindari keterikatan pada satu platform. Tentu saja, model-model besar di industri saat ini berada pada tahap yang sangat awal, dan masih terlalu dini untuk membicarakan penerapan model lintas umum.

Pemetaan kera data mode penerapan lintas model dari model industri besar

Singkatnya, raksasa teknologi seperti Baidu, Huawei, Alibaba, dan Tencent direkomendasikan untuk fokus pada penelitian dan pengembangan model besar secara umum daripada penerapan model industri besar.

Di satu sisi, model besar untuk keperluan umum masih belum cukup baik. Masalah seperti tingkat kecerdasan model yang tidak mencukupi, masalah halusinasi, interpretasi yang buruk, kemampuan fusi multi-modal yang buruk, dan tingginya biaya pelatihan dan inferensi model masih menonjol. . Raksasa teknologi harus memecahkan masalah ini. Teka-teki tingkat rendah dan lebih menantang. Hanya ketika masalah-masalah ini terpecahkan maka fondasi penerapan industri model besar dapat menjadi kokoh.

Pada tingkat penerapan industri model besar, penyelesaiannya dapat sepenuhnya diserahkan kepada perusahaan lapangan vertikal tingkat atas. Diperkirakan akan ada ratusan atau ribuan perusahaan model industri skala besar yang bersaing di masing-masing bidang, pada akhirnya puluhan perusahaan akan bertahan dan yang terkuat akan bertahan. Perusahaan-perusahaan yang bertahan ini adalah mitra yang berkualitas. Produsen model besar secara umum harus membangun ekosistem dengan mitra mereka untuk bersama-sama melayani pelanggan industri.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

Hadiah
suka
Komentar
Bagikan

Komentar

0/400

Tidak ada komentar

Topik
1/3
1Simple Earn Annual Rate 24.4%
39k Popularitas
2Gate Launchpad List IKA
41k Popularitas
3ETH Trading Volume Surges
42k Popularitas
4Gate ETH 10th Anniversary Celebration
22k Popularitas
5Trump’s AI Strategy
18k Popularitas

Sematkan

peta situs