Setelah beberapa bulan angin dari "semua aplikasi layak dilakukan ulang dengan model besar", semua terminal juga ingin menggunakan model besar untuk membentuk kembali daya saing mereka.
Huawei telah menjadi pabrikan pertama di industri ponsel yang memberikan jadwal khusus untuk implementasi model besar. Baru-baru ini, dengan HarmonyOS 4.0 mengakses kemampuan model skala besar Pangu, Xiaoyi, asisten suara bawaan di ponsel Huawei, telah menjadi asisten cerdas pertama dengan kemampuan model skala besar AI, dan akan dibuka untuk pengujian pada akhir Agustus .
Menurut kemajuan di atas, seri Huawei Mate 60 yang akan dirilis pada paruh kedua tahun ini juga akan dilengkapi dengan kemampuan model skala besar, dan diharapkan menjadi nilai jual utama terhadap seri iPhone 15 Apple. **
**Sebelum model besar, chip 5G pernah dianggap oleh dunia luar sebagai senjata rahasia Huawei melawan iPhone 15 baru. **Menurut laporan online, ponsel 5G Huawei diperkirakan akan kembali pada Oktober tahun ini. Namun, dibandingkan dengan kemampuan model skala besar yang diharapkan, waktu peluncuran ponsel 5G Huawei masih menghadapi banyak ketidakpastian.
Saat ini, Qualcomm dan MediaTek berturut-turut menyatakan belum mendapatkan persetujuan dari pemerintah AS untuk menjual chipset ke Huawei. Sekalipun kabar kembalinya ponsel 5G Huawei menjadi kenyataan, daya saingnya tidak optimis, karena kemungkinan besar akan bekerja sama dengan SMIC untuk mencapai alternatif lokalisasi yang lengkap, dan harganya proses pembuatan chip hanya bisa mencapai paling banyak level 7nm Dibandingkan dengan 3nm pada iPhone 15, ini tertinggal dua era dalam hal iterasi teknologi.
Dibandingkan dengan status quo chip 5G terbelakang, Huawei sebenarnya berada di depan Apple dalam hal model besar.
Meskipun CEO Apple Cook juga menganggap iPhone dan perangkat keras lainnya sebagai pembawa bagi perusahaan untuk menampilkan teknologi AI, dan mengakui gelombang besar perubahan yang dibawa oleh kecerdasan buatan, Apple cukup berhati-hati dalam pengembangan model besar. "Kami akan terus memasukkannya ke dalam produk kami dengan sangat hati-hati."
Menurut reporter teknologi Bloomberg, Mark Gurman, Apple diam-diam mengembangkan produk AI secara internal, dan telah menetapkan kerangka kerja model berskala besar "Ajax", dan telah mencoba menerapkannya pada fungsi produk seperti peta dan Siri. rilis "Apple GPT" ke konsumen belum.
**Dalam sepuluh tahun terakhir, produsen ponsel domestik telah memimpin dua perubahan produk utama: gelombang layar penuh yang diluncurkan pada tahun 2016 pernah mendorong iPhone keluar dari lima besar di pasar Cina; gelombang layar lipat yang diluncurkan pada tahun 2019 tidak dasar-dasar iPhone belum terguncang. **
**Sebagai peluang baru lainnya untuk perubahan produk, apakah model besar akan menjadi "momen layar penuh" yang mempromosikan mempopulerkan produsen ponsel dalam negeri, atau "dilema layar lipat" yang dibatasi oleh ceruk? **
**Dibandingkan dengan aplikasi pihak ketiga seperti ChatGPT dan Wenxin Yiyan yang telah masuk ke ponsel, keunggulan paling langsung dari produk model berskala besar yang dibangun langsung ke dalam sistem ponsel terletak pada perlindungan privasi dan keamanan yang lebih kuat. **
Dibandingkan dengan aplikasi seperti ChatGPT yang memproses data di cloud, penerapan terminal pintar yang dilokalkan dapat menghilangkan kekhawatiran pengguna tentang kebocoran privasi hingga batas maksimal.
Pada bulan Maret tahun ini, ChatGPT mengalami masalah cache karena bug di pustaka open source, yang akhirnya menyebabkan bocornya informasi pembayaran ratusan juta pengguna berbayar ChatGPT - pengguna ChatGPT Plus, termasuk nama, alamat email, dan nomor kartu kredit Empat digit dan tanggal kedaluwarsa kartu kredit, dll.
Terpengaruh oleh hal ini, Komisi Perdagangan Federal AS juga mulai menyelidiki apakah OpenAI melanggar undang-undang perlindungan konsumen pada bulan Juli, dan meminta OpenAI untuk memberikan informasi tentang pemrosesan data pribadinya, kemungkinan memberikan informasi yang tidak akurat kepada pengguna, dan "menyebabkan kerugian bagi konsumen (termasuk risiko kerusakan reputasi) didokumentasikan dengan baik.
**Dengan bantuan penerapan lokal terminal ponsel untuk menghilangkan kekhawatiran tentang kebocoran informasi, pengguna dapat merasa lebih nyaman dan dengan berani memasukkan lebih banyak data pribadi ke model besar. Ini juga memiliki keunggulan kedua dari produk model besar bawaan ponsel, yaitu untuk membuat asisten pribadi yang benar-benar dipersonalisasi. **
**Selain itu, produk model besar yang disertakan dengan ponsel memiliki lingkungan pengoperasian yang lebih stabil daripada ChatGPT. **
Pada bulan April tahun ini, ChatGPT Plus ditangguhkan untuk pembayaran Alasan yang diberikan oleh OpenAI adalah "permintaan terlalu besar", yang mengakibatkan kesenjangan sumber daya komputasi. Dengan bantuan penerapan lokal, model besar yang disertakan dengan ponsel akan sangat mengurangi ketergantungan pada sumber daya komputasi awan, untuk menghindari terjadinya peristiwa "waktu henti", dan bahkan berjalan offline saat jaringan terputus.
Asisten suara telah menjadi pintu masuk prioritas bagi banyak produsen ponsel untuk mengimplementasikan model berskala besar. Dengan dukungan kemampuan model besar, asisten suara dapat membantu pengguna membuat copywriting secara otomatis, menulis email balasan secara otomatis, membuat ringkasan artikel secara otomatis, dan menerjemahkan...
Bahkan dengan bantuan fungsi plug-in, asisten suara yang didukung oleh model besar juga dapat menyelesaikan panggilan fungsi lintas aplikasi, seperti aplikasi peta mobilisasi, aplikasi perjalanan dan aplikasi cuaca, dll., untuk membantu pengguna membuat rencana perjalanan atau memesan restoran.
Dibandingkan dengan kumpulan asisten suara yang lahir lebih dari sepuluh tahun yang lalu, model terbesar seperti katalis, yang secara langsung mengarahkan Siri ke versi 2.0, dan diharapkan dapat memecahkan masalah yang telah berulang kali dikritik oleh asisten suara manusia sebagai "keterbelakangan mental buatan". ". **
Setelah ChatGPT keluar, CEO Microsoft Satya Nadella pernah mengeluh: "Apakah itu Cortana, Alexa, Asisten Google, atau Siri, asisten suara ini sebodoh batu."
Menurut laporan media, para insinyur Apple berharap untuk menggabungkan model besar dengan Siri, dan juga berharap untuk meluncurkan Siri yang lebih pintar.
Menurut Dr. Ding Lei, seorang pakar kecerdasan buatan, salah satu alasan mengapa asisten suara generasi sebelumnya tidak cerdas adalah karena sistem teknis di belakangnya berbeda.
**Siri versi 1.0 dapat dianggap sebagai AI pembuat keputusan. Tugas utamanya adalah "memberi label" pada data yang ada. **Untuk membedakan berbagai jenis data, tugas utamanya adalah "menilai apakah itu benar" dan "membedakan apakah ini atau tidak." Itu" pekerjaan. Setelah permintaan eksternal melebihi pustaka tag yang ada, asisten suara akan membalas dengan jawaban dari bawah ke atas seperti "Saya tidak bisa menjawab" dan "Saya masih belajar" untuk melanjutkan percakapan.
**Versi Siri 2.0 adalah AI generatif, yang akan "membuat" konten baru setelah meringkas dan menganalisis data yang ada, **menyadari efek "menggambar kesimpulan dari satu contoh" dan mempertimbangkan minat pengguna sambil melanjutkan dialog Gunakan pengalaman.
Huawei dan Apple bukan satu-satunya pabrikan yang mendaftarkan model besar di ponsel.
Dari segi pabrikan ponsel dalam negeri, Xiaomi adalah yang paling mementingkan model besar selain Huawei. Pada bulan April tahun ini, Xiaomi secara resmi membentuk tim model skala besar dengan skala lebih dari 30 orang, dan mengatakan bahwa diharapkan untuk meluncurkan produk tersebut pada kuartal ketiga tahun ini.
Terungkap bahwa OPPO sedang membangun produk model skala besar untuk ponsel berdasarkan model besar Ali. Zhao Ming, CEO Honor, juga sering menyatakan kepada dunia luar, "Di masa mendatang, kami akan menjadi yang pertama memperkenalkan model besar ke ponsel."
Untuk menjadi yang pertama mengusung produk skala besar di ponsel, Samsung terungkap sedang mempertimbangkan rencana untuk mengubah mesin pencari bawaan ponselnya dari Google ke Microsoft Bing.
Untuk memulihkan pelarian Samsung sebanyak mungkin, di satu sisi, Google mencoba memutakhirkan mesin pencari yang ada dan menambahkan kemampuan model skala besar; di sisi lain, ia mulai mengintegrasikan produk model skala besar dari dasar sistem.
** Pada bulan Mei tahun ini, generasi baru model skala besar PaLM 2 yang dirilis oleh Google menyertakan solusi Gecko level parameter minimum. Menurut CEO Google Pichai, "Gecko" akan bisa berjalan di ponsel, dan kecepatannya cukup cepat. **
Pada paruh kedua tahun ini, model Pixel baru Google akan memasukkan versi tokek skala besar PaLM2 terbaru. Pixel selalu menjadi yang terdepan dalam eksperimen Google dengan fitur Android baru. Saat itu, terlepas dari apakah pabrikan ponsel dalam negeri memiliki kemampuan untuk mengembangkan sendiri model besar, mereka akan dapat langsung memperoleh kekuatan ajaib model besar dari sistem Android Google. **
Selain upaya dari pengembang sistem, produsen chip terkemuka juga mengkhawatirkan penggunaan model besar untuk ponsel. **
** MediaTek mengharapkan Dimensity 9300 yang dirilis pada bulan Oktober tahun ini akan mendukung operasi model skala besar; Qualcomm mengatakan akan dapat mendukung model AI generatif dengan 10 miliar parameter untuk berjalan di ponsel dalam tahun ini. **
Menurut eksekutif Qualcomm, "Model dengan level parameter 10 miliar hingga 15 miliar dapat mencakup sebagian besar kasus penggunaan AI generatif. Jika terminal sudah dapat mendukung level parameter ini, maka semua perhitungan dapat dilakukan di terminal tanpa cloud memproses. ..Kemudian ponsel akan menjadi asisten pribadi sejati."
Selain itu, setelah Meta meluncurkan Llama 2 model besar open source, Qualcomm selanjutnya menyatakan akan bekerja sama dengan Meta untuk meluncurkan "versi seluler Llama 2" pada tahun 2024 untuk membantu pelanggan membangun asisten virtual cerdas, aplikasi produktivitas, alat pembuatan konten, dan Kasus penggunaan seperti hiburan.
Dibandingkan dengan daya komputasi ribuan kartu berbasis cloud dan server cluster paralel, keunggulan penyebaran smartphone secara lokal pada gilirannya menjadi kerugian yang membatasi perluasan daya komputasi.
Versi terkecil dari model Llama open source Meta juga memiliki 7 miliar parameter, dengan konfigurasi smartphone saat ini, sama sekali tidak dapat berjalan lancar di memori yang ada, hanya dapat dijalankan sebagian di memori flash ponsel, tetapi ini juga menyebabkan kecepatan respons yang lambat dari model besar. .
Sebelumnya, di komunitas open source, beberapa pengembang mem-porting model besar Llama ke ponsel, tetapi proses menunggu umpan balik memakan waktu hingga sepuluh menit atau lebih.
** Untuk meningkatkan efisiensi umpan balik, selain memperkuat konfigurasi perangkat keras seperti chip dan memori, pengembang mulai menjalankan rencana pelangsingan untuk model besar di ponsel, termasuk namun tidak terbatas pada pemangkasan, kuantisasi, distilasi, dll. Di bawah premis untuk sangat mengurangi keakuratan, kurangi konsumsi sumber daya dan energi yang diperlukan oleh model besar di ponsel: **Pemangkasan, yaitu memotong parameter dalam model yang berdampak kecil pada keakuratan ; kuantisasi, menggunakan tipe data presisi rendah untuk penalaran ; Distilasi adalah untuk mengekstraksi model serupa tetapi lebih sederhana dari model yang kompleks.
Namun, dalam kasus GPT-4 dengan triliunan parameter masih tidak dapat menyelesaikan omong kosong model besar, bagaimana cara mengurangi pembuatan konten palsu untuk model besar di ponsel yang secara aktif mengurangi akurasi setelah perampingan, dan jumlah parameter hanya 1% dari GPT-4. Untuk memberi tanda tanya.
Ding Lei mengatakan bahwa untuk produk model skala besar seperti ChatGPT, masih banyak kesalahan dan ketidakjelasan logika dalam konten yang dihasilkan, dan beberapa skenario tidak dapat langsung diterapkan pada tingkat eksekusi. **
Jika model besar di sisi ponsel membantu pengguna membuat rencana perjalanan atau memesan informasi restoran, kesalahan yang sering terjadi pasti akan memengaruhi frekuensi penggunaan pengguna secara langsung. Dalam hal ini, ChatGPT sudah menjadi pelajaran untuk masa lalu.
Setelah enam bulan pertumbuhan berkelanjutan, data pemantauan dari situs web pihak ketiga, SimilarWeb, menunjukkan bahwa pada bulan Juni tahun ini, lalu lintas global situs web dan klien seluler ChatGPT menurun sebesar 9,7% bulan ke bulan. Ini adalah pertama kalinya ChatGPT memiliki mengalami pertumbuhan traffic negatif sejak dirilis pada 30 November 2022.
Dalam pandangan mantan ilmuwan OpenAI Kenneth Stanley, produk model berskala besar saat ini belum berevolusi menjadi momen iPhone. "Generative AI benar-benar menggemparkan dunia, dan memang benar bahwa beberapa orang menggunakannya setiap hari, tapi saya pikir kita masih dalam tahap eksplorasi untuk mencari tahu bagaimana kita dapat menggunakannya secara individual. Jika kita semua menemukan yang benar-benar kuat alasan untuk menggunakannya kapan saja, dan itu harus menjadi momen iPhone."
Referensi:
"Model besar akan ke terminal, bagaimana dengan chipnya?" 》Pengamatan Industri Semikonduktor
"Rencana AI besar Google: membuat model besar lebih kecil dan menyematkan setiap produk" LatePost
"Wawancara dengan penanggung jawab AI Qualcomm: Diharapkan untuk mendukung model skala besar dengan puluhan miliar parameter untuk berjalan di ponsel dalam tahun ini" The Paper
Model besar "perampingan" ke ponsel, iPhone berikutnya akan datang? 》Ledakan Metaverse
"Dialog dengan Ilmuwan OpenAI: Waktu iPhone Belum Tiba" Pengamat Ekonomi
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Dalam pertarungan model besar, Huawei untuk sementara berada di depan Apple
Sumber asli: Keuangan Beras Kotak
Pengarang: Zhao Jinjie
Setelah beberapa bulan angin dari "semua aplikasi layak dilakukan ulang dengan model besar", semua terminal juga ingin menggunakan model besar untuk membentuk kembali daya saing mereka.
Huawei telah menjadi pabrikan pertama di industri ponsel yang memberikan jadwal khusus untuk implementasi model besar. Baru-baru ini, dengan HarmonyOS 4.0 mengakses kemampuan model skala besar Pangu, Xiaoyi, asisten suara bawaan di ponsel Huawei, telah menjadi asisten cerdas pertama dengan kemampuan model skala besar AI, dan akan dibuka untuk pengujian pada akhir Agustus .
Menurut kemajuan di atas, seri Huawei Mate 60 yang akan dirilis pada paruh kedua tahun ini juga akan dilengkapi dengan kemampuan model skala besar, dan diharapkan menjadi nilai jual utama terhadap seri iPhone 15 Apple. **
**Sebelum model besar, chip 5G pernah dianggap oleh dunia luar sebagai senjata rahasia Huawei melawan iPhone 15 baru. **Menurut laporan online, ponsel 5G Huawei diperkirakan akan kembali pada Oktober tahun ini. Namun, dibandingkan dengan kemampuan model skala besar yang diharapkan, waktu peluncuran ponsel 5G Huawei masih menghadapi banyak ketidakpastian.
Saat ini, Qualcomm dan MediaTek berturut-turut menyatakan belum mendapatkan persetujuan dari pemerintah AS untuk menjual chipset ke Huawei. Sekalipun kabar kembalinya ponsel 5G Huawei menjadi kenyataan, daya saingnya tidak optimis, karena kemungkinan besar akan bekerja sama dengan SMIC untuk mencapai alternatif lokalisasi yang lengkap, dan harganya proses pembuatan chip hanya bisa mencapai paling banyak level 7nm Dibandingkan dengan 3nm pada iPhone 15, ini tertinggal dua era dalam hal iterasi teknologi.
Dibandingkan dengan status quo chip 5G terbelakang, Huawei sebenarnya berada di depan Apple dalam hal model besar.
Meskipun CEO Apple Cook juga menganggap iPhone dan perangkat keras lainnya sebagai pembawa bagi perusahaan untuk menampilkan teknologi AI, dan mengakui gelombang besar perubahan yang dibawa oleh kecerdasan buatan, Apple cukup berhati-hati dalam pengembangan model besar. "Kami akan terus memasukkannya ke dalam produk kami dengan sangat hati-hati."
Menurut reporter teknologi Bloomberg, Mark Gurman, Apple diam-diam mengembangkan produk AI secara internal, dan telah menetapkan kerangka kerja model berskala besar "Ajax", dan telah mencoba menerapkannya pada fungsi produk seperti peta dan Siri. rilis "Apple GPT" ke konsumen belum.
**Dalam sepuluh tahun terakhir, produsen ponsel domestik telah memimpin dua perubahan produk utama: gelombang layar penuh yang diluncurkan pada tahun 2016 pernah mendorong iPhone keluar dari lima besar di pasar Cina; gelombang layar lipat yang diluncurkan pada tahun 2019 tidak dasar-dasar iPhone belum terguncang. **
**Sebagai peluang baru lainnya untuk perubahan produk, apakah model besar akan menjadi "momen layar penuh" yang mempromosikan mempopulerkan produsen ponsel dalam negeri, atau "dilema layar lipat" yang dibatasi oleh ceruk? **
**Dibandingkan dengan aplikasi pihak ketiga seperti ChatGPT dan Wenxin Yiyan yang telah masuk ke ponsel, keunggulan paling langsung dari produk model berskala besar yang dibangun langsung ke dalam sistem ponsel terletak pada perlindungan privasi dan keamanan yang lebih kuat. **
Dibandingkan dengan aplikasi seperti ChatGPT yang memproses data di cloud, penerapan terminal pintar yang dilokalkan dapat menghilangkan kekhawatiran pengguna tentang kebocoran privasi hingga batas maksimal.
Pada bulan Maret tahun ini, ChatGPT mengalami masalah cache karena bug di pustaka open source, yang akhirnya menyebabkan bocornya informasi pembayaran ratusan juta pengguna berbayar ChatGPT - pengguna ChatGPT Plus, termasuk nama, alamat email, dan nomor kartu kredit Empat digit dan tanggal kedaluwarsa kartu kredit, dll.
Terpengaruh oleh hal ini, Komisi Perdagangan Federal AS juga mulai menyelidiki apakah OpenAI melanggar undang-undang perlindungan konsumen pada bulan Juli, dan meminta OpenAI untuk memberikan informasi tentang pemrosesan data pribadinya, kemungkinan memberikan informasi yang tidak akurat kepada pengguna, dan "menyebabkan kerugian bagi konsumen (termasuk risiko kerusakan reputasi) didokumentasikan dengan baik.
**Dengan bantuan penerapan lokal terminal ponsel untuk menghilangkan kekhawatiran tentang kebocoran informasi, pengguna dapat merasa lebih nyaman dan dengan berani memasukkan lebih banyak data pribadi ke model besar. Ini juga memiliki keunggulan kedua dari produk model besar bawaan ponsel, yaitu untuk membuat asisten pribadi yang benar-benar dipersonalisasi. **
**Selain itu, produk model besar yang disertakan dengan ponsel memiliki lingkungan pengoperasian yang lebih stabil daripada ChatGPT. **
Pada bulan April tahun ini, ChatGPT Plus ditangguhkan untuk pembayaran Alasan yang diberikan oleh OpenAI adalah "permintaan terlalu besar", yang mengakibatkan kesenjangan sumber daya komputasi. Dengan bantuan penerapan lokal, model besar yang disertakan dengan ponsel akan sangat mengurangi ketergantungan pada sumber daya komputasi awan, untuk menghindari terjadinya peristiwa "waktu henti", dan bahkan berjalan offline saat jaringan terputus.
Asisten suara telah menjadi pintu masuk prioritas bagi banyak produsen ponsel untuk mengimplementasikan model berskala besar. Dengan dukungan kemampuan model besar, asisten suara dapat membantu pengguna membuat copywriting secara otomatis, menulis email balasan secara otomatis, membuat ringkasan artikel secara otomatis, dan menerjemahkan...
Bahkan dengan bantuan fungsi plug-in, asisten suara yang didukung oleh model besar juga dapat menyelesaikan panggilan fungsi lintas aplikasi, seperti aplikasi peta mobilisasi, aplikasi perjalanan dan aplikasi cuaca, dll., untuk membantu pengguna membuat rencana perjalanan atau memesan restoran.
Dibandingkan dengan kumpulan asisten suara yang lahir lebih dari sepuluh tahun yang lalu, model terbesar seperti katalis, yang secara langsung mengarahkan Siri ke versi 2.0, dan diharapkan dapat memecahkan masalah yang telah berulang kali dikritik oleh asisten suara manusia sebagai "keterbelakangan mental buatan". ". **
Setelah ChatGPT keluar, CEO Microsoft Satya Nadella pernah mengeluh: "Apakah itu Cortana, Alexa, Asisten Google, atau Siri, asisten suara ini sebodoh batu."
Menurut laporan media, para insinyur Apple berharap untuk menggabungkan model besar dengan Siri, dan juga berharap untuk meluncurkan Siri yang lebih pintar.
Menurut Dr. Ding Lei, seorang pakar kecerdasan buatan, salah satu alasan mengapa asisten suara generasi sebelumnya tidak cerdas adalah karena sistem teknis di belakangnya berbeda.
**Siri versi 1.0 dapat dianggap sebagai AI pembuat keputusan. Tugas utamanya adalah "memberi label" pada data yang ada. **Untuk membedakan berbagai jenis data, tugas utamanya adalah "menilai apakah itu benar" dan "membedakan apakah ini atau tidak." Itu" pekerjaan. Setelah permintaan eksternal melebihi pustaka tag yang ada, asisten suara akan membalas dengan jawaban dari bawah ke atas seperti "Saya tidak bisa menjawab" dan "Saya masih belajar" untuk melanjutkan percakapan.
**Versi Siri 2.0 adalah AI generatif, yang akan "membuat" konten baru setelah meringkas dan menganalisis data yang ada, **menyadari efek "menggambar kesimpulan dari satu contoh" dan mempertimbangkan minat pengguna sambil melanjutkan dialog Gunakan pengalaman.
Huawei dan Apple bukan satu-satunya pabrikan yang mendaftarkan model besar di ponsel.
Dari segi pabrikan ponsel dalam negeri, Xiaomi adalah yang paling mementingkan model besar selain Huawei. Pada bulan April tahun ini, Xiaomi secara resmi membentuk tim model skala besar dengan skala lebih dari 30 orang, dan mengatakan bahwa diharapkan untuk meluncurkan produk tersebut pada kuartal ketiga tahun ini.
Terungkap bahwa OPPO sedang membangun produk model skala besar untuk ponsel berdasarkan model besar Ali. Zhao Ming, CEO Honor, juga sering menyatakan kepada dunia luar, "Di masa mendatang, kami akan menjadi yang pertama memperkenalkan model besar ke ponsel."
Untuk menjadi yang pertama mengusung produk skala besar di ponsel, Samsung terungkap sedang mempertimbangkan rencana untuk mengubah mesin pencari bawaan ponselnya dari Google ke Microsoft Bing.
Untuk memulihkan pelarian Samsung sebanyak mungkin, di satu sisi, Google mencoba memutakhirkan mesin pencari yang ada dan menambahkan kemampuan model skala besar; di sisi lain, ia mulai mengintegrasikan produk model skala besar dari dasar sistem.
** Pada bulan Mei tahun ini, generasi baru model skala besar PaLM 2 yang dirilis oleh Google menyertakan solusi Gecko level parameter minimum. Menurut CEO Google Pichai, "Gecko" akan bisa berjalan di ponsel, dan kecepatannya cukup cepat. **
Pada paruh kedua tahun ini, model Pixel baru Google akan memasukkan versi tokek skala besar PaLM2 terbaru. Pixel selalu menjadi yang terdepan dalam eksperimen Google dengan fitur Android baru. Saat itu, terlepas dari apakah pabrikan ponsel dalam negeri memiliki kemampuan untuk mengembangkan sendiri model besar, mereka akan dapat langsung memperoleh kekuatan ajaib model besar dari sistem Android Google. **
Selain upaya dari pengembang sistem, produsen chip terkemuka juga mengkhawatirkan penggunaan model besar untuk ponsel. **
** MediaTek mengharapkan Dimensity 9300 yang dirilis pada bulan Oktober tahun ini akan mendukung operasi model skala besar; Qualcomm mengatakan akan dapat mendukung model AI generatif dengan 10 miliar parameter untuk berjalan di ponsel dalam tahun ini. **
Menurut eksekutif Qualcomm, "Model dengan level parameter 10 miliar hingga 15 miliar dapat mencakup sebagian besar kasus penggunaan AI generatif. Jika terminal sudah dapat mendukung level parameter ini, maka semua perhitungan dapat dilakukan di terminal tanpa cloud memproses. ..Kemudian ponsel akan menjadi asisten pribadi sejati."
Selain itu, setelah Meta meluncurkan Llama 2 model besar open source, Qualcomm selanjutnya menyatakan akan bekerja sama dengan Meta untuk meluncurkan "versi seluler Llama 2" pada tahun 2024 untuk membantu pelanggan membangun asisten virtual cerdas, aplikasi produktivitas, alat pembuatan konten, dan Kasus penggunaan seperti hiburan.
Dibandingkan dengan daya komputasi ribuan kartu berbasis cloud dan server cluster paralel, keunggulan penyebaran smartphone secara lokal pada gilirannya menjadi kerugian yang membatasi perluasan daya komputasi.
Versi terkecil dari model Llama open source Meta juga memiliki 7 miliar parameter, dengan konfigurasi smartphone saat ini, sama sekali tidak dapat berjalan lancar di memori yang ada, hanya dapat dijalankan sebagian di memori flash ponsel, tetapi ini juga menyebabkan kecepatan respons yang lambat dari model besar. .
** Untuk meningkatkan efisiensi umpan balik, selain memperkuat konfigurasi perangkat keras seperti chip dan memori, pengembang mulai menjalankan rencana pelangsingan untuk model besar di ponsel, termasuk namun tidak terbatas pada pemangkasan, kuantisasi, distilasi, dll. Di bawah premis untuk sangat mengurangi keakuratan, kurangi konsumsi sumber daya dan energi yang diperlukan oleh model besar di ponsel: **Pemangkasan, yaitu memotong parameter dalam model yang berdampak kecil pada keakuratan ; kuantisasi, menggunakan tipe data presisi rendah untuk penalaran ; Distilasi adalah untuk mengekstraksi model serupa tetapi lebih sederhana dari model yang kompleks.
Namun, dalam kasus GPT-4 dengan triliunan parameter masih tidak dapat menyelesaikan omong kosong model besar, bagaimana cara mengurangi pembuatan konten palsu untuk model besar di ponsel yang secara aktif mengurangi akurasi setelah perampingan, dan jumlah parameter hanya 1% dari GPT-4. Untuk memberi tanda tanya.
Ding Lei mengatakan bahwa untuk produk model skala besar seperti ChatGPT, masih banyak kesalahan dan ketidakjelasan logika dalam konten yang dihasilkan, dan beberapa skenario tidak dapat langsung diterapkan pada tingkat eksekusi. **
Jika model besar di sisi ponsel membantu pengguna membuat rencana perjalanan atau memesan informasi restoran, kesalahan yang sering terjadi pasti akan memengaruhi frekuensi penggunaan pengguna secara langsung. Dalam hal ini, ChatGPT sudah menjadi pelajaran untuk masa lalu.
Setelah enam bulan pertumbuhan berkelanjutan, data pemantauan dari situs web pihak ketiga, SimilarWeb, menunjukkan bahwa pada bulan Juni tahun ini, lalu lintas global situs web dan klien seluler ChatGPT menurun sebesar 9,7% bulan ke bulan. Ini adalah pertama kalinya ChatGPT memiliki mengalami pertumbuhan traffic negatif sejak dirilis pada 30 November 2022.
Dalam pandangan mantan ilmuwan OpenAI Kenneth Stanley, produk model berskala besar saat ini belum berevolusi menjadi momen iPhone. "Generative AI benar-benar menggemparkan dunia, dan memang benar bahwa beberapa orang menggunakannya setiap hari, tapi saya pikir kita masih dalam tahap eksplorasi untuk mencari tahu bagaimana kita dapat menggunakannya secara individual. Jika kita semua menemukan yang benar-benar kuat alasan untuk menggunakannya kapan saja, dan itu harus menjadi momen iPhone."
Referensi:
"Model besar akan ke terminal, bagaimana dengan chipnya?" 》Pengamatan Industri Semikonduktor
"Rencana AI besar Google: membuat model besar lebih kecil dan menyematkan setiap produk" LatePost
"Wawancara dengan penanggung jawab AI Qualcomm: Diharapkan untuk mendukung model skala besar dengan puluhan miliar parameter untuk berjalan di ponsel dalam tahun ini" The Paper
Model besar "perampingan" ke ponsel, iPhone berikutnya akan datang? 》Ledakan Metaverse
"Dialog dengan Ilmuwan OpenAI: Waktu iPhone Belum Tiba" Pengamat Ekonomi