Komersialisasi model besar serba guna masih awal, dan AI generatif baru saja dimulai

2023-07-31 07:06:57

Sumber: Media Titanium

Pengarang: Qin Conghui

Sumber gambar: Dihasilkan oleh AI Tak Terbatas

Dari pengejaran fanatik hingga kembali ke ketenangan, pandangan orang tentang model besar diam-diam berubah. Di satu sisi, karena kepatuhan, peraturan, dan alasan lainnya, akan memakan waktu untuk komersialisasi model skala besar tujuan umum; di sisi lain, pihak industri baru mulai berinvestasi di bidang percontohan seperti keuangan dan perawatan medis, dan efeknya tidak dapat segera terlihat.

Jadi, ketika spiral gila itu berangsur-angsur melambat, suara-suara yang berbeda secara bertahap menggambarkan gambaran "model besar" yang sebenarnya.

Di antara mereka, apakah akan menggunakan "model skala besar umum" atau "model skala besar industri", setiap perusahaan telah membuat pilihan setelah beberapa pertimbangan; dan dengan kompetisi model skala besar, "AI generatif" telah memasuki sorotan. Harus dikatakan bahwa ChatGPT tidak lebih dari sebuah kesempatan untuk pengembangan industri kecerdasan buatan untuk memasuki tahap baru, dan itu akan mendorong AI kembali ke pusat zaman.

Pertarungan antara model umum dan model industri

ChatGPT membuat industri menyadari kekuatan besar model besar untuk tujuan umum, dan ini menyebabkan tontonan bisnis "Perang Seratus Model" di masa depan. Banyak investor dan pengusaha tidak dapat tidur karena ini, dan sumber daya GPU menjadi "Kertas Luoyang mahal" untuk sementara waktu.

Di antara mereka, ada banyak perusahaan teknologi di industri teratas yang terpaksa pergi ke "Liangshan". Orang dalam industri model skala besar pernah mengungkapkan kepada Titanium Media App situasi perusahaannya saat ini: "Jika tidak ada model skala besar, terlalu memalukan untuk keluar dan membicarakannya. Ayo lakukan sekarang, dan itu adalah sulit dijelaskan jika tidak ada model skala besar." Jadi mereka hanya dapat merilis berita bahwa mereka sedang mengerjakan model skala besar tujuan umum ke dunia luar, dan pada saat yang sama mempercepat penelitian dan pengembangan. kemajuan secara internal.

Namun, model besar secara umum adalah tugas yang memakan waktu dan padat karya.OpenAI membutuhkan 6 tahun untuk mengulang GPT1.Memulai pelatihan bertahun-tahun yang lalu. Oleh karena itu, jika tidak ada akumulasi dasar dalam teknologi dan data AI, sangat sulit untuk mewujudkan komersialisasi model besar secara umum dalam jangka pendek.

Selain itu, model besar tujuan umum secara alami membutuhkan data publik untuk pelatihan, dan menempatkan datanya sendiri ke dalam model besar tujuan umum juga berarti bahwa data akan dibagikan secara default. Oleh karena itu, beberapa industri dengan persyaratan privasi data yang tinggi tidak mungkin mengakses model besar tujuan umum tanpa persiapan.

Dalam keadaan seperti itu, model besar industri telah menjadi "solusi terbaik kedua" industri selain model besar umum, dan dapat menikmati dividen model besar lebih cepat. Zhou Hongyi, pendiri 360 Group, juga berkata terus terang: "Peluang masa depan untuk model skala besar kecerdasan buatan terletak pada pasar inkremental tingkat perusahaan, dan "vertikalisasi" model skala besar adalah arah pengembangan." A eksekutif teknis dari sebuah pabrik besar juga memberi tahu Titanium Media App. "Dari perspektif perencanaan model skala besar kami, kami akan terus mengulangi model skala besar tujuan umum, dan terus melapisi dasar ini untuk pelatihan model skala besar vertikal industri."

Belum lama ini, pada World Artificial Intelligence Conference 2023, Tang Daosheng, Senior Executive Vice President Tencent Group dan CEO Cloud and Smart Industry Business Group, juga menyatakan bahwa penerapan model skala besar perusahaan perlu mempertimbangkan profesionalisme industri secara komprehensif , keamanan data, iterasi terus menerus dan biaya komprehensif.Dan faktor lainnya. Berdasarkan model industri besar, membangun model eksklusif Anda sendiri mungkin merupakan opsi yang lebih baik untuk perusahaan. Alasannya adalah bahwa model besar industri membutuhkan lebih sedikit parameter daripada model besar tujuan umum, biaya pelatihan dan penalaran lebih rendah, dan pengoptimalan model lebih mudah.

Namun, Titanium Media App juga belajar dari orang-orang di industri bahwa dalam beberapa kasus, model besar untuk keperluan umum bukanlah kondisi yang diperlukan untuk model skala besar vertikal, yang berarti bahwa platform untuk model skala industri pelatihan tidak memiliki untuk menggunakan model skala besar tujuan umum sebagai basis. "Jika model skala besar umum yang didefinisikan adalah model dengan ratusan miliar parameter, maka model skala besar umum bukanlah syarat yang diperlukan untuk model industri skala besar." Dalam sebuah pertukaran, seorang eksekutif perusahaan besar model industri skala kepada Titanium Media App. Namun, dia juga mengatakan bahwa meskipun model besar untuk tujuan umum bukanlah kondisi yang diperlukan untuk model industri skala besar, berbagai teknologi dasar untuk melatih model besar untuk tujuan umum, seperti Transformer, juga merupakan elemen penting untuk melatih model industri skala besar. .

Secara konstan parameter "100 miliar", "mengabaikan" hubungan dengan model besar umum, ambang model besar vertikal telah diturunkan lebih jauh, yang memberikan lebih banyak kemungkinan untuk pengembangan AI generatif lebih lanjut.

Selain model besar, AI generatif juga patut diperhatikan

Setiap kali datang ke model besar, AI generatif (Generatif Al) akan berjalan seiring. Cukup pahami hubungan antara keduanya - model besar dapat dipahami sebagai mesin yang mewujudkan AI generatif, yaitu kemampuan AI generatif disediakan oleh model pembelajaran mesin atau model besar, dan AI generatif lebih tinggi daripada model besar, dan AI generatif dapat Bergantung pada skenario yang diperlukan, Anda dapat memutuskan model besar mana yang akan dipanggil.ChatGPT adalah salah satu aplikasi tipikal AI generatif.

Pada awal tahun 2020, AI generatif terpilih ke dalam Gartner Emerging Technology Hype Cycle, dan pada tahun 2022, AI generatif terdaftar sebagai salah satu tren teknologi strategis utama, dan teknologi tersebut telah memasuki puncak ekspektasi yang meningkat dari tahap pemicu inovasi. Gartner percaya bahwa AI generatif akan menjadi teknologi tujuan umum, dengan dampak yang mirip dengan mesin uap, listrik, dan Internet. Saat AI generatif diterapkan secara bertahap, hype seputar konsep tersebut secara bertahap akan memudar, dan dampaknya terhadap orang dan perusahaan dalam pekerjaan dan kehidupan sehari-hari mereka akan meningkat.

Kredit gambar @Gartner

Raksasa komputasi awan global Amazon Cloud Technology juga menempatkan lebih banyak pena dan tinta pada AI generatif Adam Selipsky, CEO Amazon Cloud Technology, mengatakan dalam sebuah wawancara eksklusif dengan Bloomberg, CNBC dan media lainnya: "AI Generatif sangat penting dalam chatbots dan pencarian . Keuntungan penerapan AI generatif sudah jelas bagi semua orang, tetapi ini hanyalah puncak gunung es dari banyak kemungkinan. Di masa mendatang, AI generatif akan membawa perubahan di semua lapisan masyarakat." Ia menganggap AI generatif sebagai "terobosan " berubah, dan itu mungkin perubahan terbesar sejak lahirnya Internet.

“Bayangkan, di era ketika komputer menggunakan punched card sebagai antarmuka, hanya sedikit ilmuwan yang memiliki kemampuan untuk menggunakan komputer; ketika antarmuka grafis dan mouse menjadi antarmuka interaksi manusia-komputer, semua orang dapat menggunakan komputer.” Kata Adam Selipsky.

Jadi, dengan cara apa perubahan yang ditimbulkan oleh AI generatif akan tercermin?

Dapat dilihat bahwa di bidang otomotif, beberapa perusahaan telah menggunakan AI generatif untuk mensintesis data pelatihan mengemudi otonom untuk mempercepat proses pelatihan; di bidang manufaktur, AI generatif dapat membantu menganalisis data telemetri IoT dalam jumlah besar, melakukan prediksi pemeliharaan, dan mengurangi jalur produksi dari downtime. Mengandalkan AI generatif, Autodesk bekerja sama dengan produsen pesawat berhasil menyelesaikan sebagian desain sekat dan memperkenalkan desain baru yang 45% lebih ringan. Jika flight wall ini diterapkan pada armada global, maka akan menghemat bahan bakar setara dengan konsumsi bahan bakar 93.000 mobil.

Namun, perlu ditekankan bahwa AI generatif yang diandalkan Autodesk bukanlah model besar tertentu, melainkan alat desain berbasis AI yang dibangun dengan model pembelajaran mesin.

Oleh karena itu, untuk realisasi AI generatif, model besar hanyalah pilihan, dan ke depan tidak akan didominasi oleh model besar. Titanium Media App prihatin bahwa ketika sebagian besar perusahaan mempertimbangkan untuk mengakses model skala besar, mereka tidak langsung memasukkan satu model skala besar, tetapi memilih untuk mengakses banyak model. Jadi di antara model besar ini, kerja sama antara model besar vertikal dan model besar umum mungkin tidak dikesampingkan di masa mendatang.

Ambil UFIDA dan WPS, dua perangkat lunak domestik, sebagai contoh. UFIDA baru-baru ini merilis YonGPT, model layanan perusahaan besar. Menurut Titanium Media App, basis model besar umum yang rencananya akan diakses oleh YonGPT termasuk Zhipu ChatGLM, Wenxinyiyan dan Zhiyuan Wudao Tianying dll. ; WPS sebelumnya telah meluncurkan WPS AI Menurut berita terbaru, basis model skala besar umum WPS AI di Cina daratan adalah MiniMax, dan versi luar negeri yang baru diluncurkan didukung oleh OpenAI dan PaLM2.

Dalam dunia AI generatif, seseorang tidak bergantung pada model besar, dan bukan hanya model besar yang menentukan keberhasilan AI generatif.

Tidak dapat disangkal bahwa penerapan AI generatif juga merupakan hasil dari banyak aspek, dan tantangan "sekunder" seputar implementasi AI generatif sedang terungkap.

Tantangan "Sekunder" di bawah AI generatif

"Katakan ke ponsel 'Jika kucing berlari di sofa, ingatkan saya', lalu saat kucing berlari di sofa, ponsel akan menerima pesan alarm." Penyedia solusi video senior Shandong Zhongwei Century Technology Co., Ltd Wakil Presiden Wang Zhengbin menyebutkan skenario penerapan deteksi video cerdas di rumah pintar dalam pidatonya.

Tapi itu adalah pemandangan yang tampaknya sederhana, selain model besar multi-modal di belakangnya, jaringan dan komputasi di ujungnya juga sangat penting. “Dalam aplikasi AI generatif seperti ChatGPT, jika tingkat kehilangan paket jaringan mencapai 1%, kinerja platform pelatihan model besar akan turun hingga 5% dari kinerja puncaknya, yang berarti 95% hilang. Kemampuan jaringan Kinerja dari seluruh platform model berskala besar merupakan faktor yang sangat penting,” kata Zhang Yu, Chief Technology Officer Divisi Jaringan dan Edge Intel China dan Intel Senior Chief AI Engineer.

Diperkirakan bahwa dengan ledakan permintaan AI, penyebaran kecerdasan buatan di tepi akan menjadi tiga kali lebih tinggi dari pada database.Ini juga berarti implementasi AI tepi merupakan tantangan utama untuk langkah selanjutnya dalam pengembangan dari kecerdasan buatan.

"Biaya waktu dan tenaga kerja untuk menerapkan kecerdasan buatan ke ujung tepi seperti lini produksi pabrik masih tinggi, dan lebih dari setengah penerapan kecerdasan buatan tepi gagal." Sachin Katti, wakil presiden senior dan manajer umum Intel divisi jaringan dan tepi, baru-baru ini Ketika berbicara tentang komputasi tepi di era model besar, katanya. Di satu sisi, alasannya adalah peralatan sudah usang dan sumber daya edge computing tidak mencukupi; di sisi lain, cara menggunakan data unik mereka sendiri untuk menerapkan AI juga sangat penting. Banyak penerapan AI tepi akan tertahan oleh tantangan ini.

Pada saat yang sama, kinerja AI generatif yang lebih baik pada akhirnya perlu didukung oleh data.Saat ini, industri berharap untuk memastikan keamanan data dalam AI generatif di satu sisi, dan di sisi lain juga berharap untuk membuat data sumber yang melimpah dan tersedia.

Penyelesaian masalah ini juga sedang berlangsung. "Sistem model besar dan sistem AI saat ini sangat bergantung pada data dan merupakan sistem cerdas berbasis data. Sistem ini memiliki persyaratan yang sangat tinggi untuk keluasan dan ketidakberpihakan data. Dengan asumsi data sangat bias, sulit untuk mendukungnya secara efektif . Pengembangan sistem kecerdasan buatan." Wei Tao, wakil presiden dan chief technical security officer Ant Group, pernah berkata, sehingga terlihat sudah ada alat untuk verifikasi balik keamanan data AI.

Dalam hal pengembangan sumber data, belum lama ini, Shenzhen Digital Exchange bergabung dengan hampir 50 unit untuk membentuk "Aliansi Komputasi Terbuka", dan sponsor bersama antara lain Tencent Cloud, Huada Genomics, Yuntian Lifei, Obi Zhongguang, dan UBTECH , China Cabang Unicom Guangdong, Data Huaao dan perusahaan lain, Masyarakat Kecerdasan Buatan Shenzhen dan asosiasi lainnya, National Supercomputing Shenzhen Center dan wadah pemikir serta lembaga penelitian lainnya. Salah satu tujuan utama pembentukan Computing Alliance adalah untuk mengoordinasikan perumusan standar yang relevan seperti elemen data, tata kelola data, data pelatihan, pelabelan data, dan data sintetis seputar data pelatihan China berkualitas tinggi dan data pelatihan multi-modal. , dan membantu pertukaran data untuk meningkatkan kategori baru terkait Model dan area baru.

Tantangan yang dihadapi dalam pengembangan AI generatif tidak dapat diungkapkan dengan kata-kata, dan badai AI global yang dipicu oleh ChatGPT tidak berakhir dengan ChatGPT. Setelah dunia baru kecerdasan buatan dibuka, model besar dan AI generatif dalam masa pertumbuhannya juga mengungkap banyak masalah dan menimbulkan serangkaian tantangan, tetapi pada saat yang sama, memberikan peluang untuk eksplorasi dan inovasi ke semua lapisan masyarakat.

Industri berlomba menuju AI generatif, yang sama sekali bukan hal yang buruk untuk pengembangan kecerdasan buatan atau bahkan manusia.

Lihat Asli

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.