Peluang bisnis di bawah "kemunculan" model besar: siapa yang akan memenangkan "Perang Seratus Model"

2023-07-12 02:28:31

Sumber: Makalah

Penulis: Wartawan Makalah Huan Yanhong magang Chen Xiaorui

Sumber gambar: Dihasilkan oleh alat AI Tak Terbatas

Teknologi AI generatif mengubah industri kecerdasan buatan.Hanya dalam setengah tahun, pengembangan model skala besar domestik telah menyelesaikan lompatan dari teknologi ke produk dan kemudian ke bisnis, dan telah merambah ke industri vertikal. Selama Konferensi Kecerdasan Buatan Dunia pada 6 Juli, The Paper mengundang Wang Danjun, wakil presiden Institut Penelitian Manajemen Bakat Beisen, Yu Zhonghai, wakil manajer umum departemen penelitian CICC, dan Zhang Jie, wakil presiden Teknologi Zhongguancun Kejin, untuk ruang obrolan Metaverse untuk membahas peluang inovasi Bisnis di bawah "kemunculan" model besar. Dialog yang dibawakan oleh Shao Wen, seorang reporter dari The Paper, selama satu jam dialog tersebut, para tamu membahas sejumlah isu terkait, antara lain:

Bagaimana model besar tujuan umum dan model skala besar bidang vertikal menemukan nilai mereka sendiri dalam skenario bisnis masa depan?

Bagaimana perusahaan dapat memanfaatkan peluang bisnis model besar? Apa poin kunci untuk menangkap peluang?

Kehidupan masa lalu dan masa depan model besar

**澎湃科技: Saat ini, pasar domestik telah membentuk situasi "perang seratus model". Apakah menurut Anda mengapa model skala besar domestik berkembang begitu cepat? Apa pengaruhnya terhadap bidang Anda? **

**Wang Danjun (Wakil Presiden Institut Riset Manajemen Bakat Beisen): **Dari sudut pandang teknis, pengembangan model besar bukanlah sesuatu yang terjadi dalam dua tahun terakhir. Di bidang akademik bertahun-tahun yang lalu, semua orang sudah mulai melakukan penelitian. Hanya saja, dengan peningkatan volume data dan peningkatan level teknologi dalam beberapa tahun terakhir, terutama setelah OpenAI merilis ChatGPT, menarik perhatian luas.

Untuk setiap bidang, setiap orang berpikir tentang bagaimana menerapkan teknologi baru tersebut ke bidang mereka sendiri dan bagaimana meningkatkan model bisnis mereka.

Misalnya, Institut Riset Manajemen Bakat Beisen milik industri sumber daya manusia, dan pelanggan yang kami layani adalah semua grup perusahaan SDM (sumber daya manusia). Kami berpikir bahwa penerapan model besar di bidang sumber daya manusia dapat menghasilkan beberapa nilai yang mengganggu di masa depan, misalnya, memang dapat meningkatkan efisiensi kerja semua orang dengan lebih baik; itu akan membantu mitra kami sampai batas tertentu, apakah itu SDM atau Ini dapat memandu pengembangan karyawan dengan lebih baik; pada saat yang sama, ini juga dapat membantu perusahaan menjawab banyak pertanyaan manajemen sumber daya manusia, termasuk apa yang sering kita tanyakan saat merekrut karyawan: siapa yang lebih cocok dan siapa yang dapat memberikan lebih banyak keuntungan. Kinerja yang baik , bagaimana gaji harus ditentukan, dll. Saya pikir pengembangan dan penerapan model besar akan mengubah industri sumber daya manusia dalam waktu yang sangat singkat.

**Yu Zhonghai (Deputy General Manager Departemen Riset CICC): **Dean Wang menyebutkan poin yang sangat penting, yaitu teknologi model skala besar tidak terjadi begitu saja hari ini. Pada 2017, Google menulis makalah terkenal berjudul Attention Is All You Need (perhatian adalah semua yang Anda butuhkan), dan mengusulkan arsitektur transformer.

Faktanya, praktisi di industri kecerdasan buatan China menemukan potensi teknologi model skala besar sejak dini. Kami juga menulis laporan penelitian terkait pada tahun 2021. Saat itu, kami dikejutkan dengan perkembangan model kecerdasan buatan. Sekarang produk khusus ChatGPT membuat model besar dikenal oleh masyarakat umum, tidak peduli apakah Anda memahami teknologi atau tidak, Anda dapat merasakan pesonanya selama Anda memainkannya, sehingga model besar itu populer.

Kemampuan model besar untuk diterapkan di ribuan industri dengan begitu cepat juga bergantung pada persamaan hak dalam teknologi, yang merupakan konsep sangat penting yang kami kemukakan. Berkat pengembangan komunitas open source dan penyebaran pengetahuan secara alami, banyak perusahaan dengan cepat membuat model besar mereka sendiri.

Selain itu, saya ingin menambahkan bahwa saat ini kita telah melihat seluruh lingkaran teknologi dan bahkan seluruh masyarakat membentuk kekuatan bersama, yaitu "semua orang menganggap ini sangat penting", yang jarang terlihat di masa lalu.

**Zhang Jie (Wakil Presiden Teknologi Zhongguancun Kejin): **Saya pikir tahun pertama model besar ini dapat ditelusuri kembali ke peluncuran GPT3 pada tahun 2020. Mengapa itu berkembang begitu cepat dalam enam bulan terakhir? Menurut saya ada tiga alasan:

Aspek pertama adalah bahwa beberapa perusahaan dan universitas memiliki banyak akumulasi sebelumnya, seperti Baidu, Huawei, Universitas Tsinghua, dll., Mereka telah melatih model bahasa atau model besar sebelumnya, dan enam bulan terakhir telah menjadi pembaruan versi iterasi untuk mereka;

Aspek kedua adalah berbagai perusahaan, termasuk beberapa lembaga investasi, telah meningkatkan investasinya;

Aspek ketiga adalah mengandalkan open source Komunitas open source telah mendorong perusahaan untuk meluncurkan berbagai model domain besar.

Mengenai dampak model besar di lapangan, ini merupakan keuntungan dua arah bagi pelanggan dan kami. Zhongguancun Kejin adalah penyedia terkemuka solusi teknologi AI percakapan Model besar mengurangi biaya penyesuaian dan pengembangan berbagai model pemandangan, yang merupakan kabar baik bagi kami. Bagi pelanggan kami, pengurangan biaya proyek cerdas telah membuat banyak perusahaan kecil dan menengah mempertimbangkan untuk membangun proyek, dan seluruh pasar telah tumbuh dalam ukuran.

**澎湃科技: Baru-baru ini, Tencent Cloud dan OpenAI telah secara berturut-turut mengusulkan toko model berskala besar untuk perangkat lunak model yang disesuaikan, yang agak mirip dengan bentuk toko aplikasi. Bagaimana Anda memahami tren ini? **

**Wang Danjun:**Apakah Anda seorang investor atau praktisi di bidang ini, saya percaya semua orang berharap untuk melihat tren ini, karena ini mendorong lebih banyak orang untuk berpartisipasi dalam penciptaan bersama bidang ini. Kami percaya bahwa untuk penyedia layanan dasar, mereka pasti akan cenderung ke model toko di masa mendatang, yang akan memudahkan untuk lebih dekat dengan pelanggan. Model toko model besar juga memungkinkan pengguna menerima layanan untuk menggunakan model besar dengan lebih baik untuk membuat beberapa skenario aplikasi baru dan nilai layanan.

Yu Zhonghai: Ini sebenarnya adalah masalah yang sangat dikhawatirkan oleh pasar modal. Menurut saya, pengembangan model besar akan lebih seperti cloud publik dan cloud pribadi China di masa mendatang.

Cloud publik sebenarnya disebut IaaS (Infrastruktur-sebagai-Layanan, infrastruktur sebagai layanan) pada saat itu, ketika datang ke model besar, kami menyebutnya MaaS (Model sebagai Layanan). Ada perusahaan luar negeri terkenal bernama Hugging Face, yang menempatkan banyak model di Internet, dan Anda dapat menggunakan model AI yang berbeda hanya dengan memanggil API (Application Program Interface, antarmuka pemrograman aplikasi).

Namun, ada juga banyak perusahaan yang perlu menerapkan model skala besar mereka sendiri dan menggunakan pengetahuan mereka sendiri untuk menyempurnakannya agar dapat melakukan Fine Tune sendiri karena persyaratan seperti kepatuhan keamanan dan penerapan adegan yang dibagi. pasar di Cina. .

Secara garis besar, model besar sebenarnya tidak cocok untuk digunakan semua orang secara langsung, termasuk ChatGPT yang sebenarnya dikemas menjadi produk berbasis model besar, sehingga setiap orang biasa dapat mengalaminya. Oleh karena itu, membuat aplikasi berdasarkan model besar sebenarnya adalah pasar yang sangat luas, yang dapat menghasilkan banyak model bisnis, seperti karyawan digital, dan konsep toko aplikasi yang baru saja disebutkan oleh tuan rumah.

Bahkan, ChatGPT juga dianggap oleh banyak orang sebagai portal lalu lintas. Setahu saya, beberapa produsen ponsel skala besar mungkin juga akan berakhir dengan melakukan pencarian. Maka hal ini sama sekali berbeda. Pasar yang dapat dijangkau adalah dari perusahaan. Pengeluaran TI menjadi pengeluaran pemasaran. Perusahaan China mungkin membelanjakan rata-rata 1%-3% pendapatannya untuk TI, tetapi mungkin membelanjakan 30% pendapatannya untuk pemasaran. Jadi ketika Anda memiliki lalu lintas, model bisnisnya bisa banyak berubah, yang sangat menarik.

Zhang Jie: Menurut saya OpenAI dan Tencent Cloud memiliki penekanan yang berbeda. Fokus OpenAI mungkin masih pada model besar dasar, yang menggunakan beberapa mitra ekologis untuk membantu menutupi kurangnya akurasi atau profesionalisme model besar dasar dalam beberapa skenario yang terfragmentasi. Namun, Tencent Cloud tidak terlalu menekankan model dasarnya sendiri, tetapi menekankan perlunya menjadi model besar untuk industri vertikal.

Penekanan mereka yang berbeda menunjukkan masalah yang sama, yaitu model besar dasar tidak dapat langsung digunakan di beberapa industri atau skenario tertentu dengan profesionalisme tinggi, dan juga membutuhkan lapisan adaptasi. Saya pikir mungkin ada model bisnis baru di sini, yaitu semakin banyak pengetahuan yang dapat dikapitalisasi di masa depan. Ternyata saat semua orang menggunakan AI, paradigma teknisnya berbeda. Oleh karena itu, aset yang dapat dibagikan setiap orang adalah beberapa data mentah. Setelah mendapatkan data mentah, berbagai cara teknis digunakan untuk memprosesnya. Selama proses ini, bentuk perantara dari data tersebut tidak dapat diperdagangkan.

Namun, model besar pada dasarnya menyatukan banyak tugas AI bersama-sama, dan seluruh paradigma penelitian dan aliran pemrosesan bertemu, yang membuat banyak produk perantara dapat diperdagangkan, seperti data berlabel, data untuk penyelarasan instruksi, kata-kata cepat, dan Rantai cepat terdiri dari frase cepat , dll., dan bahkan robot atau asisten yang terlatih dalam skenario tertentu, dapat melakukan beberapa transaksi dan dikapitalisasi. Ini mungkin model bisnis baru di masa mendatang.

Model besar umum VS model besar bidang vertikal

**Teknologi Kertas: Tadi, kalian bertiga sebenarnya menyebutkan dua jalur bisnis yang berbeda, model besar domain dan model besar umum. Bisakah Anda berbicara tentang peluang dan tantangan dari dua model bisnis yang berbeda ini secara detail. **

Wang Danjun: Di masa depan, bisnis seputar model besar pasti akan menjadi ekologi bisnis, dan fitur inti dalam ekologi bisnis adalah berlapis. Pertama-tama, akan ada beberapa pabrikan yang menyediakan layanan dasar, karena model besar membutuhkan basis data dan daya komputasi. Model besar berfungsi sebagai mesin yang mendasarinya, meskipun memiliki kemampuan yang kuat, ia tidak memahami pengetahuan tentang domain tertentu, model layanan, dan kebutuhan pelanggan.

Bersamaan dengan itu muncul maket vertikal besar. Beberapa model besar dalam domain vertikal ini adalah model besar milik produsen domain, dan beberapa dilatih berdasarkan model besar dasar. Dalam istilah awam, ini untuk menjadikan model ini ahli. Misalnya, di bidang keuangan mungkin ada beberapa layanan yang didedikasikan untuk membantu investor membuat keputusan bisnis, dan di bidang sumber daya manusia mungkin ada layanan yang didedikasikan untuk membantu perusahaan membuat keputusan bakat.

Mungkin ada banyak bidang yang dibagi lagi. Subdivisi ini mungkin juga memerlukan akumulasi industri, pelatihan, dan pemahaman tentang cara memecahkan masalah pelanggan, dan bahkan terlibat dalam tingkat pengalaman pengguna antarmuka interaktif. Akumulasi ini sebenarnya adalah beberapa kemampuan di balik app store yang telah kita bicarakan sebelumnya.

Yu Zhonghai: Dari sudut pandang kami, kedua jenis pasar ini sebenarnya sangat berbeda.

Pertama-tama, penting juga untuk membuat flywheel data yang bagus untuk model umum yang besar.

Misalnya, hari ini saya mengajari Anda cara bermain tenis meja, dan saya katakan Anda harus bermain seperti ini. Lalu saya servis bola dan Anda tidak menangkapnya, Anda tahu itu bukan cara yang tepat untuk memukulnya. Kemudian ubah cara lain, kali ini Anda menangkapnya, Anda akan mengingat cara yang benar. Kemudian saya terus melakukan servis bola kepada Anda, dan Anda terus menangkapnya, menyesuaikan memori otot Anda sedikit demi sedikit untuk menemukan cara terbaik. Padahal, pelatihan model juga merupakan proses seperti itu. Setiap kali Anda berkomunikasi dengan ChatGPT, akan ada suka atau tidak suka di bawahnya. Atau ada kalanya Anda tidak mengatakan apa-apa dan sangat kecewa karena telah membuat ulang. Atau misalnya, setiap kali Anda menggunakan Midjourney untuk menggambar, itu akan menampilkan empat gambar, lalu Anda memilih yang ketiga secara default, memperbesarnya, mengunduhnya, dan ia akan tahu bahwa yang ini tampaknya lebih baik, dan akan pergi untuk ini di masa depan Arahnya sedikit lebih bias, dan modelnya akan belajar sedikit. Tanpa umpan balik data, model tetap di sini dan tidak dapat ditingkatkan. Jadi inilah roda gila data yang kami tekankan, menekankan posisi kartu pemandangan. Sebagai model besar untuk keperluan umum, yang paling penting adalah digunakan oleh seseorang, yang juga merupakan keuntungan dari China. Orang Cina suka merangkul teknologi, dan mereka lebih menerima model besar. Kami memiliki banyak orang untuk memberikan umpan balik.

Untuk model domain besar, menurut saya yang lebih penting adalah know-how (pengetahuan teknis dan keahlian yang diperlukan untuk terlibat dalam industri tertentu atau melakukan pekerjaan tertentu).

Kunci model domain besar adalah untuk memenuhi kebutuhan pelanggan dan memahami pengetahuan pelanggan di domain dalam tertentu. Perusahaan seperti Zhongguancun Kejin memiliki kelebihannya di sini, mereka memahami pengetahuan pelanggan dan memahami titik kesulitan pelanggan dalam skenario lapangan tertentu.

**Zhang Jie: **Terima kasih atas pengakuan Anda. Saya memahami bahwa model besar umum dan model besar domain adalah hubungan hulu dan hilir, bukan hubungan kompetitif. Model umumnya besar dan komprehensif, dan model domain adalah bisnis kecil tapi indah.

Model skala besar umum dicirikan oleh "tiga tertinggi", yaitu investasi tinggi dan pengembalian tinggi, tetapi juga ketidakpastian tinggi. Karena melatih model besar dasar membutuhkan persyaratan tinggi dalam hal algoritme, data, dan bakat. Misalnya, daya komputasi minimal harus 10.000 kat tingkat daya komputasi.

Mengapa ketidakpastian begitu tinggi? Karena pabrikan yang terpilih pada dasarnya adalah perusahaan Internet besar atau raksasa teknologi, persyaratan teknisnya sangat tinggi agar model besar yang terlatih memiliki kemampuan umum dan kemampuan yang muncul.Jika Anda ingin mendapatkan pijakan di pasar, Anda setidaknya harus bisa dijalankan Hanya dengan memenangkan model open source dapat bertahan. Di pasar masa depan, saya pikir akan ada banyak model besar dasar yang hidup berdampingan, tetapi mungkin tidak terlalu banyak.

Mockup domain mungkin trek kecil tapi indah. Melatih model domain besar tidak memerlukan daya komputasi yang sangat tinggi. Menurut percobaan kami, hanya perlu waktu satu minggu untuk mengulang model domain besar. Dua kartu dapat melakukan beberapa penalaran secara real time. Kemudian dalam hal data, kami masih perlu menetapkan beberapa ambang batas kami sendiri, yaitu data efek roda gila yang baru saja disebutkan oleh Pak Yu.

Poin kompetisi yang paling penting adalah bakat. Model domain besar telah meratakan rantai teknologi seluruh industri.Bakat Anda tidak hanya harus memahami algoritme, tetapi juga tahu cara merekayasa algoritme dengan baik, memahami skenario, memahami bisnis, dan bahkan memahami desain produk. Perlu untuk merangsang kemampuan majemuk bakat, dan kemudian merangsang inisiatif dan kreativitas bakat, yang merupakan ujian kemampuan organisasi.

Di kolom manakah model besar paling berguna?

**Teknologi Kertas: Apa tiga arah aplikasi vertikal yang paling menjanjikan? **

Yu Zhonghai: Kami telah melihat ke banyak arah, dan arah yang paling menjanjikan sekarang adalah AI Answer, yaitu kata yang kami buat sendiri, yang mengacu pada kategori produk. Misalnya, Anda menguji saya tentang suatu masalah hari ini, dan Anda bertanya kepada saya merek kereta dorong mana yang lebih baik untuk dibeli. Saya percaya bahwa setiap orang harus memiliki situasi yang sama. Tanyakan kepada tiga teman, baca lima artikel Xiaohongshu, lalu cari sepuluh posting di Internet. Akhirnya, setelah membacanya, saya menyimpulkan tiga model, lalu melihat harganya dan mengambil keputusan.

Faktanya, hal yang sama juga terjadi pada banyak hal ketika Anda bertanya pada kecerdasan buatan Model besar memiliki ingatan tertentu, ia tahu bahwa hal-hal ini terkait, tetapi ia akan berhalusinasi seperti apa. Jadi yang sering dilakukan perusahaan adalah membuat kueri tertentu berdasarkan basis pengetahuan internal, lalu membuat ringkasan berdasarkan hal-hal tersebut. Selain itu, ada tanya jawab, rangkuman atau perbandingan berdasarkan dokumen, seperti klausula asuransi berdasarkan ratusan halaman. Atau berikan jawaban berdasarkan pencarian. Kami secara kolektif menyebut produk ini sebagai AI Answer. Selain itu, kami juga lebih memperhatikan peluang seperti pekerjaan kantor dan mesin pembelajaran AI.

Zhang Jie: Saya pikir kita bisa melihatnya berdasarkan industri terlebih dahulu, lalu berdasarkan pemandangan. Industri yang ideal untuk model domain berskala besar adalah industri dengan kepadatan pengetahuan yang tinggi, logika proses yang kuat, dan peka terhadap keamanan dan privasi. Misalnya, industri seperti keuangan, perawatan medis, hukum, dan urusan pemerintahan mungkin merupakan industri yang ideal untuk implementasi model domain skala besar di masa depan.

Adegan mungkin diberdayakan untuk karyawan internal di awal. Misalnya melakukan kuis pengetahuan, dilanjutkan dengan latihan dan sparring. Setelah memberdayakan karyawan internal, mari kita lihat bagaimana melakukan beberapa layanan kepada C (kepada pelanggan), atau memberdayakan staf penjualan dan staf layanan pelanggan untuk menjadi asisten layanan pelanggan pemasaran. Singkatnya, saat melamar, pertama-tama Anda dapat mempertimbangkan untuk memulai dari tempat kejadian dengan toleransi kesalahan yang relatif tinggi.

Wang Danjun: Kami juga percaya bahwa dalam pengalaman aplikasi semua orang, model besar membantu kami memecahkan sebagian besar masalah dalam industri padat pengetahuan. Di bidang To B seperti Beisen atau Zhongguancun Kejin, memang akan ada beberapa perusahaan yang lebih diuntungkan. Misalnya, dalam manajemen sumber daya manusia suatu perusahaan, semua orang berharap model besar dapat menyelesaikan beberapa hal yang membosankan dan membosankan bagi orang-orang, seperti menjawab berbagai masalah umum karyawan. Beisen dan Zhongguancun Kejin juga sedang mendiskusikan kerja sama di bidang ini, berharap dapat membentuk beberapa karyawan digital melalui fasilitas dasar model besar di masa mendatang, dan menjawab pertanyaan yang tampaknya tidak memerlukan pengalaman dan pengetahuan manusia ini.

Selain itu, kami menemukan bahwa ada beberapa area bernilai tinggi, seperti pembinaan kepemimpinan perusahaan. Suatu perusahaan memiliki beberapa tingkat manajer, dan setiap manajer akan menghadapi berbagai tantangan setiap hari, tetapi dia tidak memiliki begitu banyak kesempatan untuk meminta saran dari orang lain. Kami pikir AIGC dapat memberikan bantuan yang sangat baik dalam skenario ini, dan dapat memenuhi beberapa kebutuhan pribadi untuk privasi.

**澎湃科技：Microsoft baru-baru ini mengumumkan kerja sama dengan OpenAI untuk membuka ekologi aplikasi. Zhongguancun Kejin adalah perwakilan produsen aplikasi skala besar di Tiongkok. Bagaimana kemajuan pendaratan dan aplikasi produk saat ini? Akankah setiap perusahaan memiliki model eksklusifnya sendiri di masa mendatang? **

Zhang Jie: Saya pikir tidak setiap perusahaan membutuhkan model eksklusifnya sendiri, karena menurut saya teknologi model besar dapat dibagi menjadi tiga lapisan dari yang dangkal hingga yang dalam:

Pada tingkat pertama, jika industri atau perusahaan tidak memiliki begitu banyak pengetahuan atau dokumen, atau kekhususan perusahaan itu sendiri tidak kuat, tidak perlu menggunakan model khusus, dan model besar umum dapat digunakan secara langsung. Pada model besar umum, sesuai dengan persyaratan pemandangan tertentu, cukup untuk menyesuaikan (prompt). Selama periode ini, yang dibutuhkan perusahaan adalah alat manajemen kata yang cepat dengan pengalaman pengguna yang baik dan ambang batas yang rendah. Beberapa pakar bisnis mungkin perlu mengakumulasikan beberapa prompt yang berguna dalam skenario tertentu; untuk skenario yang lebih rumit, perlu mengubah beberapa prompt menjadi sekumpulan kecil prompt, dan kemudian membentuk rantai di antara set yang berbeda, dan rantai tersebut diurutkan Logis hubungan, cukup memiliki alat manajemen rantai yang cepat.

Lapisan kedua sedikit lebih rumit. Beberapa perusahaan memiliki banyak pengetahuan yang terfragmentasi. Pada saat ini, kata-kata cepat atau rantai cepat mungkin tidak cukup. Perlu menambahkan basis pengetahuan di atas model besar umum untuk mengelola pengetahuan frekuensi rendah dan ekor panjang. Ketika model besar umum menghadapi masalah khusus, buka basis pengetahuan untuk menemukan jawabannya. Ini adalah rute teknis model besar umum + basis pengetahuan + rekayasa cepat.

Lapisan ketiga, untuk perusahaan dengan sejumlah besar pengetahuan domain, perlu untuk membangun model domain besar yang eksklusif untuk perusahaan, dan memasukkan pengetahuan umum di domain ke dalam otak model besar, yang tidak hanya mempertahankan kesamaan umum rasa dan penalaran, tetapi juga memiliki keahlian di bidang Pengetahuan dan keterampilan membuat model besar dari mahasiswa seni liberal untuk pakar domain. Ini adalah rute model domain besar + basis pengetahuan domain + rekayasa cepat.

Zhongguancun Kejin memiliki beberapa latihan aplikasi untuk tiga situasi di atas, kami telah mencoba menyelesaikan tiga kesulitan teknis beberapa waktu lalu, dan setelah menyelesaikannya, kami telah membentuk dua set aplikasi asisten. Apa tiga kesulitan teknis?

Yang pertama adalah memecahkan masalah halusinasi yang sering terjadi pada model besar, yaitu omong kosong yang serius. Ini membutuhkan basis pengetahuan di lapangan agar model besar tahu bahwa ketika ditanyai, ia perlu menemukan pengetahuan yang relevan di basis pengetahuan. Saat membangun basis pengetahuan, seringkali perlu memproses dokumen dalam format teks kaya. Model besar perlu memahami tata letak dokumen terlebih dahulu, lalu memahami konten di dalamnya.

Yang kedua adalah untuk mencegah masalah lupa selama proses pelatihan saat melatih model besar di domain. Jika tidak, saat Anda memasukkan pengetahuan baru ke dalam otaknya, ia akan melupakan pengetahuan lama. Sarana teknis fine-tuning yang efisien akan digunakan di sini, sehingga tidak hanya memiliki pengetahuan umum asli, tetapi juga mempelajari akal sehat di lapangan.

Yang ketiga adalah bagaimana membuat pengguna menggunakannya dengan lebih nyaman dan dengan biaya rendah. Apakah itu model domain besar, basis pengetahuan domain, atau kata-kata cepat, itu tidak dapat dicapai dalam semalam, dan membutuhkan umpan balik dan iterasi yang berkelanjutan.Hal ini mengharuskan pelanggan untuk memiliki kemampuan pemeliharaan, dan desain produk serta pengemasan teknik harus dilakukan dengan baik di tingkat alat.

**澎湃科技: Saya ingin bertanya kepada Tuan Yu dari perspektif investasi, dibandingkan dengan logika investasi di era internet seluler dan teknologi keras, dalam putaran kebangkitan model berskala besar ini, fokus utama dari pemilihan proyek , termasuk poin pengambilan keputusan investasi apa itu **

**Yu Zhonghai:**Ini juga pertanyaan yang telah dieksplorasi modal. Dalam enam bulan terakhir, pasar model besar juga telah mengalami banyak evolusi. Pada awalnya, banyak orang menganggapnya sebagai investasi tema.Pada saat itu, perusahaan yang terkait dengan AI berspekulasi, dan perusahaan dengan kemampuan nyata yang mendasari model skala besar sangat dihargai oleh semua orang. Belakangan, "Perang Seratus Model" muncul. Semua orang merasa bahwa model besar tampak agak terlalu rumit. Mereka menemukan bahwa daya komputasi tampaknya diuntungkan dengan membeli sekop dari Nuggets, sehingga valuasi perusahaan yang terkait dengan daya komputasi naik banyak. Pada Mei dan Juni tahun ini, kami mengusulkan agar "aplikasi AI mengantarkan periode Kambrium yang eksplosif". Banyak perusahaan telah menghadirkan produknya sendiri, dan penerapan AI mulai meningkat kembali.

Nyatanya, ritme investasi model-model besar juga bertahap, dari awal asalkan perusahaan AI bisa meningkat, lalu akan keluar dengan aplikasi, lalu semua orang akan mulai menjajaki apakah aplikasi ini apakah pelanggan membayarnya, dan apakah ada pesanan nyata. Saya pikir mungkin sekitar satu tahun lagi, semua orang akan memikirkan apakah ada hambatan pada aplikasi ini dan apakah bisnis ini berkelanjutan dalam jangka panjang. Faktanya, yang paling kami optimis adalah level aplikasi, kami sangat mementingkan perusahaan yang benar-benar dapat menghubungkan model besar dan aplikasi perusahaan, dan mereka benar-benar dapat menciptakan nilai.

**Makalah: Pertanyaan berikutnya adalah untuk Dean Wang Dari perspektif bakat, model besar sekarang sedang membangun hubungan produksi baru kolaborasi manusia-mesin. Jadi apa dampaknya terhadap manajemen talenta perusahaan? **

Wang Danjun: Ini pertanyaan yang sangat bagus. Karena kita melihat bahwa di tataran sosial, setiap orang mungkin sangat antusias untuk berdiskusi “Apakah karya saya akan digantikan oleh model besar di masa depan?” Mengenai pertanyaan ini, saya menyarankan agar kita dapat melihatnya dari dua aspek:

Di satu sisi, yang lebih banyak dibahas semua orang adalah bahwa kemampuan model skala besar semakin kuat dan kuat, dan penerapan bidang vertikal semakin dalam, yang dapat menggantikan pekerjaan banyak karyawan umum di masa depan. Dalam beberapa tahun terakhir, bahkan tanpa latar belakang pengembangan model skala besar, semua orang sangat memperhatikan pengurangan biaya dan peningkatan efisiensi, yang melibatkan proporsi biaya tenaga kerja di perusahaan. Jika beberapa teknologi baru dapat digunakan untuk mengurangi biaya tenaga kerja, itu akan sangat berharga bagi perusahaan, yang merupakan alasan penting untuk pembangunan berkelanjutannya.

Di sisi lain, munculnya model-model besar dan munculnya lebih banyak alat bidang vertikal di masa depan akan menjadi berkah bagi karyawan. Sisi positifnya, jika karyawan dapat memanfaatkan kolaborasi manusia-mesin dengan lebih baik, hal itu dapat menciptakan nilai lebih bagi perusahaan.

Kami memperkirakan bahwa akan ada beberapa perubahan dalam bentuk organisasi di masa mendatang. Sebagian besar perusahaan sekarang memiliki struktur fungsional. Fungsi yang berbeda melayani pelanggan yang sama. Ada banyak masalah kolaborasi dan komunikasi antar fungsi, yang merupakan konsumsi besar bagi perusahaan. Namun di masa depan, ketika karyawan atau kelompok individu memiliki kemampuan menyeluruh dengan bantuan alat, unit organisasi pasti akan menjadi lebih kecil, dan akan lebih gesit, fleksibel, dan responsif.

**Teknologi Kertas: Saya ingin bertanya kepada kalian bertiga, kemampuan seperti apa yang paling dibutuhkan perusahaan dalam konteks Perang Seratus Model? **

**Zhang Jie: **Untuk produsen model skala besar dasar, yang paling mereka butuhkan adalah memiliki kemampuan teknis yang sangat kuat dan unik. Untuk mengungguli model skala besar open-source, dan kemudian memiliki beberapa teknologi unik dalam multi-modal atau seks penalaran kompleks. Untuk produsen model skala besar di lapangan, bakat majemuk paling dibutuhkan, dan keterampilan organisasi sangat penting. Karena itu perlu untuk memberikan inisiatif dan kreativitas bakat sepenuhnya, hubungkan dia dengan beberapa peluang bisnis mutakhir, dan beri tahu dia apa yang dibutuhkan pelanggan. Selain itu, harus ada beberapa kemampuan teknik dan kemampuan algoritmik.

Yu Zhonghai: Menurut saya data itu sangat penting, terutama untuk perusahaan yang ingin menggunakan model besar, data itu sangat penting. Nyatanya, data akan segera menjadi penghalang bagi kami Perusahaan seperti Zhongguancun Kejin yang menyediakan aplikasi model skala besar memiliki keunggulan terbesar dalam data.

**Wang Danjun: **Sebenarnya, untuk sebagian besar perusahaan, kemungkinan besar mereka akan menjadi konsumen model besar di masa depan, daripada pencipta model besar. Secara aktif merangkul model besar dapat sangat mempercepat proses manajemen digital mereka . Baik organisasi maupun individu mungkin perlu merangkul perubahan.Pemimpin di semua tingkatan perlu meningkatkan kesadaran mereka untuk merangkul peluang baru ini, dan karyawan perlu mempertahankan kemampuan belajar yang berkelanjutan dan mandiri.

** Teknologi Kertas: Dalam proses ini, perusahaan di bidang vertikal memiliki keunggulan pengetahuan industri. Apakah mereka lebih mudah untuk menembus poin kartu dari data model besar? **

Zhang Jie: Menurut saya pengetahuan industri perlu dilihat secara mendetail, dan mungkin ada beberapa bentuk yang memerlukan perhatian khusus.

Bentuk pengetahuan industri yang paling jelas adalah beberapa data dalam dokumen, yang merupakan ekspresi simbolik. Cara menggali (kata-kata cepat) atau rantai cepat dari dokumen adalah jenis masalah yang perlu ditangani pada tahap saat ini. Banyak perusahaan memiliki banyak dokumen, dan banyak dari dokumen ini dalam format PPT atau PDF. Penting untuk memahami format dan isinya.

Selain pengetahuan tentang jenis industri ini, ada juga pengetahuan yang tersembunyi di benak pakar industri atau pakar skenario, perlu diberikan alat yang dapat diringkas dengan kata-kata Template adalah industri pengetahuan dengan kepadatan yang lebih tinggi.

Ada juga jenis pengetahuan industri yang relatif tersembunyi, yaitu kebijaksanaan kolektif yang tersembunyi di log sistem. Setelah menambang log ini, dimungkinkan untuk mengubah pengetahuan yang tersebar menjadi pengetahuan berantai terstruktur. Kemudian, dari ribuan rantai tersebut, dirangkum dan diubah menjadi praktik terbaik di bawah skenario tertentu. Misalnya, tenaga penjualan melakukan banyak panggilan telepon setiap hari, dan ada jutaan log percakapan yang terakumulasi setiap hari. Dengan menyesuaikan menurut hasil yang berbeda seperti penyelesaian pesanan, alur urutan, atau menutup panggilan, keterampilan berbicara terbaik untuk pemasaran baru produk dapat diendapkan.praktek.

Ketiga jenis pertanyaan ini sebenarnya adalah pengetahuan industri yang sangat bagus. Ada juga beberapa tantangan teknis di sini, seperti cara menggali kata-kata cepat dan rantai cepat dari dokumen dan log. doc2 dan log2 adalah fokus penelitian yang layak untuk diinvestasikan.

Yu Zhonghai: Faktanya, Zhang Jie selalu memiliki pepatah yang sangat mengesankan bagi saya. Dia mengatakan bahwa merekam orbit delapan planet di tata surya selama puluhan juta tahun tidak sebaik hukum abstrak dari gravitasi yang dapat menjelaskan hal-hal yang lebih baik.Alam.

Saya pikir ini adalah pengetahuan. Perusahaan di bidang vertikal memiliki banyak pengalaman di bidang terkait, saya beri contoh, setelah kecerdasan buatan menjadi populer, semua orang mengatakan bahwa ada profesi baru yang disebut insinyur dengan gaji tahunan satu juta.

Insinyurlah yang pergi untuk menulis. Jadi mengapa mereka begitu berharga? Saya juga menggunakan alat lukis kecerdasan buatan sendiri. Suatu kali saya ingin menggambar pria berjas, tetapi saya mencoba banyak kata kunci dan tidak berhasil. Nanti, saya mengetik "dasi", dan orang itu segera mengenakan jas, dan Anda akan menemukan bahwa ini adalah kata ajaibnya.

Model besar agak mirip dengan permainan probabilitas, yang sebenarnya memiliki banyak probabilitas sebelumnya. Dalam adegan barusan, dasi adalah kata yang sangat penting sesuai dengan setelan. Dan engineer tahu kata kunci mana yang bisa mengganggu model, dan dia tahu hal-hal seperti apa yang ingin kita tulis. Ini adalah nilainya. Kemudian jika kita menempatkan hal ini dalam skenario aplikasi, itu sebenarnya adalah nilai perusahaan dalam bidang vertikal. Dia memahami kecerdasan buatan dan pengetahuan industri.

Wang Danjun: Saat ini, tampaknya selain perusahaan model dasar skala besar, perusahaan bidang vertikal adalah kelompok kedua perusahaan yang akan diperhatikan semua orang di pasar. Saya pikir itu akan sangat menantang bagi mereka di periode waktu berikutnya. Pengalaman perusahaan di bidang vertikal belum tentu dapat langsung diubah menjadi kreativitas baru di bawah berkat teknologi baru. Perlu menghabiskan lebih banyak waktu untuk belajar terlebih dahulu, untuk memahami apa logika yang mendasari operasi model besar, untuk mempelajari bagaimana hal itu dapat membantu saya, bahkan untuk membantu saya menambang pengetahuan kami, atau membantu kami memberikan layanan kepada pelanggan. Saya pikir untuk beberapa waktu ke depan, mereka akan menghadapi tantangan ini terlebih dahulu. Di atas fondasi ini, temukan peluang baru untuk menciptakan nilai bagi pelanggan berdasarkan model ini.

**Teknologi Kertas: Ada beberapa tren baru akhir-akhir ini, seperti penurunan jumlah pengunjung ChatGPT. Itu sebenarnya tidak ada sebagai pintu masuk super. Ada pandangan bahwa ChatGPT tidak bisa mewakili masa depan GPT, melainkan hanya produk yang dihadirkan oleh OpenAI dan Microsoft ke pasar. Apa yang kalian bertiga pikirkan tentang sudut pandang ini? **

Yu Zhonghai: Sudut pandang ini memang cukup menarik. Secara pribadi saya relatif optimis, karena saya adalah orang yang sering menggunakan produk berskala besar. Dan saya ingin menambahkan bahwa ChatGPT saat ini bukanlah bentuk akhirnya. Saya pikir Google Assistant (Asisten Google) di sistem Android generasi Google berikutnya akan didukung oleh model besarnya sendiri, karena ini juga merupakan pintu masuk lalu lintas yang sangat penting.

Wang Danjun: Bagi banyak orang di industri ini, semua orang sangat optimis. Sebagai produk baru, pada tahap pengembangan ini, secara alami akan ada beberapa diferensiasi. Bagi pengguna akhir, mereka akan tertarik dengan alat tersebut, mau mencoba, dan terus menggunakannya. Sekalipun frekuensi penggunaan menurun dan tingkat perhatian menurun, perilaku pengguna sulit diubah.

Zhang Jie: Menurut saya perlambatan laju pertumbuhan ChatGPT adalah sesuatu yang cepat atau lambat akan terjadi. Lagi pula, lalu lintas memiliki batas atas. Cepat atau lambat, lalu lintas akan memuncak atau antusiasme publik terhadap skenario aplikasi obrolan akan menurun.Lagipula, mengobrol bukanlah permintaan kaku frekuensi tinggi, tetapi ini memberi Anda inspirasi yang sangat bagus.

Di satu sisi, ada banyak aplikasi di sekitar Obrolan, seperti menghasilkan gambar, video, laporan, PPT, dll. Melalui obrolan, seperti ChatDoc, ChatPdf, dan ChatBI. Skenario lain adalah model domain besar yang baru saja disebutkan, seperti GPT keuangan, GPT legal, dan GPT medis. Ini semua mungkin menjadi pintu masuk bisnis baru di masa mendatang.

Lihat Asli

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.