Itu terlalu keriting! 36 Catatan dan Kebenaran Tentang Model Besar dan AIGC

Sumber gambar: Dihasilkan oleh AI Tanpa Batas

Sumber: saya kuda hitam

Pada sore hari tanggal 12 September, kantor pusat Startup Dark Horse di Beijing mengantarkan gelombang “kekuatan AI baru”.

Huawei Cloud, APUS, Tors, SenseTime, Kuaishou, 360 Group, Qingbo Intelligence, Dark Horse Tianqi, MiniMax, Sinovation Ventures, Qiji Chuangtan, China Academy of Information and Communications Technology... Ada perusahaan tercatat, perusahaan terkemuka, dan hewan unicorn perusahaan, serta lembaga investasi terkemuka dan lembaga penelitian ilmiah di bidang AI.

Para tamu yang menghadiri pertemuan langsung menuju ke topik—

"Status industri model besar saat ini? Bagaimana perusahaan dapat melakukan komersialisasi dengan lebih baik? Tren dan peluang baru apa yang perlu diperhatikan?"

Saya merasa terhormat bisa berpartisipasi dalam pertemuan AI tertutup ini. Saya akan berbagi 38 catatan dan kebenaran dengan Anda.

**01. Berapa volume yang dimiliki industri ini? **

Menurut statistik terbaru, lebih dari 130 model besar telah diluncurkan di Tiongkok, dan lebih dari 70 model algoritme telah terdaftar di Administrasi Ruang Siber Tiongkok. Raksasa internet seperti BAT semuanya telah merilis model AI yang besar.Pada tahun 2023 saja, lebih dari 60 startup telah menerima pembiayaan, dan produknya penuh dengan lapisan dasar, lapisan model, dan lapisan aplikasi. AI generatif generasi baru mungkin perlu melihat kembali kelemahan AI generasi sebelumnya, dan menghindari rasa berpuas diri di industri untuk menghindari reinkarnasi dari musim dingin sebelumnya. Praktisi di bidang ini harus melihat dengan jelas involusi industri dan kelemahan pelanggan, dan jangan tertipu oleh sup ayam perusahaan besar.

  1. Sekarang seorang pelanggan datang kepada kami dan mengatakan bahwa ada 20 adegan, dan setiap adegan berharga X juta yuan? Lalu saya pergi dari rumah ke rumah untuk menanyakan harga, apakah Huawei akan melakukannya? Akankah Alibaba melakukannya? Akankah Baidu melakukannya? Jika Anda terus seperti ini, pada akhirnya Anda tidak akan menghasilkan uang.

  2. 80%-90% dari uang yang dikumpulkan oleh setiap orang digunakan untuk daya komputasi.Ini adalah situasi saat ini. Anda tahu, ini hanya pelatihan sekarang. Biaya pelatihan dapat dikontrol, tetapi biaya inferensi tidak dapat dikendalikan.

  3. Kami memiliki 30.000 GPU dan daya komputasi 6.000p. Kami akan berusaha keras untuk memiliki daya komputasi lebih dari 12.000p pada akhir tahun ini. Dari segi data, 2 triliun token dibersihkan dan diberi anotasi setiap bulannya, dan akan ada 10 triliun token pada akhir tahun.

  4. Saat ini, industri masih kekurangan beberapa aplikasi disruptif yang mematikan, sehingga sulit untuk mewujudkan komersialisasi.

  5. Bagaimana menemukan keseimbangan antara biaya dan dampak? Ini adalah poin yang sulit. Semuanya menggunakan model besar dan biayanya terlalu tinggi.

  6. Nantinya, yang diperebutkan semua orang adalah kemampuan mengoptimalkan infrastruktur. Misalnya, dalam hal kemampuan pengoptimalan jaringan, jika Anda melanjutkan ketika yang lain gagal, Anda akan dapat berlatih lebih sering daripada yang lain.

  7. Dalam hal daya komputasi yang terbatas, kami melakukan beberapa upaya teknis berwawasan ke depan. Anda mungkin tidak menyangka bahwa di perusahaan model besar kami, terdapat lebih banyak siswa yang mengerjakan bidang infrastruktur daripada pemodelan. Harga mereka umumnya cukup mahal dan sulit untuk direkrut.

  8. Model-model besar kini berada dalam situasi yang memalukan. Mereka tidak bisa menjual dirinya sendiri dengan harga tinggi. Pada akhirnya, hanya mereka yang menjual cloud, kartu, dan daya komputasi yang menghasilkan uang.

  9. Awalnya saya pikir model itu cukup berharga, tapi sekarang sudah mengalami involusi lagi. Saya bertemu dengan seorang pelanggan beberapa waktu lalu, dan BAT serta yang lainnya mengutipnya. Penawaran awalnya cukup mahal, lebih dari 10 juta. Adakah yang tahu berapa harga satuan akhirnya? Terlalu keriting.

  10. Model besar dengan puluhan miliar parameter dianggap gratis oleh beberapa pelanggan khusus.

02, Suara dari garis depan

Perusahaan di bidang kecerdasan buatan harus selalu mengingat apa yang dikatakan Ketua Mao, "berasal dari praktik ke praktik." Hanya dengan melepas jubah dan jaket mandarin dan berjalan ke ladang Anda bisa mendapatkan feedback paling autentik saat berada di samping pelanggan Anda. Ada terlalu banyak ahli semu di bidang AI sekarang, jadi lebih baik mendengarkan lebih banyak suara dari garis depan.

  1. Kami berbicara dengan sekitar 150 pelanggan. Persyaratan untuk model besar itu sendiri pada dasarnya dibagi menjadi dua kategori. Salah satunya adalah persyaratan tekstual dari model besar itu sendiri, dan persyaratan pelanggan untuk model bahasa besar 100% akurat. Yang lainnya adalah agen AI, yang mencakup panggilan fungsi, tampilan kode, dan panggilan ke alat pihak ketiga.

  2. Selama kerja sama kami, terjadi konflik. Pelanggan akan merasa bahwa data tersebut tidak dapat diberikan kepada Anda sebelum mereka memutuskan untuk menyebarkannya secara internal. Namun tanpa data ini, bagaimana kita bisa melatih model yang sesuai dengan kebutuhan pelanggan?

  3. Saat kami mengerjakan proyek, kami menemukan bahwa pengguna tidak bersedia membayar untuk model besar, namun mereka tetap membayar untuk aplikasi Anda. Beberapa pelanggan akan langsung bertanya, dengan model yang besar, apakah beberapa platform menengah cerdas dan grafik pengetahuan sebelumnya tidak lagi diperlukan? Pada akhirnya, saya menemukan bahwa adegan adalah intinya.

  4. Kita perlu menemukan beberapa adegan seksi. Ada beberapa standar. Pertama, sayatan kecil. Kedua, cocokkan keunggulan model besar. Ketiga, biarkan pengguna yang mengambil keputusan untuk membayar memiliki persepsi yang kuat. Misalnya, dahulu untuk mendapatkan sejumlah data, kesimpulan, atau layanan memerlukan proses yang berbeda, kini melalui model besar, pengambil keputusan dapat dengan cepat memperoleh dan menyelesaikannya di perangkat seluler.

  5. Untuk berhasil dalam model besar, diperlukan tiga hal: 1) Apakah Anda dapat memperoleh cukup uang untuk membeli daya komputasi. 2) Bisakah kita mendapatkan data yang cukup? 3) Apakah kepadatan talentanya cukup tinggi? Ini bukan soal kuantitas, tapi apakah ada cukup ilmuwan berkualitas tinggi.

  6. Sekarang kita menjumpai tiga jenis pelanggan. Salah satu tipenya adalah pelanggan yang cemas, seperti pelanggan keuangan yang ingin melakukan hal tersebut karena pesaingnya juga melakukan hal tersebut, namun mereka tidak tahu apa kebutuhannya. Salah satu tipenya adalah pelanggan yang ingin mengurangi biaya. Manajemen pelanggan percaya bahwa hal ini terutama merupakan masalah pengurangan biaya dan pengeluaran. Namun, sulit untuk menilai nilai spesifik berapa banyak penghematan yang telah dicapai model tersebut. Kategori terakhir adalah pelanggan yang berharap menghasilkan uang dengan menerapkan model open source. Mereka mengandalkan model ini untuk menghasilkan pendapatan. Hal ini paling nyaman bagi pelanggan ini untuk membayar.

**03, ToC atau ToB? **

Dapat dipahami bahwa biaya pelatihan GPT-4 satu kali adalah sekitar US$63 juta dan membutuhkan 1,8 triliun parameter dalam jumlah besar. Untuk beberapa model besar yang saat ini dirilis di Tiongkok, arah ToC masih berupa model Internet gratis. Namun semua praktisi mengetahui bahwa pengembangan dan pengoperasian model besar memerlukan banyak biaya, sehingga memudahkan model bisnis ToB untuk beroperasi dengan lancar. Dalam hal eksplorasi komersialisasi, ToB atau ToC selalu menjadi perhatian industri. Dalam pertemuan tertutup tersebut, kami mendengar dua kata kunci berulang kali: 1) gen dan 2) pelanggaran. "Kamu tidak bisa menjadi apa yang bukan dirimu."

  1. Kami percaya bahwa peluang masih terletak pada model tob vertikal, dan intinya adalah data dan skenario itu sendiri, yang merupakan intinya.

  2. Kami sendiri juga memikirkan bagaimana kecerdasan buatan dapat dikombinasikan dengan Internet, digitalisasi, dll., dan bagaimana membuat adegan aslinya menjadi lebih cerdas.

  3. ToC atau ToB, sejujurnya, ini berkaitan dengan gen setiap orang. Hanya karena kita tidak bisa melakukannya bukan berarti orang lain tidak bisa melakukannya. Misalnya, beberapa aplikasi ToC dimainkan oleh anak-anak yang lahir pada tahun 2000 atau 10, yang berada di luar pemahaman usia kita.

  4. Toc dan Tob masih sangat berbeda. ToC memiliki tingkat toleransi kesalahan yang relatif tinggi. TOB justru sebaliknya. Ambil contoh, tanya jawab cerdas. Bagaimana cara memastikan keakuratan? Seperti pemerintah, ada garis merah. Cara menghindari ilusi model saat ini sedang dieksplorasi.

  5. Sebaliknya, menurut kami lebih mudah menghasilkan uang melalui ToC. Ada masalah pada ToB, proses pengerjaan suatu proyek relatif lama. Siklus uang sangat panjang mulai dari persetujuan anggaran klien hingga penetapan dan implementasi proyek.

  6. Saya pikir ada terlalu banyak peluang saat ini. Jangan mengalokasikan sumber daya ke tempat-tempat yang tidak memenuhi syarat untuk Anda. Sangat penting untuk membuat pilihan strategis.

04, ToB dan ToG juga sangat sulit

  1. Bug terbesar di sisi B adalah bahwa hal itu berakhir dengan outsourcing manusia tingkat lanjut.

  2. Semua proyek memiliki siklus, dan semua pembayaran didasarkan pada titik-titik siklus tersebut. Saya tidak mungkin membantu Anda melatih dan mengoptimalkan model tanpa batasan.

  3. Kreasi AIGC lebih toleran dan mungkin memiliki beberapa kesalahan. Namun jika menyangkut produksi dan manufaktur oleh beberapa perusahaan, persyaratan akurasinya sangat tinggi. Seringkali lebih mudah bagi kita untuk memilih satu atau dua kasus yang lebih baik dari model, namun masih cukup sulit untuk mempertahankannya pada tingkat tinggi tanpa kasus yang buruk.

  4. Saat kami mengerjakan proyek pemerintahan digital cerdas di provinsi yang maju secara ekonomi, kami mempromosikan lebih dari 5 skenario, dan pelanggan akhirnya menyetujui 3 skenario. Kemudian, kita akan membahas hal-hal mendasar tentang keamanan, data, dan lapisan terbawah. Lalu saya akan bertanya, apa perbedaan dan kelebihan Anda dengan model besar lainnya? Terakhir, semua pihak perlu duduk bersama dan membuat sistem evaluasi. Setelah lolos sistem evaluasi, kita masih perlu mengevaluasi kinerjanya.

05. Gunakan proyek untuk menginkubasi produk dan solusi

  1. Gunakan proyek untuk menginkubasi produk Setelah menyelesaikan beberapa proyek, ekstrak solusi teknis yang sesuai. Kumpulan solusi ini kemungkinan besar bukanlah sebuah model, melainkan model besar + model kecil, dan akhirnya merupakan solusi komprehensif yang dibentuk oleh beberapa model.

  2. Dalam satu atau dua tahun terakhir, mungkin terjadi proses inovasi dan produksi produk, dan siklus pemulihan uang tunai akan relatif lama.

06、Agen

Bayangkan AI meniru tugas manusia sehari-hari untuk menangani sejumlah besar perilaku sosial manusia yang kompleks. Makalah dari Universitas Stanford berjudul "Agen Generatif: Simulacra Interaktif Perilaku Manusia, berjudul" membahas secara mendalam Agen AI yang mengingat, bereaksi, dan merencanakan. Agen AI dianggap sebagai arah selanjutnya dari upaya OpenAI. Salah satu pendiri OpenAI juga mengatakan pada acara baru-baru ini: "Dibandingkan dengan metode pelatihan model, OpenAI saat ini lebih memperhatikan perubahan di bidang Agen. Setiap kali makalah Agen AI baru diterbitkan, kami akan sangat bersemangat dan mendiskusikannya serius secara internal." .

  1. Kita selalu membayangkan model besar itu mahakuasa dan bisa menyelesaikan berbagai masalah? Apakah ini masalahnya? Model besar hanyalah model besar.

  2. Kami mengelola AI secara internal, yang disebut AI tak kasat mata. Di hadapan pengguna, kami tidak akan menekankan model apa atau berapa banyak parameter yang dimilikinya. Definisi kami tentang AI adalah bantuan manusia.

  3. Melewati model dan daya komputasi, peluang berikutnya mungkin adalah Agen.

  4. Masalah terbesar yang saat ini mempengaruhi penggunaan pelanggan: rasio input-output. Setelah Anda mencapai akhir percakapan dengan klien dan membicarakan anggaran proyek, jika itu murni terkait teks dan investasinya beberapa juta atau beberapa juta, klien tidak akan terlalu puas. Selain itu, jika model besar dimasukkan ke dalam lingkungan produksi aktual menggunakan agen AI untuk memecahkan masalah aktual, pelanggan akan bersedia membayar.

  5. Berdasarkan model besar, Agen AI telah meningkatkan kemampuan seperti memori, perencanaan, dan eksekusi. Kami telah berinvestasi di lebih dari 60 proyek start-up saat ini, lebih dari 20 di antaranya adalah Agen.

  6. Produk ToC, bentuk pembayaran dan bentuk produk sangat berbeda antara Tiongkok dan luar negeri. Baru-baru ini, kami telah berinvestasi di beberapa perusahaan agen.

  7. Namun, pada tahap ini, Agen AI masih dalam tahap percobaan baru, dan masih ada kesenjangan tertentu antara AI dan kecerdasan umum. Di masa depan, selain kemampuan komprehensif dari satu Agen AI, terobosan dalam kolaborasi dan kemampuan emosi antara beberapa Agen AI juga perlu diselesaikan.

  8. Pemain model besar harus memastikan bahwa mereka tetap berada di meja poker untuk mendapat kesempatan melihat hal-hal baru keluar di babak kedua.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)