Tangan pertama | Model besar Wenshengtu "Ketu" yang dikembangkan sendiri oleh Kuaishou telah hadir, dan telah memulai pengujian internal dalam waktu dekat

Sumber asli: GenAI Dunia Baru

Penulis|Li Hezi

Sumber gambar: Dihasilkan oleh AI Tanpa Batas‌

Sejak paruh kedua tahun ini, Kuaishou sudah sering mengembangkan bisnis model besar.

GenAI New World mengetahui secara langsung bahwa kemajuan terbaru Kuaishou di bidang AIGC - model grafik Vincent "Kolors" yang dikembangkan sendiri telah diluncurkan sepenuhnya di dalam perusahaan untuk pengujian internal.

Menyusul peluncuran model bahasa besar "KwaiYii" bulan lalu, Kuaishou meluncurkan model grafik Wensheng besar "Kolors" dalam waktu kurang dari sebulan. "Setelah itu, wilayah" Vincent Pictures "ditambahkan.

GenAI New World belajar dari anggota penelitian dan pengembangan tim proyek Ketu bahwa model besar "Ketu" Wenshengtu memiliki tiga fitur luar biasa, yaitu pemahaman teks yang kuat, karakterisasi detail yang kaya, dan transformasi gaya yang beragam.

Dari tata letak halaman beranda versi uji platform internal model besar "Ketu", kita dapat melihat bahwa platform tersebut telah memiliki prototipe produk yang matang.

Beranda beta platform internal model besar "Ketu".

Meskipun model besar "Ketu" belum memulai pengujian eksternal, kita masih bisa melihat sekilas performa spesifiknya dari fungsi "AI Game Review" yang diluncurkan oleh Aplikasi Kuaishou dua hari lalu.

"AI Game Review" telah diluncurkan untuk pengujian internal di situs utama Kuaishou pada tanggal 15 September, dengan dukungan teknis yang disediakan oleh model besar "Ketu" Wenshengtu.

Tepat ketika kami mengira ini adalah alat Wenshengtu lain yang murni untuk pembuat video pendek dan akan muncul di backend pengeditan video, secara mengejutkan Kuaishou menempatkan fungsi "AI Play Review" di area komentar.

Dengan kata lain, ketika Anda mengomentari video pendek tertentu di kemudian hari, Anda mungkin tidak perlu lagi bersusah payah mencari paket gambar/emoticon yang cocok, Kuaishou bisa langsung membuatkannya untuk Anda.

Pada hari peluncuran "AI Game Review", pengguna yang memenuhi syarat untuk pengujian sudah mulai meninggalkan pesan "seperti harapan" di area komentar resmi Kuaishou.

GenAI New World juga pertama kali memperoleh kualifikasi untuk pengujian internal, mari kita lihat pengalaman langsung kami.

Pertama, buka area komentar video apa pun di Aplikasi Kuaishou dan temukan tombol "AI" di sisi kanan kotak masukan komentar, Anda dapat dengan mudah masuk ke antarmuka fungsional "AI Play Review".

Prasyarat untuk menghasilkan gambar adalah Anda harus memasukkan teks minimal enam kata.Setelah memasukkan, ikon AI di sebelah kanan akan otomatis menyala, memberi tahu Anda bahwa Anda dapat mulai menghasilkan.

Pertama-tama cobalah beberapa deskripsi yang lebih konvensional untuk mengetahui apakah ia memahaminya, seperti "seorang anak bermain di pantai yang diterangi matahari".

Setelah beberapa detik, serangkaian gambar yang dihasilkan AI akan muncul di bawah. Setiap gambar ditandai dengan gaya yang berbeda, termasuk Makoto Shinkai, seni piksel, animasi realistis, gaya Cina, cyberpunk, Pixar, dll. Konon ada lebih dari selusin jenis. . Jika Anda tidak puas dengan kumpulan gambar yang dihasilkan, Anda juga dapat mengklik "Ubah" di sudut kanan atas untuk membuat kumpulan gambar baru.

Dilihat dari gambar yang dihasilkan, pemahamannya cukup baik.

Masukkan beberapa puisi Tiongkok kuno lagi, dan ia benar-benar memahaminya:

Dilihat dari detail gambarnya, baik tekstur daun dan kelopak yang halus, atau benang sari yang jelas, jarang sekali ditangani dengan baik (tepi mati di pinggiran daun juga tercermin).

Dikatakan bahwa tim peneliti Kuaishou AI telah mengubah formula dasar dan formula penambahan noise dari algoritma denoising, dan pada saat yang sama memilih kumpulan data berkualitas tinggi dengan detail tinggi dan estetika tinggi untuk melakukan pembelajaran terfokus di tahap selanjutnya. dari model pembelajaran. Hal ini dapat membuat detail dan tekstur gambar yang dihasilkan menjadi lebih kaya, yang pasti terkait dengan hal ini.

Mari masukkan beberapa frasa dengan arti spesifik dalam konteks Tiongkok:

Lumayan, setidaknya suwiran daging babi rasa ikannya tidak digambarkan sebagai ikan dan sepotong daging, dan pedasnya tahu mapo bisa tercium melalui layarnya (bahkan ditaburi daun bawang cincang).

Ia bahkan dapat memahami apa itu orang Gan Fan (“Gan Fan” aslinya adalah dialek Mandarin barat daya):

Pemahaman ekspresi Tionghoa pada model besar "Ketu" bisa dikatakan sudah dipertimbangkan sejak awal.

Menurut personel R&D Kuaishou, Kuaishou AI memiliki miliaran data pelatihan gambar dan teks, yang disintesis dari komunitas sumber terbuka dan teknologi AI yang dikembangkan sendiri, dan mencakup 30 juta konsep umum entitas Tiongkok. Model CLIP Cina.

LLM berbahasa Mandarin yang dikembangkan sendiri dikombinasikan dengan fitur grafis dan teks CLIP digunakan sebagai modul pemahaman teks grafik Vinsensian, memungkinkan model besar yang "dapat dibuat grafiknya" untuk lebih memahami konsep karakteristik Tiongkok dan mengurangi masalah umum di bidang grafik Vinsensian seperti konsep yang kompleks dan kebingungan atribut. .

Namun, karena fungsi "Review game AI" ditempatkan di area komentar, kita juga harus melihat bagaimana kinerjanya dalam skenario komentar.

Memanfaatkan topik hangat, saya memasukkan deskripsi suasana hati saya "Saya sangat frustrasi karena saya tidak bisa mendapatkan tiket kereta api". "AI Game Review" masih menghasilkan beberapa gambar menarik yang dapat lebih mencerminkan emosi ini:

Dan ketika saya mengetikkan ekspresi klasik "Saya tidak mengerti, tapi saya terkejut", saya menemukan bahwa gaya figur tongkat yang dihasilkan dan gaya Makoto Shinkai adalah yang paling tepat (jadwal gaya yang dihasilkan paling populer?):

Setelah pengalaman keseluruhan, "AI Game Review" masih luar biasa, tentu saja premisnya tetap bahwa AI dapat dipicu dengan deskripsi yang sesuai dan relatif umum. Dan jika memperhatikan ciri-ciri umum netizen yang bebas mengungkapkan suasana hati dan bahasa sehari-harinya saat berkomentar, fungsi ini masih bisa banyak dieksplorasi.

Dari fungsi "AI Game Review", sebenarnya kita dapat melihat beberapa pemikiran Kuaishou tentang penerapan model besar, yaitu adanya penekanan yang kuat pada "pendaratan".

Tidak seperti banyak perusahaan sebelumnya yang berkomitmen untuk membuat produk model besar untuk keperluan umum, komunitas konten video pendek seperti Kuaishou harus lebih memperhatikan integrasi dengan komunitas dalam pengembangan fungsi produk model besar, dan peduli apakah pengguna benar-benar dapat menggunakannya. .

Sama seperti fungsi "Dialog AI" yang diluncurkan pada bulan Agustus berdasarkan model besar "Ruyi", sebagiannya didasarkan pada skenario pencarian, memungkinkan pengguna menemukan konten di platform dengan lebih mudah dan akurat (jawabannya juga akan disertai dengan terkait video, tautan Ensiklopedia), gagasan melayani pengguna juga meluas ke "ulasan game AI".

Adapun kenapa model besar "Ketu" pertama kali diposting di kolom komentar situs Kuaishou, jawaban resmi Kuaishou adalah,

"Jumlah kumulatif pasangan pengguna aplikasi Kuaishou yang saling terkait melebihi 31,1 miliar, peningkatan dari tahun ke tahun hampir 50%, dan rata-rata interaksi harian (termasuk suka, komentar, penerusan, dll.) berjumlah 8 miliar kali . Video pendek yang sangat melekat pada pengguna Area komentar telah menjadi salah satu skenario penerapan terbaik untuk kemampuan AIGC... (menghabiskan waktu dan energi untuk menemukan gambar yang cocok) telah sangat menghambat kesediaan pengguna untuk mengirim komentar. Tinjauan AI dapat meningkatkan jumlah pengguna secara signifikan ' Antusiasme dan antusiasme untuk berpartisipasi dalam komentar. Kepuasan.”

Tentu saja, setelah model besar yang "dapat digambarkan" telah dibuat menjadi sebuah produk, Kuaishou mungkin memiliki ambisi yang lebih besar di baliknya.

Selama panggilan konferensi pendapatan kuartal pertama pada bulan Mei tahun ini, CEO Kuaishou Cheng Yixiao mengungkapkan kepada dunia luar untuk pertama kalinya kemajuan bisnis model besar Kuaishou: tim penelitian dan pengembangan model besar telah dibentuk, mengandalkan teknologi masa lalu di AIGC algoritma dan model bahasa skala besar. Mengumpulkan dan mempromosikan pengembangan dan pelatihan model besar sesuai rencana.

Dua bulan kemudian, Kuaishou mengumumkan pada tanggal 8 Juli bahwa mereka akan memulai pengujian internal terhadap “produk tanya jawab pencarian cerdas”, yang memulai peluncuran aplikasi model berskala besar.

Berikut ini adalah peluncuran produk dan fungsi yang relatif intensif: pada tanggal 8 Agustus, Kuaishou memulai pengujian internal fungsi “Percakapan AI”, pada tanggal 21 Agustus, model bahasa besar “Ruyi” memulai pengujian internal, dan pada tanggal 15 September, model bahasa utama “Ruyi” memulai pengujian internal. situs web meluncurkan pengujian internal fungsi "AI Game Review" ", hingga hari ini model besar" Ketu "Wenshengtu muncul...

Perlu dicatat bahwa Kuaishou secara resmi dan rinci memperkenalkan kemajuan bisnis model besarnya untuk pertama kalinya pada Konferensi Pencipta Fotosintetik yang diadakan untuk para pembuat platform pada 10 Agustus tahun ini.

Kuaishou mengumumkan sejumlah perkembangan pada konferensi ini untuk bisnis model besarnya, yang hingga saat ini jarang diungkapkan kepada dunia luar. Ini mencakup berbagai kemampuan untuk pembuatan teks, gambar, video dan bahkan materi 3D dan audio musik, yang mencakup semua aspek stimulasi kreatif, penambangan dan pengeditan materi serta produksi pembuatan video. Ini juga berfokus pada adegan siaran langsung untuk dengan cepat membuat milik pengguna. Solusi manusia digital kembar "Kuaishou Zhibo".

Bahkan konferensi tahunannya sendiri, termasuk poster dan penampilan tamu, jarang sekali diisi dengan unsur AIGC.

Kuaishou, yang memilih untuk mengembangkan model besarnya sendiri dari awal, tanpa disadari telah mengumpulkan banyak hal dan perlahan-lahan membangun apa yang disebutnya "solusi AIGC model besar modal penuh".

Oleh karena itu, dapat dikatakan bahwa Kuaishou telah mempersiapkan diri dengan baik saat meluncurkan model besar yang "tutuable" kali ini.

Meskipun perusahaan-perusahaan besar dalam negeri sudah mulai meluncurkan produk model besar mereka pada tahun ini, sejauh menyangkut perusahaan konten, tampaknya kita belum melihat produk yang benar-benar mengesankan. Bagaimana kita bisa melatih model yang andal? Berdasarkan model besar , lebih banyak cara bermain baru untuk perusahaan konten akan dieksplorasi, yang cukup menarik untuk dipikirkan.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)