Resim kaynağı: Sınırsız Yapay Zeka tarafından oluşturulmuştur
Bu yılın ikinci yarısından bu yana Kuaishou sık sık büyük model işler geliştiriyor.
GenAI New World, Kuaishou'nun AIGC alanındaki en son ilerlemesinin (kendi geliştirdiği Vincent grafik modeli "Kolors") şirket içi test için tamamen şirket içinde başlatıldığını ilk elden öğrendi.
Geçen ay büyük dil modeli "KwaiYii"nin piyasaya sürülmesinin ardından Kuaishou, büyük Wensheng grafik modeli "Kolors"u bir aydan kısa bir süre içinde piyasaya sürdü. "Ardından "Vincent Pictures" bölgesi eklendi.
GenAI New World, Ketu proje ekibinin araştırma ve geliştirme üyelerinden "Ketu" Wenshengtu büyük modelinin güçlü metin anlama, zengin ayrıntı karakterizasyonu ve çeşitli stil dönüşümü olmak üzere üç olağanüstü özelliğe sahip olduğunu öğrendi.
"Ketu" büyük model dahili platformunun test sürümünün ana sayfasının düzeninden, zaten olgun bir ürün prototipine sahip olduğunu görebiliriz.
"Ketu" büyük model dahili platform beta ana sayfası
Her ne kadar "Ketu" büyük modeli henüz harici testlere başlamamış olsa da, iki gün önce Kuaishou Uygulaması tarafından başlatılan "Yapay Zeka Oyun İncelemesi" fonksiyonundan özel performansına hala bir göz atabiliyoruz.
"AI Oyun İncelemesi", "Ketu" Wenshengtu büyük modeli tarafından sağlanan teknik destekle 15 Eylül'de Kuaishou'nun ana sitesinde dahili test için başlatıldı.
Tam da bunun yalnızca kısa video yaratıcılarına yönelik başka bir Wenshengtu aracı olduğunu ve video düzenleme arka ucunda görüneceğini düşündüğümüzde, Kuaishou şaşırtıcı bir şekilde "Yapay Zeka Oynatma İncelemesi" işlevini yorum alanına koydu.
Başka bir deyişle, gelecekte belirli bir kısa videoya yorum yaptığınızda artık uygun bir resim/ifade paketi bulmak için uğraşmanıza gerek kalmayabilir.Kuaishou doğrudan sizin için bir tane oluşturabilir.
"AI Oyun İncelemesi"nin yayınlandığı gün, teste hak kazanan kullanıcılar zaten Kuaishou'nun resmi yorum alanına "dilek benzeri" mesajlar bırakmaya başlamıştı.
GenAI New World aynı zamanda ilk kez dahili test yeterliliğini de elde etti, gelin ilk elden deneyimlerimize bir göz atalım.
Öncelikle Kuaishou Uygulamasında herhangi bir videonun yorum alanını açın ve yorum giriş kutusunun sağ tarafındaki "AI" düğmesini bulun. "AI Play Review" işlevsel arayüzüne kolayca girebilirsiniz.
Görüntü oluşturmanın ön koşulu, en az altı kelimelik bir metin girmeniz gerektiğidir.Girdikten sonra sağdaki AI simgesi otomatik olarak yanarak oluşturmaya başlayabileceğinizi söyleyecektir.
Öncelikle, "güneşli bir kumsalda oynayan bir çocuk" gibi, anlayıp anlamadığını görmek için daha geleneksel tanımlamaları deneyin.
Birkaç saniye sonra, aşağıda AI tarafından oluşturulan bir dizi görüntü görünecek. Her görüntü, Makoto Shinkai, piksel sanatı, gerçekçi animasyon, Çin stili, siberpunk, Pixar vb. dahil olmak üzere farklı bir stille işaretlenmiştir. bir düzineden fazla tür. . Oluşturulan resim setlerinden memnun değilseniz, yeni bir set oluşturmak için sağ üst köşedeki "Değiştir" seçeneğine de tıklayabilirsiniz.
Oluşturulan görüntülere bakılırsa anlayış oldukça iyi.
Birkaç eski Çin şiiri daha girin ve onları gerçekten anlayın:
Resmin ayrıntılarına bakılırsa, ister yaprakların ve yaprakların ince dokusu, ister açıkça tanımlanmış erkek organlar olsun, bunların iyi işlendiği nadirdir (yaprakların çevresindeki ölü kenarlar da yansıtılmıştır).
Kuaishou AI araştırma ekibinin, gürültü giderme algoritmasının temel formülünü ve gürültü ekleme formülünü değiştirdiği ve aynı zamanda sonraki aşamalarda odaklanmış öğrenmeyi gerçekleştirmek için yüksek ayrıntılara ve yüksek estetiğe sahip yüksek kaliteli bir veri kümesi seçtiği söyleniyor. model öğrenimi. Oluşturulan resimlerin detaylarını ve dokusunu daha zengin hale getirebilir, bu da bununla bağlantılı olmalıdır.
Çince bağlamda belirli anlamlara sahip bazı ifadeleri girelim:
Fena değil, en azından balık aromalı kıyılmış domuz eti bir balık ve bir parça et olarak gösterilmiyor ve ekrandan Mapo tofu'nun baharatlı kokusunu alabiliyorsunuz (hatta doğranmış yeşil soğanla süslenmiş).
Gan Fan insanının ne olduğunu bile anlayabilir (“Gan Fan” aslen güneybatı Mandarin lehçesidir):
“Ketu” büyük modelinde Çince ifadelerin anlaşılmasının baştan itibaren dikkate alındığı söylenebilir.
Kuaishou Ar-Ge personeline göre Kuaishou AI, açık kaynak topluluğundan ve kendi geliştirdiği AI teknolojisinden sentezlenen ve 30 milyon ortak Çin varlık konseptini kapsayan milyarlarca görüntü ve metin eğitim verisine sahiptir. Çin CLIP modeli.
CLIP'in grafik ve metin özellikleriyle birleştirilmiş kendi geliştirdiği Çince LLM, Vincent grafiğinin metin anlama modülü olarak kullanılır ve "grafiklenebilir" büyük modelin Çince karakteristik kavramlarını daha iyi anlamasına ve Vincent grafikleri alanındaki yaygın sorunları azaltmasına olanak tanır. karmaşık kavramlar ve nitelik karmaşası gibi.
Ancak "AI oyun incelemesi" işlevi yorum alanına yerleştirildiği için yorum senaryosunda nasıl performans gösterdiğine de göz atmalıyız.
Sıcak bir konunun avantajından yararlanarak ruh halimin açıklamasını girdim: "Tren bileti alamadığım için çok sinirliyim." "AI Play İncelemesi" yine de bu duyguyu daha iyi yansıtabilecek bazı ilginç görüntüler oluşturdu:
Ve klasik "Anlamıyorum ama şok oldum" ifadesini yazdığımda, oluşturulan çöp adam stilinin ve Makoto Shinkai'nin stilinin en uygun olduğunu buldum (planlanan en popüler oluşturulan stil?):
Genel deneyimden sonra, "Yapay Zeka Oyun İncelemesi" hala dikkate değer. Tabii ki, öncül hala yapay zekanın uygun ve nispeten yaygın açıklamalarla yönlendirilebileceği yönünde. Ve netizenlerin yorum yaparken ruh hallerini ve konuşma dillerini özgürce ifade etmelerinin genel özelliklerini dikkate alırsanız, bu işlev hala çokça araştırılabilir.
"Yapay Zeka Oyun İncelemesi" işlevinden aslında Kuaishou'nun büyük modellerin uygulanmasına ilişkin bazı düşüncelerini görebiliyoruz, yani "iniş" konusuna güçlü bir vurgu var.
Genel amaçlı büyük model ürünler oluşturmaya kendini adamış birçok eski şirketin aksine, Kuaishou gibi kısa video içerik toplulukları, büyük model ürün işlevlerinin geliştirilmesinde toplulukla entegrasyona daha fazla dikkat etmeli ve kullanıcıların bunları gerçekten kullanıp kullanamayacağına önem vermelidir. .
Tıpkı Ağustos ayında "Ruyi" büyük modelini temel alan "Yapay Zeka diyalogu" işlevi gibi, bunun bir kısmı da arama senaryolarına dayanıyor ve kullanıcıların platformdaki içeriği daha kolay ve doğru bir şekilde bulmasına olanak tanıyor (cevaplara ilgili bilgiler de eşlik edecek) videolar, Ansiklopedi bağlantısı), kullanıcılara hizmet etme fikri aynı zamanda "Yapay Zeka oyun incelemeleri"ne de uzanıyor.
"Ketu" büyük modelinin neden Kuaishou sitesindeki yorum alanında ilk kez yayınlandığı sorusuna Kuaishou'nun resmi yanıtı şu şekilde:
"Kuaishou uygulamalarının karşılıklı ilişkili kullanıcı çiftlerinin kümülatif sayısı, yıllık bazda yaklaşık %50 artışla 31,1 milyarı aşıyor ve ortalama günlük etkileşim (beğeniler, yorumlar, yönlendirme vb. dahil) toplamı 8 milyara ulaşıyor. Güçlü kullanıcı bağlılığına sahip kısa videolar Yorum alanı, AIGC yetenekleri için en iyi uygulama senaryolarından biri haline geldi... (eşleşen resimleri bulmak için zaman ve enerji harcamak), kullanıcıların yorum gönderme isteğini büyük ölçüde engelledi. Yorumlara katılma heyecanı ve coşkusu. Memnuniyet.”
Elbette artık "resimde görülebilen" büyük model bir ürüne dönüştürüldüğüne göre, Kuaishou'nun bunun arkasında daha büyük hırsları olabilir.
Bu yılın mayıs ayında yapılan ilk çeyrek kazanç konferansı görüşmesi sırasında Kuaishou CEO'su Cheng Yixiao, Kuaishou'nun büyük model işinin ilerleyişini ilk kez dış dünyaya açıkladı: AIGC'deki geçmiş teknolojilere dayanan büyük bir model araştırma ve geliştirme ekibi kuruldu Algoritmalar ve büyük ölçekli dil modelleri Büyük model geliştirme ve eğitimini planlandığı gibi biriktirin ve teşvik edin.
İki ay sonra Kuaishou, 8 Temmuz'da "arama akıllı soru ve cevap ürününün" dahili testlerine başlayacağını ve büyük ölçekli model uygulamalarının lansmanını başlatacağını duyurdu.
Aşağıda nispeten yoğun bir ürün ve işlev sürümü yer almaktadır: 8 Ağustos'ta Kuaishou, "AI Conversation" işlevinin dahili testine başladı; 21 Ağustos'ta büyük dil modeli "Ruyi" dahili teste başladı ve 15 Eylül'de ana web sitesi "AI Oyun İncelemesi" işlevinin dahili testini başlattı, bugüne kadar "Ketu" Wenshengtu'nun büyük modeli ortaya çıktı...
Kuaishou'nun, büyük model işinin ilerleyişini bu yıl 10 Ağustos'ta platform yaratıcıları için düzenlenen Fotosentetik İçerik Oluşturucu Konferansı'nda ilk kez resmi ve ayrıntılı olarak tanıttığını belirtmekte fayda var.
Kuaishou, şimdiye kadar dış dünyaya nadiren açıklanan büyük model işiyle ilgili bir dizi gelişmeyi bu konferansta duyurdu. Bu, yaratıcı uyarım, malzeme madenciliği ve düzenleme ve video oluşturma prodüksiyonunun tüm yönlerini kapsayan metin, görüntü, video ve hatta 3D malzeme ve müzik sesi oluşturmaya yönelik çeşitli yetenekleri içerir.Aynı zamanda kullanıcının kendi sahnesini hızlı bir şekilde oluşturmak için canlı yayın sahnesine de odaklanır. İkiz dijital insan çözümü "Kuaishou Zhibo".
Posterler ve konukların katılımı da dahil olmak üzere yıllık konferansın kendisi bile nadiren AIGC unsurlarıyla doludur.
Kendi büyük modelini sıfırdan geliştirmeyi seçen Kuaishou, farkında olmadan pek çok şeyi biriktirdi ve yavaş yavaş "tam modlu büyük model AIGC çözümü" dediği şeyi inşa etti.
Dolayısıyla Kuaishou'nun bu sefer "tutuable" büyük bir modeli piyasaya sürmeye oldukça hazırlıklı olduğu söylenebilir.
Her ne kadar yerli büyük firmalar bu yıl kendi büyük model ürünlerini piyasaya sürmeye başlasalar da içerik firmaları açısından bakıldığında gerçekten etkileyici bir ürün görememişiz gibi görünüyor.Güvenilir bir modeli nasıl yetiştirebiliriz?Büyük modeller bazında içerik şirketleri için daha fazla yeni oyun oynama yolları keşfedilecek ve bunu düşünmek oldukça heyecan verici.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
İlk elden | Kuaishou'nun kendi geliştirdiği Wenshengtu büyük modeli "Ketu" burada ve yakın gelecekte dahili testlere başladı
Orijinal kaynak: GenAI Yeni Dünya
Yazar|Li Hezi
Bu yılın ikinci yarısından bu yana Kuaishou sık sık büyük model işler geliştiriyor.
GenAI New World, Kuaishou'nun AIGC alanındaki en son ilerlemesinin (kendi geliştirdiği Vincent grafik modeli "Kolors") şirket içi test için tamamen şirket içinde başlatıldığını ilk elden öğrendi.
Geçen ay büyük dil modeli "KwaiYii"nin piyasaya sürülmesinin ardından Kuaishou, büyük Wensheng grafik modeli "Kolors"u bir aydan kısa bir süre içinde piyasaya sürdü. "Ardından "Vincent Pictures" bölgesi eklendi.
GenAI New World, Ketu proje ekibinin araştırma ve geliştirme üyelerinden "Ketu" Wenshengtu büyük modelinin güçlü metin anlama, zengin ayrıntı karakterizasyonu ve çeşitli stil dönüşümü olmak üzere üç olağanüstü özelliğe sahip olduğunu öğrendi.
"Ketu" büyük model dahili platformunun test sürümünün ana sayfasının düzeninden, zaten olgun bir ürün prototipine sahip olduğunu görebiliriz.
Her ne kadar "Ketu" büyük modeli henüz harici testlere başlamamış olsa da, iki gün önce Kuaishou Uygulaması tarafından başlatılan "Yapay Zeka Oyun İncelemesi" fonksiyonundan özel performansına hala bir göz atabiliyoruz.
"AI Oyun İncelemesi", "Ketu" Wenshengtu büyük modeli tarafından sağlanan teknik destekle 15 Eylül'de Kuaishou'nun ana sitesinde dahili test için başlatıldı.
Tam da bunun yalnızca kısa video yaratıcılarına yönelik başka bir Wenshengtu aracı olduğunu ve video düzenleme arka ucunda görüneceğini düşündüğümüzde, Kuaishou şaşırtıcı bir şekilde "Yapay Zeka Oynatma İncelemesi" işlevini yorum alanına koydu.
Başka bir deyişle, gelecekte belirli bir kısa videoya yorum yaptığınızda artık uygun bir resim/ifade paketi bulmak için uğraşmanıza gerek kalmayabilir.Kuaishou doğrudan sizin için bir tane oluşturabilir.
"AI Oyun İncelemesi"nin yayınlandığı gün, teste hak kazanan kullanıcılar zaten Kuaishou'nun resmi yorum alanına "dilek benzeri" mesajlar bırakmaya başlamıştı.
Öncelikle Kuaishou Uygulamasında herhangi bir videonun yorum alanını açın ve yorum giriş kutusunun sağ tarafındaki "AI" düğmesini bulun. "AI Play Review" işlevsel arayüzüne kolayca girebilirsiniz.
Öncelikle, "güneşli bir kumsalda oynayan bir çocuk" gibi, anlayıp anlamadığını görmek için daha geleneksel tanımlamaları deneyin.
Birkaç saniye sonra, aşağıda AI tarafından oluşturulan bir dizi görüntü görünecek. Her görüntü, Makoto Shinkai, piksel sanatı, gerçekçi animasyon, Çin stili, siberpunk, Pixar vb. dahil olmak üzere farklı bir stille işaretlenmiştir. bir düzineden fazla tür. . Oluşturulan resim setlerinden memnun değilseniz, yeni bir set oluşturmak için sağ üst köşedeki "Değiştir" seçeneğine de tıklayabilirsiniz.
Oluşturulan görüntülere bakılırsa anlayış oldukça iyi.
Çince bağlamda belirli anlamlara sahip bazı ifadeleri girelim:
Gan Fan insanının ne olduğunu bile anlayabilir (“Gan Fan” aslen güneybatı Mandarin lehçesidir):
Kuaishou Ar-Ge personeline göre Kuaishou AI, açık kaynak topluluğundan ve kendi geliştirdiği AI teknolojisinden sentezlenen ve 30 milyon ortak Çin varlık konseptini kapsayan milyarlarca görüntü ve metin eğitim verisine sahiptir. Çin CLIP modeli.
CLIP'in grafik ve metin özellikleriyle birleştirilmiş kendi geliştirdiği Çince LLM, Vincent grafiğinin metin anlama modülü olarak kullanılır ve "grafiklenebilir" büyük modelin Çince karakteristik kavramlarını daha iyi anlamasına ve Vincent grafikleri alanındaki yaygın sorunları azaltmasına olanak tanır. karmaşık kavramlar ve nitelik karmaşası gibi.
Ancak "AI oyun incelemesi" işlevi yorum alanına yerleştirildiği için yorum senaryosunda nasıl performans gösterdiğine de göz atmalıyız.
Sıcak bir konunun avantajından yararlanarak ruh halimin açıklamasını girdim: "Tren bileti alamadığım için çok sinirliyim." "AI Play İncelemesi" yine de bu duyguyu daha iyi yansıtabilecek bazı ilginç görüntüler oluşturdu:
"Yapay Zeka Oyun İncelemesi" işlevinden aslında Kuaishou'nun büyük modellerin uygulanmasına ilişkin bazı düşüncelerini görebiliyoruz, yani "iniş" konusuna güçlü bir vurgu var.
Genel amaçlı büyük model ürünler oluşturmaya kendini adamış birçok eski şirketin aksine, Kuaishou gibi kısa video içerik toplulukları, büyük model ürün işlevlerinin geliştirilmesinde toplulukla entegrasyona daha fazla dikkat etmeli ve kullanıcıların bunları gerçekten kullanıp kullanamayacağına önem vermelidir. .
Tıpkı Ağustos ayında "Ruyi" büyük modelini temel alan "Yapay Zeka diyalogu" işlevi gibi, bunun bir kısmı da arama senaryolarına dayanıyor ve kullanıcıların platformdaki içeriği daha kolay ve doğru bir şekilde bulmasına olanak tanıyor (cevaplara ilgili bilgiler de eşlik edecek) videolar, Ansiklopedi bağlantısı), kullanıcılara hizmet etme fikri aynı zamanda "Yapay Zeka oyun incelemeleri"ne de uzanıyor.
"Ketu" büyük modelinin neden Kuaishou sitesindeki yorum alanında ilk kez yayınlandığı sorusuna Kuaishou'nun resmi yanıtı şu şekilde:
Elbette artık "resimde görülebilen" büyük model bir ürüne dönüştürüldüğüne göre, Kuaishou'nun bunun arkasında daha büyük hırsları olabilir.
Bu yılın mayıs ayında yapılan ilk çeyrek kazanç konferansı görüşmesi sırasında Kuaishou CEO'su Cheng Yixiao, Kuaishou'nun büyük model işinin ilerleyişini ilk kez dış dünyaya açıkladı: AIGC'deki geçmiş teknolojilere dayanan büyük bir model araştırma ve geliştirme ekibi kuruldu Algoritmalar ve büyük ölçekli dil modelleri Büyük model geliştirme ve eğitimini planlandığı gibi biriktirin ve teşvik edin.
İki ay sonra Kuaishou, 8 Temmuz'da "arama akıllı soru ve cevap ürününün" dahili testlerine başlayacağını ve büyük ölçekli model uygulamalarının lansmanını başlatacağını duyurdu.
Aşağıda nispeten yoğun bir ürün ve işlev sürümü yer almaktadır: 8 Ağustos'ta Kuaishou, "AI Conversation" işlevinin dahili testine başladı; 21 Ağustos'ta büyük dil modeli "Ruyi" dahili teste başladı ve 15 Eylül'de ana web sitesi "AI Oyun İncelemesi" işlevinin dahili testini başlattı, bugüne kadar "Ketu" Wenshengtu'nun büyük modeli ortaya çıktı...
Kuaishou'nun, büyük model işinin ilerleyişini bu yıl 10 Ağustos'ta platform yaratıcıları için düzenlenen Fotosentetik İçerik Oluşturucu Konferansı'nda ilk kez resmi ve ayrıntılı olarak tanıttığını belirtmekte fayda var.
Kuaishou, şimdiye kadar dış dünyaya nadiren açıklanan büyük model işiyle ilgili bir dizi gelişmeyi bu konferansta duyurdu. Bu, yaratıcı uyarım, malzeme madenciliği ve düzenleme ve video oluşturma prodüksiyonunun tüm yönlerini kapsayan metin, görüntü, video ve hatta 3D malzeme ve müzik sesi oluşturmaya yönelik çeşitli yetenekleri içerir.Aynı zamanda kullanıcının kendi sahnesini hızlı bir şekilde oluşturmak için canlı yayın sahnesine de odaklanır. İkiz dijital insan çözümü "Kuaishou Zhibo".
Posterler ve konukların katılımı da dahil olmak üzere yıllık konferansın kendisi bile nadiren AIGC unsurlarıyla doludur.
Kendi büyük modelini sıfırdan geliştirmeyi seçen Kuaishou, farkında olmadan pek çok şeyi biriktirdi ve yavaş yavaş "tam modlu büyük model AIGC çözümü" dediği şeyi inşa etti.
Dolayısıyla Kuaishou'nun bu sefer "tutuable" büyük bir modeli piyasaya sürmeye oldukça hazırlıklı olduğu söylenebilir.
Her ne kadar yerli büyük firmalar bu yıl kendi büyük model ürünlerini piyasaya sürmeye başlasalar da içerik firmaları açısından bakıldığında gerçekten etkileyici bir ürün görememişiz gibi görünüyor.Güvenilir bir modeli nasıl yetiştirebiliriz?Büyük modeller bazında içerik şirketleri için daha fazla yeni oyun oynama yolları keşfedilecek ve bunu düşünmek oldukça heyecan verici.