Shengshu Technology Mart 2023'te kuruldu.Çekirdek üyelerin çoğu Tsinghua Üniversitesi Yapay Zeka Okulu'ndan.Çin'de çok modlu genel büyük ölçekli modeller kullanan ilk ekiplerden biri. Bu finansman turunu Ant Group yönetti, ardından Baidu Ventures ve Zhuoyuan Capital izledi.Mevcut değerleme 100 milyon ABD dolarıdır.
Yerli çok modlu büyük ölçekli modellerin geliştirilmesinde yeni eğilimler var. 19 Haziran'da, Tsinghua Üniversitesi'nde bilgisayar bilimi profesörü ve Yapay Zeka Enstitüsü başkan yardımcısı Zhu Jun liderliğindeki yeni bir ekip, yaklaşık 100 milyon yuan'lık bir melek finansman turunu tamamladı.
Pengpai Technology (Pekin Shengshu Technology Co., Ltd. (bundan sonra "Shengshu Technology" olarak anılacaktır) adlı bu çok modlu büyük ölçekli model başlangıç şirketinin yaklaşık 100 milyon yuan'lık bir melek finansman turunun tamamlandığını duyurduğunu öğrendim. Yatırım Ant Group tarafından yönetildi. Ardından Baidu Ventures ve Zhuoyuan Capital tarafından takip edildi, mevcut değerleme 100 milyon ABD dolarıdır. Bu finansman turu, esas olarak çekirdek Ar-Ge ekibinin inşası için kullanılacak ve çok modlu büyük geliştirmenin hızlandırılması için kullanılacaktır. -ölçekli modeller ve uygulama ürünleri.
Çok modlu büyük model, eğitim için metin, resim, video ve ses gibi çok modlu bilgileri birleştiren bir modeli ifade eder. Daha önce, OpenAI kurucu ortağı Ilya Sutskever (Ilya Sutskever), "Yapay zekanın uzun vadeli hedefi, çok modlu bir sinir ağı oluşturmaktır, yani yapay zeka, dünyayı daha iyi anlamak için farklı yöntemler arasındaki kavramları öğrenebilir" demişti. .
Shengshu modeli tarafından desteklenen görüntü oluşturma.
Shengshu Technology, Mart 2023'te kuruldu. Beijing Ruilai Smart Technology Co., Ltd., Ant Group ve Baidu Venture Capital tarafından ortaklaşa kuruldu.Ruilai Smart'ın eski başkan yardımcısı ve Tsinghua Üniversitesi Bilgisayar Bölümü'nden mezun olan Tang Jiayu, görev yaptı. CEO olarak Kontrol edilebilir çok modlu genel amaçlı büyük bir model oluşturmak için kullanılır. Ant Group'un ChatGPT'nin popülaritesinden sonra ilk kez büyük ölçekli bir model şirkete yatırım yaptığı ve ayrıca Zhu Jun'un Ruilai Wisdom'dan sonraki ikinci girişimi olduğu bildirildi. Ruilai Wisdom, yapay zeka altyapısı ve çözümleri sağlayıcısıdır.
Shengshu Teknoloji ekibinin çekirdek üyeleri, çoğunlukla Zhu Jun liderliğindeki araştırma grubu olan Tsinghua Üniversitesi Yapay Zeka Enstitüsünden gelmektedir. Araştırma grubu, Bayesçi makine öğreniminin temel teorisine ve verimli algoritma araştırmasına kendini adamıştır ve derin olasılıksal üretken modelleri inceleyen dünyadaki en eski ekiplerden biridir. Ocak 2022'de, ekip tarafından önerilen eğitim dışı muhakeme çerçevesi Analytic-DPM, OpenAI tarafından DALL E 2 model işleme stratejisine uygulandı ve ardından, şu anda dünyanın en hızlı görüntü oluşturma algoritması olan örnekleme algoritması DPM-Solver önerildi. Kararlı Difüzyon algoritması ve diğer çok sayıda açık kaynak projeleri tarafından benimsenmiştir.
Videodaki ekran öğelerini değiştirin (komut istemi: nehirde yüzen bir Swarovski kristal kuğu), en solda orijinal video, ortada dijital teknoloji efekti ve en sağda Pist efekti.
Raporlara göre, Shengshu Technology, Çin'de çok modlu genel amaçlı büyük ölçekli modeller ortaya koyan ilk ekiplerden biridir. 2023'ün başlarında dünyanın ilk Transformer tabanlı çok modlu difüzyon büyük ölçekli modeli UniDiffuser'ı açık kaynak olarak aldı. Görüntü tabanlı metin oluşturma, görüntü-metin ortak oluşturma ve görüntü-metin yeniden yazma gibi çeşitli oluşturma görevlerini tamamlayın.
Transformer modeli, 2017 yılında Google'da bir ekip tarafından kullanıma sunuldu. Girilen verilerin her bir bölümünün önemine göre farklı ağırlıklar atayabilen bir derin öğrenme modelidir. Bu model ağırlıklı olarak doğal dil işleme (NLP) ve bilgisayarla görme (CV) alanlarında kullanılmaktadır. Şu anda, GPT gibi büyük büyük modeller Transformer'a dayalı olarak geliştirilmektedir.
"Genel olarak, endüstride büyük ölçekli görüntü oluşturma modelleri yapma konusundaki mevcut fikir aynıdır ve bunların tümü yayılma modeline dayanmaktadır. Yeniliğimiz, temeldeki ana ağı değiştirmekte yatıyor. çok modlu bir tutum elde etmek için Difüzyon Modeli teknolojisinde Transformer'ı ilk kullanan kişi." Tang Jiayu yakın zamanda medyaya verdiği bir röportajda söyledi.
Tang Jiayu, bu aşamada piyasadaki modellerin ve ürünlerin yalnızca ilk aşamada üretilebilirlik sorununu çözdüğüne inanıyor, ancak üretilen sonuçlar hala büyük bir belirsizlik ve kontrol edilemezliğe sahip. oluşturulan görüntüdeki öğelerin konumunu ve ayrıntılarını kontrol eder ve oluşturulan 3B model, yüzey inceliği ve renk, ışık ve gölge doğruluğu açısından hala nispeten düşük bir seviyededir.
3B içerik oluşturma (ipucu: Gökkuşağı makaronlarından oluşan büyük bir sepetin üzerinde duran bir alakargayı gösteren bir DSLR fotoğrafı).
Shengshu Teknolojisi, Pengpai Teknolojisine, 3D içerik üretimi açısından, üç görünüme dayalı otomatik olarak 3D içerik oluşturmak için endüstrinin ilk teknolojisini ve herhangi bir 3D eğitim verisi gerektirmeyen Wensheng 3D içerik teknolojisini geliştirdiğini tanıttı ve etki olabilir. ince ayrıntılı, endüstriyel düzeydeki uygulamalara yakın olabilir, "Eğitilen büyük model, görüntü oluşturma açısından Stable Difusion'ın temel modelinin en son sürümünü geride bıraktı ve bu yıl içinde Midjourney'in en son sürümünü yakalaması bekleniyor. ."
Stable Diffusion, yeni kurulan StabilityAI, CompVis ve Runway tarafından geliştirilen bir metinden görüntüye oluşturma modelidir. 2022'de piyasaya sürüldü ve artık açık kaynak. Midjourney, Mart 2022'de kullanıma sunulan bir metinden görüntüye oluşturma aracıdır. Birden çok yinelemeden geçti ve genel beta aşamasına girdi. Gerçekçi etkileri, Çin İnternetinde hararetli tartışmalara yol açtı. Hem Stable Diffusion hem de Midjourney, dünya çapında endüstri lideri ve yüksek puan alan AI araçlarıdır.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Düzen çok modlu büyük ölçekli model: Tsinghua Üniversitesi ekibi, Ant liderliğindeki melek turu finansmanında yaklaşık 100 milyon yuan'ı tamamladı
Yazar: Kağıt
Muhabir Shao Wen
Shengshu Technology Mart 2023'te kuruldu.Çekirdek üyelerin çoğu Tsinghua Üniversitesi Yapay Zeka Okulu'ndan.Çin'de çok modlu genel büyük ölçekli modeller kullanan ilk ekiplerden biri. Bu finansman turunu Ant Group yönetti, ardından Baidu Ventures ve Zhuoyuan Capital izledi.Mevcut değerleme 100 milyon ABD dolarıdır.
Yerli çok modlu büyük ölçekli modellerin geliştirilmesinde yeni eğilimler var. 19 Haziran'da, Tsinghua Üniversitesi'nde bilgisayar bilimi profesörü ve Yapay Zeka Enstitüsü başkan yardımcısı Zhu Jun liderliğindeki yeni bir ekip, yaklaşık 100 milyon yuan'lık bir melek finansman turunu tamamladı.
Pengpai Technology (Pekin Shengshu Technology Co., Ltd. (bundan sonra "Shengshu Technology" olarak anılacaktır) adlı bu çok modlu büyük ölçekli model başlangıç şirketinin yaklaşık 100 milyon yuan'lık bir melek finansman turunun tamamlandığını duyurduğunu öğrendim. Yatırım Ant Group tarafından yönetildi. Ardından Baidu Ventures ve Zhuoyuan Capital tarafından takip edildi, mevcut değerleme 100 milyon ABD dolarıdır. Bu finansman turu, esas olarak çekirdek Ar-Ge ekibinin inşası için kullanılacak ve çok modlu büyük geliştirmenin hızlandırılması için kullanılacaktır. -ölçekli modeller ve uygulama ürünleri.
Çok modlu büyük model, eğitim için metin, resim, video ve ses gibi çok modlu bilgileri birleştiren bir modeli ifade eder. Daha önce, OpenAI kurucu ortağı Ilya Sutskever (Ilya Sutskever), "Yapay zekanın uzun vadeli hedefi, çok modlu bir sinir ağı oluşturmaktır, yani yapay zeka, dünyayı daha iyi anlamak için farklı yöntemler arasındaki kavramları öğrenebilir" demişti. .
Shengshu Technology, Mart 2023'te kuruldu. Beijing Ruilai Smart Technology Co., Ltd., Ant Group ve Baidu Venture Capital tarafından ortaklaşa kuruldu.Ruilai Smart'ın eski başkan yardımcısı ve Tsinghua Üniversitesi Bilgisayar Bölümü'nden mezun olan Tang Jiayu, görev yaptı. CEO olarak Kontrol edilebilir çok modlu genel amaçlı büyük bir model oluşturmak için kullanılır. Ant Group'un ChatGPT'nin popülaritesinden sonra ilk kez büyük ölçekli bir model şirkete yatırım yaptığı ve ayrıca Zhu Jun'un Ruilai Wisdom'dan sonraki ikinci girişimi olduğu bildirildi. Ruilai Wisdom, yapay zeka altyapısı ve çözümleri sağlayıcısıdır.
Shengshu Teknoloji ekibinin çekirdek üyeleri, çoğunlukla Zhu Jun liderliğindeki araştırma grubu olan Tsinghua Üniversitesi Yapay Zeka Enstitüsünden gelmektedir. Araştırma grubu, Bayesçi makine öğreniminin temel teorisine ve verimli algoritma araştırmasına kendini adamıştır ve derin olasılıksal üretken modelleri inceleyen dünyadaki en eski ekiplerden biridir. Ocak 2022'de, ekip tarafından önerilen eğitim dışı muhakeme çerçevesi Analytic-DPM, OpenAI tarafından DALL E 2 model işleme stratejisine uygulandı ve ardından, şu anda dünyanın en hızlı görüntü oluşturma algoritması olan örnekleme algoritması DPM-Solver önerildi. Kararlı Difüzyon algoritması ve diğer çok sayıda açık kaynak projeleri tarafından benimsenmiştir.
Raporlara göre, Shengshu Technology, Çin'de çok modlu genel amaçlı büyük ölçekli modeller ortaya koyan ilk ekiplerden biridir. 2023'ün başlarında dünyanın ilk Transformer tabanlı çok modlu difüzyon büyük ölçekli modeli UniDiffuser'ı açık kaynak olarak aldı. Görüntü tabanlı metin oluşturma, görüntü-metin ortak oluşturma ve görüntü-metin yeniden yazma gibi çeşitli oluşturma görevlerini tamamlayın.
Transformer modeli, 2017 yılında Google'da bir ekip tarafından kullanıma sunuldu. Girilen verilerin her bir bölümünün önemine göre farklı ağırlıklar atayabilen bir derin öğrenme modelidir. Bu model ağırlıklı olarak doğal dil işleme (NLP) ve bilgisayarla görme (CV) alanlarında kullanılmaktadır. Şu anda, GPT gibi büyük büyük modeller Transformer'a dayalı olarak geliştirilmektedir.
"Genel olarak, endüstride büyük ölçekli görüntü oluşturma modelleri yapma konusundaki mevcut fikir aynıdır ve bunların tümü yayılma modeline dayanmaktadır. Yeniliğimiz, temeldeki ana ağı değiştirmekte yatıyor. çok modlu bir tutum elde etmek için Difüzyon Modeli teknolojisinde Transformer'ı ilk kullanan kişi." Tang Jiayu yakın zamanda medyaya verdiği bir röportajda söyledi.
Tang Jiayu, bu aşamada piyasadaki modellerin ve ürünlerin yalnızca ilk aşamada üretilebilirlik sorununu çözdüğüne inanıyor, ancak üretilen sonuçlar hala büyük bir belirsizlik ve kontrol edilemezliğe sahip. oluşturulan görüntüdeki öğelerin konumunu ve ayrıntılarını kontrol eder ve oluşturulan 3B model, yüzey inceliği ve renk, ışık ve gölge doğruluğu açısından hala nispeten düşük bir seviyededir.
Shengshu Teknolojisi, Pengpai Teknolojisine, 3D içerik üretimi açısından, üç görünüme dayalı otomatik olarak 3D içerik oluşturmak için endüstrinin ilk teknolojisini ve herhangi bir 3D eğitim verisi gerektirmeyen Wensheng 3D içerik teknolojisini geliştirdiğini tanıttı ve etki olabilir. ince ayrıntılı, endüstriyel düzeydeki uygulamalara yakın olabilir, "Eğitilen büyük model, görüntü oluşturma açısından Stable Difusion'ın temel modelinin en son sürümünü geride bıraktı ve bu yıl içinde Midjourney'in en son sürümünü yakalaması bekleniyor. ."
Stable Diffusion, yeni kurulan StabilityAI, CompVis ve Runway tarafından geliştirilen bir metinden görüntüye oluşturma modelidir. 2022'de piyasaya sürüldü ve artık açık kaynak. Midjourney, Mart 2022'de kullanıma sunulan bir metinden görüntüye oluşturma aracıdır. Birden çok yinelemeden geçti ve genel beta aşamasına girdi. Gerçekçi etkileri, Çin İnternetinde hararetli tartışmalara yol açtı. Hem Stable Diffusion hem de Midjourney, dünya çapında endüstri lideri ve yüksek puan alan AI araçlarıdır.