Shanghai Yapay Zeka Laboratuvarı, Shusheng·Tianji LandMark'ın 3D gerçek sahne modelini yayınladı

2023-07-07 03:00:09

Kaynak: Kağıt

Muhabir Wu Tianyi Stajyer Chen Xiaorui

Resim kaynağı: Unbounded AI aracı tarafından oluşturulmuştur

· 100 milyar parametre ile dünyanın ilk NeRF 3D gerçek hayattaki büyük ölçekli modeli ·Sky LandMark birden çok şehir düzenleme işlevini destekleyebilir. Gösteride, Wukang Binası, stilini ve ışık ve gölge efektlerini farklı zaman dilimlerine göre değiştirmek için NeRF teknolojisini kullanabilir; Çin Kültür Sarayı, farklı katmanların genel dönüşünü veya dönüşünü gerçekleştirebilir.

·Shanghai Yapay Zeka Laboratuvarı, bilginler için üç temel çoklu modalite, Puyu ve Tianji modeli de dahil olmak üzere genel büyük ölçekli model sistemini başlattı.Aynı zamanda, büyük ölçekli model için ilk tam zincir açık kaynak sistemini başlattı. geliştirme ve uygulama.

6 Temmuz'da, 2023 Dünya Yapay Zeka Konferansı (WAIC) Bilimin Sınırları genel toplantısında, derin öğrenme ve bilgisayar bilimi uzmanı, Şanghay Yapay Zeka Laboratuvarı'nda profesör ve Hong Çin Üniversitesi'nde profesör olan Lin Dahua Kong, Shusheng Tianji LandMark'ın büyük bir 3D gerçek sahne modelini yayınladı ve teknik prensibi ve fonksiyonel uygulaması tanıtıldı.

Lin Dahua, Shusheng·Tianji LandMark'ın Şanghay Yapay Zeka Laboratuvarı, Hong Kong Çin Üniversitesi ve Şangay Ölçme ve Haritalama Enstitüsü tarafından ortaklaşa geliştirilen dünyanın ilk 100 milyar parametreli NeRF 3D gerçek hayattaki büyük modeli olduğunu söyledi.) Yetenek ışık alanı modellemesi, nesne seviyesinden şehir seviyesine kadar uzanır. Lin Dahua, Shusheng·Tianji LandMark'ın piyasaya sürülmesinin, "gelecekte şehir düzeyinde AIGC'yi (Yapay Zeka Üretilmiş İçerik) gerçekleştirmemiz için teknik olanak sağlayan" büyük modellerin yenilikçi bir uygulaması olduğunu söyledi.

Shusheng·Multimodal, Shusheng·Puyu ve Shusheng·Tianji'nin üç temel modelini ve ayrıca ilk büyük ölçekli model odaklı Ar-Ge ve uygulama için tam zincirli bir açık kaynak sistemi.

Bir elmadan bütün bir şehre

"Metin oluşturmanın yanı sıra, büyük model bize daha yaratıcı bir dünya da sunabilir." Lin Dahua, akademisyen Tianji LandMark'ın, büyük model teknolojisinin uygulanması için daha fazla olanak sağlamak üzere NeRF teknolojisini kullandığını söyledi.

NeRF, ilk olarak Mart 2020'de Google araştırma ekibi tarafından önerilen yeni bir 3B ışık alanı modelleme teknolojisi türüdür. Başlangıçta 3B modellemeye uygulandı ve küçük nesnelerin düzeyiyle (elma boyutu) sınırlıydı. . "Ancak NeRF teknolojisinin bundan daha fazlası olduğunu düşünüyoruz." Lin Dahua, "10 Aralık 2021'de ekibimiz, NeRF ışık alanı modelleme yeteneğini küçük bir elmanın nesne düzeyinden şehir düzeyine genişletmeyi ilk kez önerdi. Bu küresel NeRF teknolojisinin yeteneklerini nesnelerden şehirlere genişletmek ilk kez.. Araştırma ekiplerinin bir süre şehir düzeyinde NeRF önermesinin ardından, Carnegie Mellon Üniversitesi ve Google'ın kendi şehir düzeyinde NeRF teknolojilerini piyasaya sürdüğünü söyledi. .

10 Aralık 2021'de Lin Dahua'nın ekibi ilk olarak NeRF ışık alanı modelleme yeteneğini küçük bir elmanın nesne seviyesinden şehir seviyesine genişletmeyi önerdi.

"Şehir düzeyindeki NeRF'nin temel teknolojisine dayanarak, ölçeklenebilirliğini ve yeteneklerini sürekli olarak geliştiriyoruz." Lin Dahua, Shusheng·Tianji LandMark'ın 3D gerçek hayattaki büyük modelinin ikinci nesil CT NeRF teknolojisine ve algoritmasına dayandığını tanıttı. araştırma ekibinin bir ürünüdür ve 100 kilometre kareyi kapsayan 200 milyar parametre dahil olmak üzere çok çeşitli Yüksek hassasiyetli gerçek zamanlı işlemeyi destekler; gerçek sahnedeki her ayrıntı 4K yüksek çözünürlüklü çözünürlüğü destekler.

Real 3D, gerçek, üç boyutlu ve zaman sıralı insan üretimi, yaşam ve ekolojik mekanları belirli bir aralıkta yansıtan ve ifade eden dijital bir mekandır. Raporlara göre Shusheng·Tianji LandMark, algoritmaları, operatörleri ve bilgi işlem sistemlerini entegre eder ve model düzeyinde yeni bir gerçek dünya 3B model gösterimi ve eğitim paradigması önerir. ve Yüksek kaliteli nöral işleme efektleri elde edin. Dört açıdan liderliği ele alır: yüksek hassasiyetli modelleme, yüksek hassasiyetli işleme, işlevsel ölçeklenebilirlik ve eğitim ile etkileşimin entegrasyonu.

Shusheng·Tianji LandMark, şehir düzeyinde düzenleme ve stil dönüştürme gibi işlevleri de destekleyebilir. Gösteride Wukang Binası, NeRF teknolojisini kullanarak stilini ve ışık ve gölge efektlerini farklı zaman dilimlerine göre değiştirebilir; Çin Kültür Sarayı bir bütün olarak veya farklı katmanlar halinde döndürülebilir. Lin Dahua, "Bu, gelecekte şehir düzeyindeki AIGC'miz için teknik bir olasılık sağlıyor." Dedi.

Çin Kültür Sarayı'nın çeşitli bölümleri "döndürülebilir".

Lin Dahua, "Umarım yeni 3D gerçek sahne oluşturma teknolojisi sayesinde, gelecekteki kentsel alanımıza yeni hayal gücü ve yenilik alanı enjekte edebiliriz. Gelecekte, Shanghai AI Lab, Shusheng Tianji'nin modelleme kapsamını ve işlevlerini genişletecek ve Shusheng Tianji'nin algoritmaları, operatörleri ve sistemlerinin tümü açık kaynaktır."

Bilim adamları için ilk genel büyük ölçekli model sistemi

Toplantıda Lin Dahua ayrıca akademisyenler için çok modlu, Puyu ve Tianji'nin üç temel modelini içeren genel büyük ölçekli model sistemini tanıttı. ölçekli model geliştirme ve uygulama. Bunlar arasında, çok modlu büyük model 20 milyar parametreye sahiptir, 3,5 milyon semantik etiketi destekler ve 80'den fazla görevde dünyaya liderlik eder; Pu dili büyük modeli, birden çok dili destekleyen 100 milyar parametreyle Çin'de resmi olarak yayınlanan ilk büyük modeldir. Diller.

"Scholar Puyu, LLaMA-7B'yi (Meta AI'nin FAIR ekibi tarafından geliştirilen bir yapay zeka dili modeli) tüm boyutlarda geride bıraktı." Lin Dahua, yüz milyarlarca parametreye sahip büyük bir model olarak Shusheng Puyu'nun yüksek düzeyde doğruluk elde ettiğini söyledi. her boyutta.Her ikisi de Çin'deki mevcut en iyi açık kaynak modellerini geride bırakıyor.

Bu yıl 7 Haziran'da Shanghai AI Lab ve SenseTime, Çin Hong Kong Üniversitesi, Fudan Üniversitesi ve Shanghai Jiaotong Üniversitesi ile ortaklaşa büyük ölçekli "Scholar·Puyu" dil modelini yayınladı. 104 milyar parametreye sahip olan ve yüz milyarlarca parametreye sahip mevcut büyük dil modellerinden biri olan model, 1.6 trilyon Jeton içeren çok dilli yüksek kaliteli bir veri setine dayalı olarak eğitilmiştir.

Raporlara göre, Scholar·Puyu, Haziran ayındaki resmi çıkışından bu yana bir ay içinde beş yönü içeren kapsamlı bir yükseltmeden geçti. İlk olarak, bağlam penceresinin uzunluğu 2K'dan 8K'ya çıkarıldı, bu da uzun girdiyi anlamasına, karmaşık muhakeme geliştirmesine ve uzun vadeli çoklu diyalog turları gerçekleştirmesine olanak sağlıyor; ikincisi, çok dilli ve yapılandırılmış ifade yetenekleri daha da geliştirildi. modelin yeni sürümü 20'den fazla dili destekler ve ayrıca tablolar ve çizelgeler yoluyla karmaşık bilgileri özetleyebilir ve sunabilir; üçüncüsü, çok boyutlu yetenekler kapsamlı bir şekilde iyileştirildi ve 42 genel değerlendirme setindeki performans önemli ölçüde arttı geliştirildi ve 35 tanesindeki performans ChatGPT'yi Aştı; Dördüncüsü, matematiksel mantık yeteneği önemli ölçüde iyileşti ve sayısal hesaplama, fonksiyon işlemi ve denklem çözme gibi matematiksel yetenek büyük ölçüde iyileştirildi. Matematik değerlendirme seti GSM8K'daki performans 62,9'dan 73,2'ye yükseldi. 2023 üniversiteye giriş sınavının çoktan seçmeli sorularında, Doğruluk oranı %70'ten fazla arttı Beşinci olarak, güvenlik ve hizalama yetenekleri önemli ölçüde geliştirildi. Daha etkili talimat ince ayarları sayesinde, insan geri bildirimine dayalı pekiştirmeli öğrenme (RLHF) dahil olmak üzere, modelin yeni versiyonu insan talimatlarını daha güvenilir bir şekilde takip edebilir ve güvenlik de açıktır.

Lin Dahua, "Tüm büyük modellerin nihai değeri, yaşam ve üretim için değer yaratmaya devam ediyor. Şangay Yapay Zeka Laboratuvarı, yalnızca inovasyon yoluyla teknolojik atılımlar gerçekleştirmekle kalmıyor, aynı zamanda bu teknolojilerin belirli endüstrilerde uygulanmasını teşvik etmeyi de taahhüt ediyor." dedi. toplantıda.

Lin Dahua, ekibin büyük modelin kendisine ek olarak, büyük modelin geliştirilmesi sırasında beş ana veri bağlantısı, ön eğitim, ince ayar, dağıtım ve değerlendirmeyi kapsayan tüm araç sistemleri zincirini de açık kaynaklı olarak kullandığını söyledi. "Açık kaynak araç sistemi aracılığıyla, model değerden tam olarak yararlanılabilir. Açık kaynağın, geliştiricilerin büyük modeller temelinde geliştirmelerine ve yenilik yapmalarına gerçekten yardımcı olabileceğine inanıyorum."

Raporlara göre resmi açık kaynak versiyonu, 7 milyar parametreli hafif bir InternLM-7B olup, 40 değerlendirme setini içeren tam boyutlu değerlendirmede mükemmel ve dengeli performans göstererek mevcut açık kaynak modellerinin ilerisindedir.

View Original

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

1 Likes

Reward
1
Comment
Share

Comment

0/400

No comments

Topic
Dr.Han Joins Gate Square
39k Popularity
Gate VIP New Upgrade
38k Popularity
Nonfarm Payrolls Update
27k Popularity
4BTC
30402k Popularity
5contentstar
10720k Popularity
6NADA
10746k Popularity
7BOME
10761k Popularity
8BTC
30402k Popularity
9SMILE
9062k Popularity
10比特币
13416k Popularity

sitemap