Ülkedeki en iyi halüsinasyon tedavisi! 53 milyar parametreyle Baichuan2'nin muhakeme yeteneği %100 arttı ve API ilk kez ticari kullanıma açıldı.

2023-09-26 04:13:21

Orijinal kaynak: Xinzhiyuan

Resim kaynağı: Sınırsız Yapay Zeka tarafından oluşturulmuştur

Baichuan'ın büyük modeli dün tamamen yükseltildi!

Sadece 25 Eylül'de Baichuan Intelligent, yeni yükseltilmiş 53 milyar parametreli büyük model Baichuan2-53B'yi resmi olarak piyasaya sürdü.

Deneyim adresi:

Bu sefer matematiksel ve mantıksal akıl yürütme yetenekleri önemli ölçüde geliştirildi.

Daha da önemlisi, yüksek kaliteli veri sistemi ve arama geliştirme sayesinde Baichuan2-53B'nin halüsinasyonu büyük ölçüde azaltıldı ve bu da onu en düşük halüsinasyon sorununa sahip en büyük yerli model haline getirdi.

Sadece bu da değil, kayıt sürecini geçen ilk büyük model şirketlerden biri olan Baichuan Intelligence, Baichuan2-53B API arayüzünü de açtı.

Bu, Baichuan Intelligence'ın resmi olarak To B alanına girdiği ve bundan sonra ticarileştirme sürecine başlayacağı anlamına geliyor.

İllüzyon işleme Çin'de çok ileride

En dikkat çekici şey, yeni geliştirilen Baichuan2-53B'nin "illüzyon" işleme açısından yerli endüstride zaten çok ileride olmasıdır.

Basitçe ifade etmek gerekirse, "yanılsama" LLM'nin genellikle onu destekleyen herhangi bir bilinen gerçek olmaksızın ciddi ve saçma konuşması anlamına gelir.

GPT-4 çeşitli görevlerde iyi performans gösterse de bu lanetten kaçamaz.

Peki neden büyük modeller "halüsinasyonlar" gibi görünüyor?

Nisan ayında OpenAI kurucu ortağı ve araştırma bilimcisi John Schulman, UC Berkeley'de yaptığı bir konuşmada büyük modellerle aşılması zor olan zorlukları ayrıntılarıyla anlattı.

Schulman'a göre LLM kara kutusunun içinde gizli bir "bilgi grafiği" var. Bu mimaride hiçbir bilgi yoksa ve SFT aracılığıyla sadece büyük model (yani davranışsal klonlama) bilgisini öğretmek aslında ona yanılsamalar çıkarmayı öğretmektir.

Bu soruna yanıt olarak Baichuan Intelligence, büyük modellerin "illüzyon işlemesinde" sektör lideri performansı nasıl elde ediyor?

Yüksek kaliteli veri yapısı açısından Baichuan2-53B, benzersiz bir veri kalitesi sistemi oluşturdu.

Baichuan2-53B'nin eğitim öncesi için her zaman yüksek kaliteli veriler kullanmasını sağlamak için verileri düşük kaliteli ve yüksek kaliteli standartlara göre sınıflandırın.

Buna ek olarak, bilgi edinme açısından Baichuan2-53B, komut amacını anlama, akıllı arama ve sonuç geliştirme gibi temel bileşenler de dahil olmak üzere birden fazla modülü yükseltti.

Bu kapsamlı sistem, kullanıcı talimatlarını derinlemesine anlayarak sorgu terimlerinin aranmasını doğru bir şekilde yönlendirir ve son olarak model sonucu oluşturmanın güvenilirliğini optimize etmek, daha doğru ve akıllı model yanıt sonuçları elde etmek ve model yanılsamasını azaltmak için büyük dil modeli teknolojisini birleştirir.

Örneğin, "üç ipi, dört ipi ve beşi kancalama" problemini açıklamaya gelince, GPT-4 açıkça saçma sapan konuşuyor.

Buna karşılık Baichuan2-53B ilk seferde doğru cevabı verdi.

Başka bir örnek olarak, Baichuan2-53B'nin klasik "Zhou Shuren ve Lu Xun aynı kişi mi?" sorusuna verdiği yanıt hem kapsamlı hem de doğrudur.

Yüksek kaliteli bir veri sisteminin oluşturulması ve arama geliştirme teknolojisinin optimizasyonu sayesinde Baichuan2-53B'nin model yanılsamasını etkili bir şekilde azalttığı görülebilir.

FacTool değerlendirmesinin ardından elde edilen sonuçlar, Baichuan2-53B'nin 140,5'lik kapsamlı bir puana sahip olduğunu, ana akım temel büyük modeller arasında yalnızca GPT-4'ün gerisinde yer aldığını ve yurt içi lider seviyede olduğunu gösteriyor.

FacTool, Shanghai Jiao Tong Üniversitesi, Carnegie Mellon Üniversitesi, Hong Kong Şehir Üniversitesi, Meta ve diğer kurumlardan akademisyenler tarafından ortaklaşa önerilen genel bir çerçevedir. Büyük modeller tarafından oluşturulan içeriğin gerçek doğruluğunu kontrol edebilir (aynı zamanda gerçek doğruluğu da kontrol edebilir) genel içerik).cinsiyet).

proje adresi:

Yetenek yükseltmesi, muhakeme yeteneği %100 arttı

Aslında Baichuan2-53B, Baichuan Intelligence tarafından piyasaya sürülen altıncı büyük modeldir.

Baichuan Intelligence, 10 Nisan'da kurulduğundan bu yana şaşırtıcı bir hızla yenilik yapıyor. Yineleme hızı, her 28 günde bir büyük bir modelin piyasaya sürülmesi ortalamasına ulaştı!

Baichuan2-53B ilk kez piyasaya sürüldüğü 8 Ağustos gibi erken bir tarihte, mükemmel soru-cevap bilgisi ve edebi yaratım yetenekleri sergiledi.

Büyük bir modelin öncü olup olmadığını değerlendirmek için önemli göstergelerin neler olduğunu sormak isterseniz, sektördeki birçok kişinin vereceği cevabın "matematiksel ve mantıksal akıl yürütme yetenekleri" olacağına inanıyorum.

Bu kez Baichuan-53B'yi temel alan Baichuan2-53B, matematiksel ve mantıksal akıl yürütme yeteneklerini güçlendirmeye odaklanıyor ve aynı zamanda genel yeteneklerini kapsamlı bir şekilde yükseltiyor.

Özellikle mantıksal akıl yürütme yeteneği %100, matematik yeteneği %31, dili anlama yeteneği %29, metin oluşturma yeteneği %18, bilgi soru-cevap yeteneği artar. %9 oranında.

### Matematiksel sebepler

Matematiksel yeteneğini büyük ölçüde geliştiren Baichuan2-53B, matematiksel kelime problemlerini kolaylıkla çözebilmektedir.

Örneğin iki sayının toplamı 572 olup, toplananlardan birinin birler basamağı 0'dır. 0 çıkarıldıktan sonra ikinci toplananla aynı olur. Peki nedir bu iki sayı?

Baichuan2-53B, toplananlardan birinin 10A, diğerinin B olduğunu varsayarak denklemi listeler ve ardından bilinen koşullara göre doğru çözüm elde edilir.

Başka bir örnek için, aşağıdaki soruda Baichuan2-53B önce toplam nakliye gelirini hesapladı ve ardından bunu cam kutu başına kayba bölerek hasarlı cam kutu sayısını buldu.

Bir başka klasik soruyu ele alalım: “İki yer arası mesafe kaç kilometre?” Baichuan2-53B, adım adım hesaplamalar yaparak doğru cevaba ulaştı.

Mantık açısından basit bir soruyla başlayalım: Hava tahmini bu çarşamba yağmur yağacağını söylüyordu, dün de yağmur yağdı, bugün haftanın hangi günü?

Baichuan2-53B zahmetsizce "Perşembe"yi buldu!

Daha sonra, akıl yürütme biraz daha zordur: Diyelim ki, içinde sonsuz su bulunan bir gölet var.

Sırasıyla 5 litre ve 6 litre kapasiteli iki adet boş su ısıtıcısı bulunmaktadır. Sadece bu 2 su ısıtıcısıyla havuzdan 3 litre suyu nasıl alabilirim?

Baichuan2-53B sorunsuz bir şekilde cevap vermeye başladı ve 6 adımda doğru cevabı verdi.

Birçok test turundan sonra, yükseltilmiş Baichuan2-53B'nin matematiksel ve mantıksal akıl yürütme yeteneklerinin aslında aynı modelinkinden farklı olduğu bulunabilir. Daha önce pek iyi olmadığı konularda büyük ilerleme kaydetti.

Zamanındalık Sorunu

Zamanlılık açısından Baichuan2-53B'nin performansı mükemmel.

Hangzhou Asya Oyunları yeni açıldı ve en genç oyuncu henüz 9 yaşında. Baichuan2-53B de son soruyu doğru yanıtladı.

Baichuan2-53B, Tesla'nın yakın zamanda duyurduğu insansı robot Optimus'un arkasındaki sinir ağı ilkesini bile doğru bir şekilde açıkladı.

Başka bir örnek olarak, bu yılın eylül başında İtalya'da 80. Venedik Film Festivali sona erdi.

Bu film festivalinde ödül kazanan Çinli film ve aktörler var mı?

Baichuan2-53B hemen Li Hongqi'nin "Love is a Gun" filminin en iyi ilk uzun metrajlı filmi kazandığını ve Tony Leung'un Yaşam Boyu Başarı Altın Aslan Ödülünü kazandığını söyledi.

Boss Mei'nin Paris'le olan sözleşmesi bu yılın Haziran ayı sonunda sona eriyor ve resmi olarak Temmuz ayında Inter Miami'ye katıldı.

Baichuan2-53B de bunu çok iyi biliyor.

Benzer şekilde, Druid'in 2023'teki bu da dahil olmak üzere toplam 24 Grand Slam kazandığını da doğru bir şekilde söyleyebilir.

API'yi açın ve resmi olarak ticari kullanıma girin

Sadece bu da değil, Baichuan2-53B bu sefer API arayüzünü de resmi olarak açarak işletmelerin ve geliştiricilerin modeli kendi uygulamalarına ve hizmetlerine entegre etmelerine olanak tanıdı.

API adresi:

Bu hizmet için herhangi bir eşik var mı?

Hemen hemen hiç olmadığı söylenebilir. Baichuan2-53B'nin API arayüzü çok kullanışlı ve kullanımı kolaydır.Bu arayüze erişim için yalnızca basit konfigürasyon ve entegrasyon gerekir.

Üstelik OpenAI'nin arayüzüyle son derece uyumludur, bu da müşterilerin hızlı bir şekilde geçiş yapmasına olanak tanıyarak hem model dağıtım maliyetlerini hem de dönüştürme maliyetlerini büyük ölçüde azaltır.

Kısacası artık ister akıllı müşteri hizmetleri, ister akıllı yazı, ister akıllı öneri olsun, hepsi büyük modellerin yetenekleriyle desteklenebiliyor.

Kurumsal kullanıcıların en çok endişe duyduğu konu güvenlik uyumluluğu sorunlarıdır.

Bu konuda endişelenmenize gerek yok.

"Üretken Yapay Zeka Hizmet Yönetimi için Geçici Tedbirleri" geçen ilk büyük ölçekli model şirketlerden biri olan Baichuan Intelligent, Baichuan2-53B için büyük ölçekli model ön eğitiminin tüm döngüsünü kapsayan güvenlik geliştirmeleri oluşturdu. ayarlama ve çıkarım Tüm sürecin güvenlik altında olduğu söylenebilir.

Baichuan2-53B'nin zengin ve güçlü model yetenekleri sayesinde kurumsal kullanıcılar yalnızca mevcut hizmetleri yükseltip maliyetleri düşürmekle kalmıyor, aynı zamanda daha fazla uygulama senaryosunu da keşfedebiliyor.

Şu anda toprakta büyük bir etkileyici yenilik dalgasının oluştuğuna inanılıyor.

Referanslar:

View Original

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

1 Likes

Reward
1
Comment
Share

Comment

0/400

No comments

Topic
1/3
1Simple Earn Annual Rate 24.4%
39k Popularity
2Gate Launchpad List IKA
41k Popularity
3ETH Trading Volume Surges
42k Popularity
4Gate ETH 10th Anniversary Celebration
22k Popularity
5Trump’s AI Strategy
18k Popularity

sitemap