Perawatan halusinasi terbaik di negeri ini! Dengan 53 miliar parameter, kemampuan penalaran Baichuan2 melonjak 100%, dan API dibuka untuk penggunaan komersial untuk pertama kalinya.

2023-09-26 04:13:21

Sumber asli: Xinzhiyuan

Sumber gambar: Dihasilkan oleh AI Tanpa Batas

Model besar Baichuan telah ditingkatkan sepenuhnya kemarin!

Tepat pada tanggal 25 September, Baichuan Intelligent secara resmi merilis model besar 53 miliar parameter yang baru ditingkatkan - Baichuan2-53B.

Alamat pengalaman:

Kali ini, kemampuan penalaran matematis dan logisnya meningkat secara signifikan.

Lebih penting lagi, melalui sistem data berkualitas tinggi dan peningkatan pencarian, halusinasi Baichuan2-53B telah sangat berkurang, menjadikannya model domestik terbesar dengan masalah halusinasi terendah.

Tidak hanya itu, sebagai salah satu perusahaan model besar pertama yang lolos proses registrasi, Baichuan Intelligence juga telah membuka antarmuka API Baichuan2-53B.

Artinya Baichuan Intelligence telah resmi memasuki bidang To B dan akan memulai proses komersialisasi mulai sekarang.

Pemrosesan ilusi, jauh lebih maju di Tiongkok

Hal yang paling penting adalah Baichuan2-53B yang baru ditingkatkan sudah jauh di depan industri dalam negeri dalam hal pemrosesan "ilusi".

Sederhananya, "ilusi" berarti LLM sering berbicara serius dan tidak masuk akal tanpa diketahui fakta yang mendukungnya.

Meskipun GPT-4 bekerja dengan baik dalam berbagai tugas, GPT-4 tidak bisa lepas dari kutukan ini.

Lantas, mengapa model berukuran besar muncul "halusinasi"?

Pada bulan April, salah satu pendiri OpenAI dan ilmuwan riset John Schulman menguraikan kesulitan yang sulit diatasi dengan model besar dalam pidatonya di UC Berkeley.

Dalam pandangan Schulman, ada “grafik pengetahuan” yang tersembunyi di dalam kotak hitam LLM. Jika tidak ada pengetahuan dalam arsitektur ini, dan hanya mengajarkan pengetahuan model besar (yaitu kloning perilaku) melalui SFT sebenarnya mengajarkannya untuk menghasilkan ilusi.

Menanggapi masalah ini, bagaimana Baichuan Intelligence mencapai kinerja terdepan di industri dalam "pemrosesan ilusi" model besar?

Dalam hal konstruksi data berkualitas tinggi, Baichuan2-53B telah menciptakan sistem kualitas data yang unik.

Klasifikasikan data berdasarkan standar kualitas rendah dan kualitas tinggi untuk memastikan bahwa Baichuan2-53B selalu menggunakan data berkualitas tinggi untuk pra-pelatihan.

Selain itu, dalam hal perolehan informasi, Baichuan2-53B telah meningkatkan beberapa modul, termasuk komponen utama seperti pemahaman maksud perintah, pencarian cerdas, dan peningkatan hasil.

Sistem komprehensif ini secara akurat mendorong pencarian istilah kueri dengan memahami instruksi pengguna secara mendalam, dan akhirnya menggabungkan teknologi model bahasa besar untuk mengoptimalkan keandalan pembuatan hasil model, mencapai hasil jawaban model yang lebih akurat dan cerdas, serta mengurangi ilusi model.

Misalnya, ketika menjelaskan masalah "kait tiga helai, empat senar, dan lima", GPT-4 jelas-jelas berbicara omong kosong.

Sebaliknya, Baichuan2-53B memberikan jawaban yang benar untuk pertama kalinya.

Contoh lainnya, jawaban Baichuan2-53B terhadap pertanyaan klasik "Apakah Zhou Shuren dan Lu Xun adalah orang yang sama?" bersifat komprehensif dan akurat.

Terlihat bahwa melalui pembangunan sistem data berkualitas tinggi dan optimalisasi teknologi peningkatan pencarian, Baichuan2-53B secara efektif mengurangi ilusi model.

Hasil evaluasi FacTool menunjukkan bahwa Baichuan2-53B memiliki skor komprehensif 140,5, hanya berada di belakang GPT-4 di antara model-model besar dasar arus utama, dan berada pada level terdepan dalam negeri.

FacTool adalah kerangka umum yang diusulkan bersama oleh para sarjana dari Shanghai Jiao Tong University, Carnegie Mellon University, City University of Hong Kong, Meta dan institusi lainnya. FacTool dapat memeriksa keakuratan faktual konten yang dihasilkan oleh model besar (juga dapat memeriksa keakuratan faktual konten umum).jenis kelamin).

alamat proyek:

Peningkatan kemampuan, penalaran naik 100%

Faktanya, Baichuan2-53B sudah menjadi model besar keenam yang dirilis oleh Baichuan Intelligence.

Sejak Baichuan Intelligence didirikan pada 10 April, ia telah berinovasi dengan kecepatan yang mencengangkan, kecepatan iterasinya mencapai rata-rata peluncuran model besar setiap 28 hari!

Pada awal 8 Agustus, ketika Baichuan2-53B pertama kali dirilis, ia menunjukkan pengetahuan tanya jawab dan kemampuan penciptaan sastra yang sangat baik.

Jika Anda ingin bertanya apa saja indikator penting untuk mengevaluasi apakah suatu model besar memimpin, saya yakin bahwa "kemampuan penalaran matematis dan logis" akan menjadi jawaban yang diberikan oleh banyak orang di industri ini.

Kali ini, berdasarkan Baichuan-53B, Baichuan2-53B berfokus pada penguatan kemampuan penalaran matematis dan logisnya, dan juga meningkatkan kemampuan keseluruhannya secara komprehensif.

Secara spesifik, kemampuan penalaran logisnya meningkat 100%, kemampuan matematikanya meningkat 31%, kemampuan pemahaman bahasanya meningkat 29%, kemampuan membuat teksnya meningkat 18%, dan kemampuan tanya jawab pengetahuannya meningkat. sebesar 9%.

### Penalaran Matematis

Baichuan2-53B, yang telah meningkatkan kemampuan matematikanya secara signifikan, dapat dengan mudah menyelesaikan soal kata matematika.

Misalnya jumlah dua bilangan adalah 572, dan angka satuan salah satu penjumlahannya adalah 0. Setelah angka 0 dihilangkan, maka sama dengan penjumlahan kedua. Jadi, apa sebenarnya kedua angka tersebut?

Baichuan2-53B mencantumkan persamaannya, dengan asumsi satu penjumlahan adalah 10A dan penjumlahan lainnya adalah B, lalu berdasarkan kondisi yang diketahui, solusi yang tepat diperoleh.

Contoh lain, pada pertanyaan di bawah ini, Baichuan2-53B terlebih dahulu menghitung total pendapatan transportasi, lalu membaginya dengan kerugian per kotak kaca untuk mendapatkan jumlah kotak kaca yang rusak.

Mari kita ambil pertanyaan klasik lainnya: “Berapa kilometer jarak antara dua tempat?” Baichuan2-53B memperoleh jawaban yang benar melalui perhitungan langkah demi langkah.

Dari segi penalaran, mari kita mulai dengan pertanyaan sederhana: Ramalan cuaca mengatakan Rabu ini akan turun hujan, dan kemarin turun hujan. Hari ini hari apa?

Baichuan2-53B dengan mudah membuat "Kamis"!

Selanjutnya, alasannya sedikit lebih sulit: Misalkan ada sebuah kolam dengan air yang tak terbatas di dalamnya.

Terdapat dua buah ketel kosong dengan kapasitas masing-masing 5 liter dan 6 liter. Bagaimana saya bisa mendapatkan 3 liter air dari kolam hanya dengan 2 ketel ini?

Baichuan2-53B mulai menjawab dengan lancar dan memberikan jawaban yang benar dalam 6 langkah.

Setelah beberapa kali pengujian, dapat ditemukan bahwa kemampuan penalaran matematis dan logis dari Baichuan2-53B yang ditingkatkan memang berbeda dari model yang sama. Ini telah meningkat pesat pada topik-topik yang sebelumnya tidak begitu baik.

Masalah Ketepatan Waktu

Dalam hal ketepatan waktu, kinerja Baichuan2-53B sangat baik.

Asian Games Hangzhou baru saja dibuka, dan pemain termudanya baru berusia 9 tahun. Baichuan2-53B juga menjawab pertanyaan terbaru dengan benar.

Baichuan2-53B bahkan secara akurat menjelaskan prinsip jaringan saraf di balik Optimus, robot humanoid yang baru saja diumumkan oleh Tesla.

Contoh lainnya, pada awal September tahun ini, Festival Film Venesia ke-80 berakhir di Italia.

Apakah ada film dan aktor Tiongkok yang memenangkan penghargaan di festival film ini?

Baichuan2-53B langsung menjawab bahwa "Love is a Gun" karya Li Hongqi memenangkan film fitur pertama terbaik, dan Tony Leung memenangkan Golden Lion Award untuk Lifetime Achievement.

Kontrak Boss Mei dengan Paris berakhir pada akhir Juni tahun ini, dan ia resmi bergabung dengan Inter Miami pada Juli.

Baichuan2-53B juga mengetahui hal ini dengan sangat baik.

Demikian pula, ini juga dapat memberi tahu Anda secara akurat bahwa Druid telah memenangkan total 24 Grand Slam, termasuk yang ini pada tahun 2023.

Buka API dan resmi memasuki penggunaan komersial

Tidak hanya itu, kali ini Baichuan2-53B juga secara resmi membuka antarmuka API, memungkinkan perusahaan dan pengembang untuk mengintegrasikan model tersebut ke dalam aplikasi dan layanan mereka sendiri.

Alamat API:

Apakah ada batasan untuk layanan ini?

Bisa dikatakan hampir tidak ada. Antarmuka API Baichuan2-53B sangat nyaman dan mudah digunakan, hanya memerlukan konfigurasi dan integrasi sederhana untuk mengaksesnya.

Selain itu, model ini sangat kompatibel dengan antarmuka OpenAI, yang memungkinkan pelanggan melakukan migrasi dengan cepat, sehingga sangat mengurangi biaya penerapan model dan biaya konversi.

Singkatnya, kini baik itu layanan pelanggan yang cerdas, penulisan yang cerdas, atau rekomendasi yang cerdas, semuanya dapat didukung oleh kemampuan model yang besar.

Hal yang paling dikhawatirkan oleh pengguna perusahaan adalah masalah kepatuhan keamanan.

Tidak perlu khawatir tentang hal ini.

Sebagai salah satu perusahaan model skala besar pertama yang lulus "Langkah-langkah Sementara untuk Manajemen Layanan Kecerdasan Buatan Generatif", Baichuan Intelligent telah menciptakan peningkatan keamanan untuk Baichuan2-53B yang mencakup siklus penuh pra-pelatihan dan penyempurnaan model skala besar. penyetelan, dan inferensi. Dapat dikatakan bahwa seluruh proses dalam keadaan aman.

Dengan kemampuan model Baichuan2-53B yang kaya dan kuat, pengguna perusahaan tidak hanya dapat meningkatkan layanan yang ada dan mengurangi biaya, tetapi juga menjelajahi lebih banyak skenario aplikasi.

Diyakini bahwa saat ini, sudah ada gelombang besar inovasi yang mengesankan yang mulai muncul.

Referensi:

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

1 Suka

Hadiah
1
Komentar
Bagikan

Komentar

0/400

Tidak ada komentar

Topik
1/3
1Simple Earn Annual Rate 24.4%
39k Popularitas
2Gate Launchpad List IKA
41k Popularitas
3ETH Trading Volume Surges
42k Popularitas
4Gate ETH 10th Anniversary Celebration
22k Popularitas
5Trump’s AI Strategy
18k Popularitas

Sematkan

peta situs