Model mirip ChatGPT yang mengumpulkan $100 juta adalah model open source! Tersedia untuk penggunaan komersial, 8 model

2023-09-25 02:03:18

Sumber asli: Komunitas Terbuka AIGC

Sumber gambar: Dihasilkan oleh AI Tanpa Batas‌

Selasa lalu, "AIGC Open Community" memperkenalkan Writer, platform AI generatif yang mengumpulkan dana sebesar US$100 juta. Kemampuan perusahaan memperoleh total pembiayaan sebesar US$126 juta hanya dalam waktu tiga tahun dan menjadi salah satu pesaing utama ChatGPT tidak terlepas dari teknologinya yang luar biasa. Hal ini juga membuktikan sepenuhnya bahwa modelnya memiliki kasus aplikasi yang sukses dan telah diakui oleh modal dan pengguna.

Saat ini, Writer telah membuat model bahasa besar Palmyra yang digunakan pada Huggingface menjadi open source. Terdapat 8 model, yaitu small, base, 20b-chat, Instruct-20b, med-20b, dll., yang tersedia secara komersial dan mendukung penghalusan data. penyetelan.

Alamat sumber terbuka:

Alamat uji coba gratis online:

**Sorotan teknis Palmyra meliputi: **Parameter kecil dan fungsi yang kuat, yang sangat membantu perusahaan kecil dan menengah serta pengembang individu tanpa sumber daya komputasi; telah menerima pelatihan dalam penulisan bisnis dan data pemasaran, terutama untuk pengguna perusahaan; perusahaan -keamanan data tingkat, beberapa pagar pengaman bawaan;

Selain menghasilkan teks, ia juga dapat mengekstrak ringkasan konten video, PDF, dan audio; mendukung penyesuaian data, dan perusahaan dapat membuat asisten "ChatGPT" mereka sendiri, dll.

"Komunitas Terbuka AIGC" berikut memperkenalkan beberapa model khusus Palmyra:

Instruksikan Palmyra-20b

Ini adalah model penyetelan instruksi yang dibangun berdasarkan model dasar Palmyra-20b, mendukung pemrosesan bahasa alami tingkat lanjut dan kebutuhan yang disesuaikan.

Model InstructPalmyra-20b dilatih dengan cermat pada kumpulan data ekstensif yang terdiri dari sekitar 70.000 catatan respons perintah. Catatan ini dihasilkan oleh pemodelan bahasa profesional Writer dan tim teknis penyempurnaan.

InstructPalmyra-20b memiliki kemampuan luar biasa untuk memproses instruksi kompleks dan menghasilkan respons kontekstual yang akurat. Hal ini menjadikannya model ideal untuk mengembangkan berbagai aplikasi seperti asisten virtual, dukungan pelanggan, pembuatan konten, dan banyak lagi.

Selain itu, pelatihan komprehensif model ini memungkinkannya beradaptasi dan bekerja dengan baik dalam berbagai kondisi dan konteks, sehingga semakin memperluas potensi kasus penggunaannya.

Palmyra-dengan-20b

Palmyra-Med adalah model Writer yang dibuat khusus untuk memenuhi kebutuhan industri perawatan kesehatan, dengan instruksi yang disesuaikan berdasarkan data medis.

Palmyra-Med mencapai skor tertinggi ketika diuji pada pertanyaan biomedis terkemuka yang menjawab PubMedQA, dengan tingkat akurasi 81,1%, mengungguli GPT-4 dan penguji manusia yang terlatih secara medis.

Ini dapat menyediakan fungsi seperti menerjemahkan terminologi medis profesional, mengekstrak ringkasan catatan medis, menganalisis data medis dalam jumlah besar, dan secara otomatis menghasilkan wawasan medis.

Palmira Besar 20B

Palmyra-Large adalah model decoder kausal yang dibuat oleh Writer, disempurnakan oleh Palmyra-Index-Data dan dilatih pada 800 miliar data dalam korpus berkualitas tinggi.

Palmyra Large menggunakan tujuan pemodelan bahasa kausal (CLM) selama pra-pelatihan model. Oleh karena itu, mirip dengan GPT-3, ia telah dilatih sebelumnya dengan tujuan pemodelan bahasa kausal yang diawasi sendiri.

Model ini berjalan sangat cepat dan menggunakan sumber daya yang sangat sedikit. Cocok untuk skenario bisnis seperti perawatan medis, pemasaran, pemasaran, TI, desain, dan sumber daya manusia untuk menciptakan asisten AI yang dibuat khusus.

Evaluasi kinerja

Palmyra menerima skor tertinggi di Stanford HELM, melampaui model open source terkenal seperti Falcon 40B dan LLaMA-30B. HELM adalah platform pengujian benchmark yang sangat terkenal dari Fundamental Model Research Center di Universitas Stanford.

Palmyra menduduki peringkat pertama pada beberapa tes penting, dengan skor 60,9% pada Massive Multi-Task Language Understanding (MMLU), 89,6% pada BoolQ, dan 79,0% pada NaturalQuestions.

Palmyra berada di peringkat kedua dalam dua tes utama lainnya, dengan skor Q&A kontekstual sebesar 49,7% dan skor TruthfulQA sebesar 61,6%.Performa keseluruhannya sangat kuat.

Singkatnya, Palmyra sangat layak bagi pengembang yang ingin mengkomersialkan model bahasa besar untuk mempelajari arsitektur model dan fungsinya serta belajar dari pengalaman suksesnya.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

1 Suka

Hadiah
1
Komentar
Bagikan

Komentar

0/400

Tidak ada komentar

Topik
1/3
1Simple Earn Annual Rate 24.4%
35k Popularitas
2Gate Launchpad List IKA
40k Popularitas
3ETH Trading Volume Surges
40k Popularitas
4Gate ETH 10th Anniversary Celebration
22k Popularitas
5Trump’s AI Strategy
18k Popularitas

Sematkan

peta situs