OpenAI mengajukan merek dagang GPT-5, kapan akan dirilis? Kemampuan baru apa yang akan dibawanya?

Sumber asli: AGI Innovation Lab

Sumber gambar: Dihasilkan oleh AI‌ Tak Terbatas

Pada tanggal 1 Agustus, OpenAI telah secara resmi mengajukan permohonan merek dagang untuk "GPT-5", yang meliputi:

  • Perangkat lunak yang secara artifisial menghasilkan ucapan dan teks manusia
  • Konversi file data audio menjadi teks
  • Pengenalan suara dan ucapan
  • Pemrosesan bahasa dan ucapan berbasis pembelajaran mesin

Menurut dokumen aplikasi merek dagang GPT-5, merek dagang GPT-5 mencakup fungsi AI untuk menghasilkan ucapan dan teks, dan juga dapat mengubah file audio menjadi teks, mewujudkan pengenalan suara dan ucapan, dan menggunakan teknologi pembelajaran mesin untuk pemrosesan bahasa dan ucapan .

Ini mungkin berarti bahwa GPT-5 akan mendukung kemampuan suara, yang akan memberi pengguna pengalaman pemrosesan suara dan teks yang lebih canggih dan efisien, dan semakin meningkatkan kemampuan multimoda.

Kapan GPT-5 hadir?

Saat GPT-4 dirilis pada Maret 2023, OpenAI diharapkan merilis model generasi berikutnya pada Desember 2023. Salah satu pendiri Runway Siqi Chen sebelumnya menyatakan bahwa saya diberitahu bahwa GPT5 dijadwalkan untuk menyelesaikan pelatihan pada bulan Desember tahun ini, dan Openai berharap dapat mencapai kecerdasan buatan umum (AGI). Itu berarti kita semua akan berdebat sengit tentang apakah itu benar-benar AGI.

Namun, ketika ditanya di acara MIT pada bulan April apakah OpenAI sedang melatih GPT-5, CEO OpenAI Sam Altman berkata "kami tidak akan, dan tidak akan untuk sementara." Dalam sebuah wawancara pada bulan Juni tahun ini, pendiri dan CEO OpenAI Sam Altman mengatakan ketika ditanya apa yang meluncurkan GPT-5, saya juga penasaran, kami tidak punya jawaban, kami tidak akan memiliki GPT-5 segera, kami harus Membuat keamanan menjadi besar bagian dari itu.

Namun, beberapa percaya bahwa OpenAI dapat meluncurkan GPT-4.5, versi perantara antara GPT-4 dan GPT-5, seperti GPT-3.5, pada Oktober 2023. GPT-4.5 dikatakan akhirnya membawa kemampuan multimodal, kemampuan menganalisis gambar dan teks. OpenAI telah mengumumkan dan mendemonstrasikan kemampuan multimodal GPT-4 pada awal Maret 2023 selama streaming langsung pengembang GPT-4. Sekarang Microsoft telah merilis kemampuan multimodal GPT-4 di Bing Chat. Sepertinya pembaruan besar berikutnya untuk GPT-4 sudah dekat.

Selain itu, OpenAI saat ini memiliki banyak pekerjaan yang harus dilakukan pada model GPT-4 sebelum mulai mengerjakan GPT-5. Saat ini, waktu inferensi GPT-4 sangat lama dan cukup mahal untuk dijalankan. Akses GPT-4 API masih sulit didapat. Selain itu, OpenAI baru saja membuka akses ke plugin ChatGPT dan penerjemah kode, yang masih dalam versi beta. Penjelajahan internet telah dihapus dari GPT-4 karena menampilkan konten dari situs berbayar.

Meskipun GPT-4 sangat bertenaga, menurut saya OpenAI menyadari bahwa efisiensi komputasi adalah salah satu elemen kunci untuk menjalankan model secara berkelanjutan. Tambahkan fitur dan kemampuan baru, dan Anda dapat menangani infrastruktur yang lebih besar sambil memastikan bahwa semua pos pemeriksaan aktif dan berjalan dengan andal. Jadi, tebakan liar, GPT-5 kemungkinan akan dirilis pada tahun 2024 jika kita berasumsi tidak ada hambatan regulasi dari lembaga pemerintah.

Prediksi: Fitur dan fungsi GPT-5

Mengurangi halusinasi

Topik hangat di industri ini adalah GPT-5 akan mewujudkan AGI (kecerdasan buatan). Antara lain, GPT-5 harus mengurangi waktu inferensi, meningkatkan efisiensi, mengurangi halusinasi, dan banyak lagi. Mari kita mulai dengan halusinasi, salah satu alasan utama mengapa sebagian besar pengguna tidak terlalu mempercayai model AI.

Menurut OpenAI, skor GPT-4 40% lebih tinggi daripada GPT-3.5 pada evaluasi faktual desain permusuhan internal di sembilan kategori. GPT-4 sekarang 82% lebih kecil kemungkinannya untuk merespons konten yang tidak akurat dan tidak diizinkan. Itu datang sangat dekat dengan skor 80% dalam tes akurasi di seluruh kategori. Ini adalah lompatan raksasa melawan ilusi.

Sekarang, OpenAI diharapkan dapat mengurangi halusinasi hingga kurang dari 10% di GPT-5, yang akan sangat membantu dalam membuat model LLM dapat dipercaya.

Model Efisiensi Perhitungan

Kita sudah tahu bahwa GPT-4 mahal untuk dijalankan ($0,03 per 1K token) dan butuh waktu lebih lama untuk disimpulkan. Dan model GPT-3.5-turbo yang lebih lama 15 kali lebih murah daripada GPT-4 ($0,002 per 1K token). Menurut laporan terbaru oleh SemiAnalysis, GPT-4 bukanlah model yang padat, tetapi didasarkan pada arsitektur "campuran para ahli". Artinya, GPT-4 menggunakan 16 model berbeda untuk tugas berbeda, dengan 1,8 triliun parameter.

Dengan infrastruktur sebesar itu, biaya pengoperasian dan pemeliharaan model GPT-4 menjadi sangat mahal.

Nyatanya, banyak model besar baru mulai mengejar "kecil dan halus", sehingga model besar memiliki parameter sesedikit mungkin, tidak lebih.

Dalam interpretasi model Google PaLM 2 baru-baru ini, parameter PaLM 2 cukup kecil, tetapi kinerjanya cepat.

Model AI multisensor

Meskipun GPT-4 telah dinyatakan sebagai model AI multimodal, namun hanya berurusan dengan dua jenis data, yaitu gambar dan teks. Dengan GPT-5, OpenAI dapat mengambil langkah besar menuju multimodalitas sejati. Itu juga dapat menangani teks, audio, gambar, video, data kedalaman dan suhu. Ini akan dapat menghubungkan aliran data dari berbagai modalitas untuk membuat ruang tertanam.

ingatan jangka panjang

Dengan dirilisnya GPT-4, OpenAI menghadirkan panjang konteks maksimum 32K token dengan biaya $0,06 per 1K token. Kami dengan cepat melihat pergeseran dari token 4K standar menjadi 32K dalam hitungan bulan. Baru-baru ini, Anthropic meningkatkan jendela konteks chatbot Claude AI-nya dari 9K token menjadi 100K token. Diharapkan GPT-5 dapat memberikan dukungan memori jangka panjang melalui konteks yang lebih panjang.

Ini membantu membuat karakter dan teman AI mengingat karakter dan kenangan Anda selama bertahun-tahun yang akan datang. Selain itu, Anda juga dapat memuat buku dan pustaka dokumen teks dalam satu jendela kontekstual. Berbagai aplikasi AI baru dapat muncul berkat dukungan memori jangka panjang, dan GPT-5 dapat mewujudkannya.

Menurut Anda kapan GPT-5 akan dirilis dan inovasi apa yang akan dibawanya?

Referensi:

Lihat Asli
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)