OpenAI mengumumkan bahwa ChatGPT akan segera “melihat, mendengarkan, dan berbicara”

Fitur-fitur baru termasuk pengenalan suara dan kemampuan text-to-speech akan diluncurkan dalam dua minggu ke depan.

Menurut pengumuman dari OpenAI pada 25 September, ChatGPT akan segera menawarkan fitur-fitur baru yang memungkinkan pengguna berinteraksi dengannya melalui pengenalan gambar dan suara.

OpenAI mengumumkan bahwa pengguna akan dapat berinteraksi dengan ChatGPT menggunakan perintah suara, sehingga memungkinkan pengalaman pengguna yang lebih personal. Perusahaan mengatakan fitur tersebut didukung oleh model text-to-speech yang menghasilkan audio berdasarkan sampel ucapan minimal yang dibuat oleh pengisi suara profesional. Perusahaan mengatakan fitur tersebut juga didukung oleh Whisper, sistem pengenalan suara sumber terbuka.

Kemampuan suara diharapkan menawarkan kasus penggunaan yang lebih luas, seperti membantu tugas-tugas seperti membaca cerita pengantar tidur, membuat resep, menulis pidato, membacakan puisi, menjelaskan frasa umum, dan bahkan menyelesaikan "debat di meja makan".

OpenAI menambahkan bahwa pengguna akan segera dapat memberikan gambar (atau bagian gambar tertentu) ke ChatGPT untuk interpretasi dan respons.

OpenAI mengakui adanya risiko

OpenAI mengakui adanya risiko penipuan dan pemalsuan dan mengatakan pihaknya membatasi kemampuan suara pada platform obrolan suaranya. Ini menekankan bahwa ia menggunakan aktor suara profesional – bukan suara pengguna – untuk mengeluarkan audio. OpenAI menambahkan bahwa grup tertentu lainnya diperbolehkan menggunakan fitur suara untuk tujuan lain; misalnya, Spotify menerjemahkan podcast yang berpartisipasi ke dalam bahasa baru dan menggunakan suara asli masing-masing host.

Perusahaan mencatat bahwa pengenalan gambar menimbulkan risiko privasi dan mengatakan bahwa sebagai tanggapannya, hal itu membatasi kemampuan ChatGPT untuk membuat pernyataan tentang orang. Mereka mencatat bahwa ChatGPT "tidak selalu akurat," namun deskripsi umum dari gambar tersebut mungkin berguna, mengutip karya awalnya dengan Be My Eyes, sebuah aplikasi untuk orang-orang buta dan rabun.

OpenAI mengatakan akan memperkenalkan kemampuan suara dan gambar ke ChatGPT Plus dan Enterprise dalam dua minggu ke depan. Perusahaan mengatakan fitur suara akan tersedia di iOS dan Android (opt-in), dan fitur gambar akan tersedia di semua platform.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)