OpenAI mengumumkan bahwa ChatGPT akan segera “melihat, mendengarkan, dan berbicara”

2023-09-26 10:22:32

Fitur-fitur baru termasuk pengenalan suara dan kemampuan text-to-speech akan diluncurkan dalam dua minggu ke depan.

Menurut pengumuman dari OpenAI pada 25 September, ChatGPT akan segera menawarkan fitur-fitur baru yang memungkinkan pengguna berinteraksi dengannya melalui pengenalan gambar dan suara.

OpenAI mengumumkan bahwa pengguna akan dapat berinteraksi dengan ChatGPT menggunakan perintah suara, sehingga memungkinkan pengalaman pengguna yang lebih personal. Perusahaan mengatakan fitur tersebut didukung oleh model text-to-speech yang menghasilkan audio berdasarkan sampel ucapan minimal yang dibuat oleh pengisi suara profesional. Perusahaan mengatakan fitur tersebut juga didukung oleh Whisper, sistem pengenalan suara sumber terbuka.

Kemampuan suara diharapkan menawarkan kasus penggunaan yang lebih luas, seperti membantu tugas-tugas seperti membaca cerita pengantar tidur, membuat resep, menulis pidato, membacakan puisi, menjelaskan frasa umum, dan bahkan menyelesaikan "debat di meja makan".

OpenAI menambahkan bahwa pengguna akan segera dapat memberikan gambar (atau bagian gambar tertentu) ke ChatGPT untuk interpretasi dan respons.

OpenAI mengakui adanya risiko

OpenAI mengakui adanya risiko penipuan dan pemalsuan dan mengatakan pihaknya membatasi kemampuan suara pada platform obrolan suaranya. Ini menekankan bahwa ia menggunakan aktor suara profesional – bukan suara pengguna – untuk mengeluarkan audio. OpenAI menambahkan bahwa grup tertentu lainnya diperbolehkan menggunakan fitur suara untuk tujuan lain; misalnya, Spotify menerjemahkan podcast yang berpartisipasi ke dalam bahasa baru dan menggunakan suara asli masing-masing host.

Perusahaan mencatat bahwa pengenalan gambar menimbulkan risiko privasi dan mengatakan bahwa sebagai tanggapannya, hal itu membatasi kemampuan ChatGPT untuk membuat pernyataan tentang orang. Mereka mencatat bahwa ChatGPT "tidak selalu akurat," namun deskripsi umum dari gambar tersebut mungkin berguna, mengutip karya awalnya dengan Be My Eyes, sebuah aplikasi untuk orang-orang buta dan rabun.

OpenAI mengatakan akan memperkenalkan kemampuan suara dan gambar ke ChatGPT Plus dan Enterprise dalam dua minggu ke depan. Perusahaan mengatakan fitur suara akan tersedia di iOS dan Android (opt-in), dan fitur gambar akan tersedia di semua platform.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

Hadiah
suka
Komentar
Bagikan

Komentar

0/400

Tidak ada komentar

Topik
1/3
1Simple Earn Annual Rate 24.4%
38333 Popularitas
2Gate Launchpad List IKA
40024 Popularitas
3ETH Trading Volume Surges
41678 Popularitas
4Gate ETH 10th Anniversary Celebration
21796 Popularitas
5Trump’s AI Strategy
17311 Popularitas

Sematkan

peta situs