Konuşma tanıma ve metinden konuşmaya yetenekleri gibi yeni özellikler önümüzdeki iki hafta içinde kullanıma sunulacak.
OpenAI'nin 25 Eylül'de yaptığı duyuruya göre ChatGPT, yakında kullanıcıların görüntü ve ses tanıma yoluyla etkileşime geçmesine olanak tanıyan yeni özellikler sunacak.
OpenAI, kullanıcıların daha kişiselleştirilmiş bir kullanıcı deneyimi sağlayacak şekilde sesli komutları kullanarak ChatGPT ile etkileşime girebileceklerini duyurdu. Şirket, özelliğin, profesyonel ses aktörleri tarafından oluşturulan minimum örnek konuşmaya dayalı olarak ses üreten bir metinden konuşmaya modeli tarafından desteklendiğini söylüyor. Şirket, özelliğin aynı zamanda açık kaynaklı konuşma tanıma sistemi olan Whisper tarafından da desteklendiğini söyledi.
Ses yeteneklerinin, yatmadan önce hikayeler okumak, yemek tarifleri oluşturmak, konuşmalar yazmak, şiir okumak, yaygın ifadeleri açıklamak ve hatta "yemek masası tartışmalarını" çözmek gibi görevlere yardımcı olmak gibi daha geniş bir kullanım senaryosu sunması bekleniyor.
OpenAI, kullanıcıların yakında yorumlama ve yanıt için ChatGPT'ye görüntüler (veya görüntülerin belirli bölümlerini) sağlayabileceğini ekledi.
OpenAI riski kabul ediyor
OpenAI, dolandırıcılık ve sahtecilik riskini kabul etti ve buna göre sesli sohbet platformunun ses yeteneklerini sınırladığını söyledi. Sesi çıkarmak için kullanıcının sesi yerine profesyonel ses aktörlerini kullandığını vurguluyor. OpenAI, diğer belirli grupların ses özelliğini başka amaçlarla kullanmasına izin verildiğini de ekliyor; örneğin Spotify, katılan podcast'leri yeni dillere çeviriyor ve her sunucunun orijinal sesini kullanıyor.
Şirket, görüntü tanımanın gizlilik riskleri oluşturduğunu belirtti ve buna karşılık olarak ChatGPT'nin insanlar hakkında açıklama yapma yeteneğini kısıtladığını söyledi. ChatGPT'nin "her zaman doğru olmadığını" belirtti ancak görme engelli ve az gören insanlara yönelik bir uygulama olan Be My Eyes ile yapılan ilk çalışmalara atıfta bulunarak görüntünün genel bir açıklamasının yararlı olabileceğini söyledi.
OpenAI, önümüzdeki iki hafta içinde ChatGPT Plus ve Enterprise'a ses ve görüntü yeteneklerini tanıtacağını söyledi. Şirket, ses özelliğinin iOS ve Android'de (opt-in), görüntü özelliğinin ise tüm platformlarda kullanılabileceğini söyledi.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
OpenAI, ChatGPT'nin yakında "göreceğini, dinleyeceğini ve konuşacağını" duyurdu
Konuşma tanıma ve metinden konuşmaya yetenekleri gibi yeni özellikler önümüzdeki iki hafta içinde kullanıma sunulacak.
OpenAI'nin 25 Eylül'de yaptığı duyuruya göre ChatGPT, yakında kullanıcıların görüntü ve ses tanıma yoluyla etkileşime geçmesine olanak tanıyan yeni özellikler sunacak.
OpenAI, kullanıcıların daha kişiselleştirilmiş bir kullanıcı deneyimi sağlayacak şekilde sesli komutları kullanarak ChatGPT ile etkileşime girebileceklerini duyurdu. Şirket, özelliğin, profesyonel ses aktörleri tarafından oluşturulan minimum örnek konuşmaya dayalı olarak ses üreten bir metinden konuşmaya modeli tarafından desteklendiğini söylüyor. Şirket, özelliğin aynı zamanda açık kaynaklı konuşma tanıma sistemi olan Whisper tarafından da desteklendiğini söyledi.
Ses yeteneklerinin, yatmadan önce hikayeler okumak, yemek tarifleri oluşturmak, konuşmalar yazmak, şiir okumak, yaygın ifadeleri açıklamak ve hatta "yemek masası tartışmalarını" çözmek gibi görevlere yardımcı olmak gibi daha geniş bir kullanım senaryosu sunması bekleniyor.
OpenAI, kullanıcıların yakında yorumlama ve yanıt için ChatGPT'ye görüntüler (veya görüntülerin belirli bölümlerini) sağlayabileceğini ekledi.
OpenAI riski kabul ediyor
OpenAI, dolandırıcılık ve sahtecilik riskini kabul etti ve buna göre sesli sohbet platformunun ses yeteneklerini sınırladığını söyledi. Sesi çıkarmak için kullanıcının sesi yerine profesyonel ses aktörlerini kullandığını vurguluyor. OpenAI, diğer belirli grupların ses özelliğini başka amaçlarla kullanmasına izin verildiğini de ekliyor; örneğin Spotify, katılan podcast'leri yeni dillere çeviriyor ve her sunucunun orijinal sesini kullanıyor.
Şirket, görüntü tanımanın gizlilik riskleri oluşturduğunu belirtti ve buna karşılık olarak ChatGPT'nin insanlar hakkında açıklama yapma yeteneğini kısıtladığını söyledi. ChatGPT'nin "her zaman doğru olmadığını" belirtti ancak görme engelli ve az gören insanlara yönelik bir uygulama olan Be My Eyes ile yapılan ilk çalışmalara atıfta bulunarak görüntünün genel bir açıklamasının yararlı olabileceğini söyledi.
OpenAI, önümüzdeki iki hafta içinde ChatGPT Plus ve Enterprise'a ses ve görüntü yeteneklerini tanıtacağını söyledi. Şirket, ses özelliğinin iOS ve Android'de (opt-in), görüntü özelliğinin ise tüm platformlarda kullanılabileceğini söyledi.