OpenAI annonce que ChatGPT va bientôt « voir, écouter et parler »

De nouvelles fonctionnalités, notamment la reconnaissance vocale et la synthèse vocale, seront déployées au cours des deux prochaines semaines.

Selon une annonce d'OpenAI du 25 septembre, ChatGPT proposera bientôt de nouvelles fonctionnalités permettant aux utilisateurs d'interagir avec lui via la reconnaissance d'image et vocale.

OpenAI a annoncé que les utilisateurs pourront interagir avec ChatGPT à l'aide de commandes vocales, permettant une expérience utilisateur plus personnalisée. La société affirme que la fonctionnalité est alimentée par un modèle de synthèse vocale qui génère de l'audio basé sur un échantillon minimal de parole créé par des acteurs professionnels. La société a déclaré que la fonctionnalité était également optimisée par Whisper, son système de reconnaissance vocale open source.

Les capacités vocales devraient offrir un plus large éventail de cas d'utilisation, comme l'aide à des tâches telles que la lecture d'histoires au coucher, la création de recettes, la rédaction de discours, la récitation de poésie, l'explication de phrases courantes et même la résolution de « débats à table ».

OpenAI a ajouté que les utilisateurs pourront bientôt fournir des images (ou sélectionner des parties d'images) à ChatGPT pour interprétation et réponse.

OpenAI reconnaît le risque

OpenAI a reconnu le risque de fraude et de contrefaçon et a déclaré qu'elle limitait en conséquence les capacités vocales de sa plateforme de chat vocal. Il souligne qu'il utilise des acteurs vocaux professionnels - plutôt que la voix de l'utilisateur - pour produire l'audio. OpenAI ajoute que certains autres groupes sont autorisés à utiliser la fonction vocale à d'autres fins ; par exemple, Spotify traduit les podcasts participants dans de nouvelles langues et utilise la voix originale de chaque hôte.

La société a souligné que la reconnaissance d'images présente des risques pour la vie privée et a déclaré qu'en réponse, elle limitait la capacité de ChatGPT à faire des déclarations sur les personnes. Il a noté que ChatGPT "n'est pas toujours précis", mais a déclaré qu'une description générale de l'image pourrait être utile, citant ses premiers travaux avec Be My Eyes, une application destinée aux personnes aveugles et malvoyantes.

OpenAI a annoncé qu'il introduirait des fonctionnalités vocales et d'image dans ChatGPT Plus et Enterprise au cours des deux prochaines semaines. La société a déclaré que la fonctionnalité vocale serait disponible sur iOS et Android (opt-in) et que la fonctionnalité image serait disponible sur toutes les plateformes.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)