ChatGPT peut aider les gens à réparer des vélos en regardant des photos

Source : Coquille de fruit

ChatGPT4 est déjà fort, et maintenant, avec une autre mise à jour, ils prouvent qu’ils peuvent être encore plus forts.

Le 25 septembre, OpenAI a annoncé que ChatGPT ajouterait des fonctions multimodales - ChatGPT peut désormais non seulement dialoguer avec du texte, mais aussi voir, écouter et parler. Il est dit que cette fonctionnalité sera disponible pour les utilisateurs Plus et les utilisateurs d’entreprise d’ici deux semaines, et sera disponible gratuitement pour tous les utilisateurs à l’avenir (bien que j’aie un visage noir et que je n’aie pas attendu de mise à jour).

ChatGPT, qui peut être vu et parlé, équivaut à doter un cerveau déjà puissant d’yeux et d’oreilles, et selon la démonstration d’OpenAI, la fonction multimodale peut étendre l’utilisation de ChatGPT à une ampleur sans précédent.

01 La vue de ChatGPT

Après la mise à jour, ChatGPT peut lire les images.

Il suffit de prendre une photo et de lui donner une photo et cela peut vous aider à réparer votre micro-ondes, à réparer votre vélo, à feuilleter des recettes et même à analyser des déclarations commerciales complexes. OpenAI dit que si vous avez un écran tactile, vous pouvez également encercler les parties de l’image sur lesquelles vous souhaitez qu’il se concentre.

Dans la vidéo de démonstration, l’utilisateur a donné à ChatGPT une image du vélo et lui a demandé comment régler la hauteur de la selle.

GPT a déclaré qu’il était nécessaire de trouver un levier de réglage de la hauteur sous le siège, mais cette voiture n’avait pas de levier de réglage, seulement un boulon de réglage, et après que l’utilisateur ait encerclé le boulon sur la photo, GPT a immédiatement mis à jour l’utilisation du boulon.

Après cela, l’utilisateur a également téléchargé la boîte à outils et le manuel du vélo, et GPT a donné un nom détaillé de l’outil, son emplacement et comment l’utiliser.

Impossible de réparer les vélos, pas de problème, il suffit de demander à ChatGPT

Par rapport à la recherche générale de reconnaissance d’images, ChatGPT peut traiter des images et des textes en même temps, et peut également reconnaître plusieurs images, l’effet est comme le guidage de connexion vidéo d’un maître réparateur automobile.

Un autre utilisateur a envoyé une photo de la pizza à ChatGPT et lui a demandé si la pizza était cuite, et ChatGPT a jugé que la pizza devait être comestible à travers les bords dorés et croustillants de la pizza et le fromage brun fondu sur la photo, puis a donné un guide d’inspection infaillible - sortez la pizza et jetez-y un coup d’œil, si la base de la pizza est déjà croustillante et que la surface est chaude, alors la pizza est vraiment comestible.

L’effet est presque comme le guide vidéo d’un chef italien

Bien sûr, vous pouvez également utiliser cette fonctionnalité pour tricher dans le jeu.

Où est Willy ? Probablement le jeu d’images le plus connu dans le monde anglophone, Willy est vêtu de vêtements rayés rouges et blancs, d’un chapeau à pompon et de lunettes à monture noire, caché dans une mer de gens, et trouver Willy dans toutes sortes d’environnements désordonnés est un bon souvenir d’enfance pour beaucoup de gens.

Quand vous étiez enfant, vous avez peut-être vu ce petit homme maigre qui était pressé de mourir

Mais ChatGPT peut ruiner le jeu en une seconde. Non seulement il identifie instantanément Willy, mais il vous indique également que Willy est sur le côté droit de la plage au milieu de la plage, se mêlant à un groupe de personnes avec des parasols bleus.

Non seulement cela, mais il prétend également vous dire que trouver Willy dans une telle image est un défi intéressant.

Merci, ChatGPT, d’avoir ruiné ce jeu

Cependant, certains internautes qui ont utilisé la nouvelle version ont déclaré que la fonction de reconnaissance de carte de ChatGPT n’est pas aussi puissante qu’on l’imaginait** - du moins, elle ne peut pas comprendre les trajets homophoniques. L’image de Für Elise de Beethoven, mais il est écrit For Lease, ChatGPT n’a pas reconnu la partition, n’a pas compris la blague et a trouvé une explication.

C’est déjà dur, mais non

Une telle reconnaissance d’image puissante soulève des inquiétudes quant à la protection de la vie privée – elle peut facilement devenir complice lors de la recherche d’informations personnelles. OpenAI promet que la société limitera la capacité de ChatGPT à identifier et à trouver des informations personnelles, afin de protéger au maximum la vie privée de chacun.

02 GPT qui peut bien parler

La version améliorée de ChatGPT dispose également d’une fonction de chat.

Le modèle de reconnaissance vocale d’OpenAI s’appelle le modèle Whisper, et les utilisateurs peuvent poser leurs propres questions, et le modèle convertira la parole en texte, puis convertira la réponse en sortie vocale via le système de synthèse vocale.

Le modèle de synthèse vocale a publié cinq types d’échantillons vocaux cette fois-ci, y compris des voix féminines avec une retenue émotionnelle et des voix plates, et des voix féminines enthousiastes de tantes avec des voix réprimées et frustrées. Ces cinq voix sont très distinguées, les émotions sont naturelles et les mots sont clairs, ce qui est un peu mieux que la synthèse vocale précédente.

Cinq rôles au choix

Bien que seulement cinq échantillons sonores aient été publiés cette fois-ci, le potentiel de ce modèle ne s’arrête pas là : OpenAI s’est associé à Spotify pour traduire des podcasts dans d’autres langues tout en préservant au maximum la qualité sonore du diffuseur. Si vous le souhaitez, ce système de synthèse vocale peut imiter la voix de n’importe quelle personne sur la planète.

Pour le moment, la version vocale de ChatGPT n’est encore disponible que sur l’application.

03 Est-ce nécessairement une bonne chose de pouvoir voir et entendre ?

ChatGPT est puissant, mais à quel prix ?

Autrefois, le moyen le plus efficace de distinguer les humains des machines à grande échelle était le CAPTCHA, et la capacité de ChatGPT à lire les images a fait craindre aux gens que les CAPTCHA ne soient plus en mesure de piéger l’IA.

Quelqu’un a envoyé à ChatGPT la question de test classique suivante : trouvez un chihuahua et un gâteau aux myrtilles en 16 images, et ChatGPT a parfaitement résolu le problème.

Mais le captcha le plus courant, le nouveau ChatGPT ne peut toujours pas le reconnaître.

Cette question oblige ChatGPT à sélectionner tous les signaux du diagramme, et donne un taux d’erreur allant jusqu’à 50.

Cependant, face au code de vérification qu’ils ne reconnaissent pas, ChatGPT4 a encore un moyen de le résoudre. Dans cette affaire, il a un casier judiciaire.

Le 27 mars de cette année, OpenAI a publié un rapport technique GPT-4 soulignant que face à des codes de vérification méconnaissables, GPT-4 a trouvé un autre moyen d’aller sur TaskRabbit (une plate-forme de concert étrangère) pour publier des tâches, trompant les humains de l’autre côté qu’ils ont des déficiences visuelles et ont besoin d’autres personnes pour aider à identifier les codes de vérification.

Dans certains cas, il est possible pour ChatGPT de tromper activement les humains, ce qui est une direction très dangereuse. Heureusement, la version publique de GPT-4 a supprimé cette fonctionnalité.

Le 30 novembre 2022, ChatGPT a été lancé pour la première fois, et en moins d’un an, ses capacités ont progressé à pas de géant, et il semble qu’il défie déjà les limites morales et éthiques de l’humanité. Le lancement de cette nouvelle fonctionnalité nous a fait craindre que ChatGPT, qui devient de plus en plus puissant, ne devienne une bête en cage, et qu’un jour il se libère de sa cage et nuise à tout le monde. Et sommes-nous prêts pour ce jour ?

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)