"Les résultats que j'ai calculés avec plusieurs modèles sont différents..."
Le 14 juillet, un groupe d'amis a utilisé l'IA pour calculer un problème mathématique : quel est le volume en millilitres d'une plate-forme ronde d'une hauteur de 11 cm, d'un diamètre de 7,8 cm en bas et d'un diamètre de 6,2 cm à le fond?
Cet internaute a utilisé Claude-2, GPT-4 et ChatGPT, et les résultats étaient : 3634,57 ml, 359,4 ml et 469,3 ml.
Un autre ami du groupe a utilisé les mots de Wenxin pour obtenir un résultat de 64474,666666666635 millilitres.
"Je ne peux pas faire les questions du collège", "Bon gars, ils sont tous différents", a commenté le groupe d'amis à la hâte.
Je l'ai également testé avec ChatGPT par curiosité, et le résultat était de 1436,08 ml.
Les étapes de calcul données par ChatGPT sont tout à fait correctes, la formule de volume du tableau circulaire = πh*(R^2+r^2+R*r)/3.
Cependant, le résultat calculé est faux.
J'ai demandé à ChatGPT de répondre à nouveau, et le résultat était de 513,47 ml.
C'est scandaleux, les étapes de calcul sont tout à fait correctes, et le résultat final est différent à chaque fois.
J'ai également utilisé "l'IA" fournie avec le navigateur Baidu, qui est un grand modèle pris en charge par Wenxin Yiyan.
Le premier résultat est : 193522.10746113118 ml
C'est tellement faux, j'ai redemandé et j'ai obtenu le résultat : 1168,75 ml
Toujours pas correct, j'ai redemandé et le résultat était : 1099620ml
Après des interrogations répétées, Baidu AI n'est plus installé et il est complètement cassé.
Il a été rapporté précédemment que GPT-4 avait obtenu des notes complètes à l'examen de premier cycle en mathématiques du MIT, et il a été révélé plus tard qu'une grande partie de l'ensemble de données de test était contaminé. En d'autres termes, le modèle est comme un étudiant à qui on a dit la réponse avant l'examen, ce qui est une "tricherie" flagrante.
Il a également été rapporté plus tôt que ChatGPT s'était renversé lors du test de mathématiques de l'examen d'entrée à l'université chinoise.
Les modèles à grande échelle sont sans aucun doute une technologie qui a été recherchée récemment.Cependant, les cas fréquents de renversements de voitures semblent être ce qu'a dit Zhang Tianrong, un ancien physicien et écrivain de vulgarisation scientifique.L'essence des modèles de langage est la victoire de la probabilité théorie. "La machine **, le convertisseur fait une suite raisonnable de l'entrée, et il n'est pas difficile de comprendre les blagues absurdes sérieuses.
Si le grand modèle est la victoire de la théorie des probabilités, alors le réveil de l'intelligence artificielle est loin d'être au rendez-vous.
Voir l'original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Vous ne savez même pas comment répondre aux questions du collège, ChatGPT, Wenxin Yiyan, Claude montrant des pattes de poulet ?
"Les résultats que j'ai calculés avec plusieurs modèles sont différents..."
Le 14 juillet, un groupe d'amis a utilisé l'IA pour calculer un problème mathématique : quel est le volume en millilitres d'une plate-forme ronde d'une hauteur de 11 cm, d'un diamètre de 7,8 cm en bas et d'un diamètre de 6,2 cm à le fond?
Cet internaute a utilisé Claude-2, GPT-4 et ChatGPT, et les résultats étaient : 3634,57 ml, 359,4 ml et 469,3 ml.
Un autre ami du groupe a utilisé les mots de Wenxin pour obtenir un résultat de 64474,666666666635 millilitres.
Je l'ai également testé avec ChatGPT par curiosité, et le résultat était de 1436,08 ml.
Les étapes de calcul données par ChatGPT sont tout à fait correctes, la formule de volume du tableau circulaire = πh*(R^2+r^2+R*r)/3.
Cependant, le résultat calculé est faux.
J'ai également utilisé "l'IA" fournie avec le navigateur Baidu, qui est un grand modèle pris en charge par Wenxin Yiyan.
Si le grand modèle est la victoire de la théorie des probabilités, alors le réveil de l'intelligence artificielle est loin d'être au rendez-vous.