Ortaokul soruları, ChatGPT, Wenxin Yiyan, tavuk ayağı gösteren Claude sorularını nasıl yapacağınızı bile bilmiyor musunuz?

Question

"Birkaç modelle hesapladığım sonuçlar farklı..."

14 Temmuz'da bir grup arkadaş, bir matematik problemini hesaplamak için yapay zekayı kullandı: yüksekliği 11 cm, üst alt kısmı 7,8 cm ve alt kısmı 6,2 cm olan yuvarlak bir platformun mililitre cinsinden hacmi nedir? alt?

Bu netizen Claude-2, GPT-4 ve ChatGPT kullandı ve sonuçlar: 3634.57 ml, 359.4 ml ve 469.3 ml.

Başka bir grup arkadaşı, 64474.666666666635 mililitre sonucunu elde etmek için Wenxin'in sözlerini kullandı.

"Ortaokul sorularını yapamıyorum", "Aferin dostum, hepsi farklı" diye yorum yaptılar arkadaş grubu aceleyle.

Ben de merakımdan ChatGPT ile test ettim ve sonuç 1436.08 ml çıktı.

ChatGPT tarafından verilen hesaplama adımları tamamen doğrudur, dairesel tablonun hacim formülü = πh*(R^2+r^2+R*r)/3'tür.

Ancak hesaplanan sonuç yanlıştır.

ChatGPT'den tekrar yanıt vermesini istedim ve sonuç 513,47 ml oldu.

Bu çok çirkin, hesaplama adımları tamamen doğru ve nihai sonuç her seferinde farklı.

Wenxin Yiyan tarafından desteklenen büyük bir model olan Baidu tarayıcısıyla birlikte gelen "AI" yı da kullandım.

İlk sonuç: 193522.10746113118 ml

Bu çok yanlış, tekrar sordum ve sonucu aldım: 1168.75 ml

Hala doğru değil, tekrar sordum ve sonuç: 1099620ml

Tekrarlanan sorgulamadan sonra, Baidu AI artık kurulu değil ve tamamen bozuk.

Daha önce GPT-4'ün MIT'nin matematik lisans derecesi sınavında tam puan aldığı bildirilmişti ve daha sonra test veri setinin büyük bir kısmının kirlendiği ortaya çıkmıştı. Başka bir deyişle, model, sınavdan önce cevabı söylenen bir öğrenci gibidir, ki bu apaçık "kopya"dır.

Daha önce ChatGPT'nin Çin üniversite giriş sınavının matematik sınavına girerken bozulduğu da bildirilmişti.

Büyük ölçekli modeller, şüphesiz son zamanlarda aranan bir teknolojidir. Ancak, eski bir fizikçi ve popüler bilim yazarı olan Zhang Tianrong'un söylediği gibi, sık sık araba devrilme vakaları gibi görünüyor. Dil modellerinin özü, olasılığın zaferidir. teori. "Makine **, dönüştürücü girişinin makul bir devamını yapar ve ciddi saçma sapan şakaları anlamak zor değildir.

Büyük model, olasılık teorisinin zaferiyse, o zaman yapay zekanın uyanışı gelmekten çok uzaktır.

View Original