This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
ChatGPTは公式検出ツールを削除、AIテキストを識別できないことを認める
出典:「Qubit」(ID:QbitAI)、著者:Mengchen
OpenAI は何の発表もなく、AI テキスト検出ツール を静かに閉じ、ページを直接 404 に閉じました。
これが効果があると信じている教師が多すぎて、不当な扱いを受けた多数の生徒が AI でカンニングをし、魔女狩りと化しています。
正解率は推測とほぼ同じ
この公式テストツールの精度はどの程度低いのでしょうか?
OpenAI 自体によって提供されるデータは、AI が生成したテキストの 26% と、人間が書いたテキストの不正な 9% のみを正確に識別できます。
また、市販されているさまざまな検出ツールは、聖書や合衆国憲法などの歴史文書がAIによって書かれた可能性があると判断してしまうという実験を行った人もいますが、これらの内容を書けない歴史上の人物はタイムトラベラーですよね?
しかし、さまざまな検出方法を使用して生徒の作業をチェックしようとする教師は依然としてたくさんいます。
最も有名なケースの 1 つは、テキサス A&M 大学の教授が、クラスの半分が遅刻者であると判断するところでした。
現在の検出方法は回避できる
ネットユーザーらは、OpenAIが生成ツールと検出ツールを同時に開発するのは矛盾していると指摘した。
一方がうまくいっている場合、もう一方はうまくいっていないため、利益相反が発生する可能性があります。
「ChatGPT の宿敵」として知られる最も古いものは、プリンストン大学の学部生エドワード ティアンによって開発された GPTZero です。これは、記事が AI によって生成されたかどうかを測定するために、複雑さと文の長さの変化を利用します。
当時、GPTZero プロジェクトは教育者向けに特別に作成されており、教師はテストのためにクラス全員の宿題をそれに投入することができました。
しかし、作者は7月に学生の不正行為を検出する方向性を断念したことを認めており、GPTZeroの次期バージョンではテキストがAIによって生成されたかどうかは検出されなくなり、最も人間らしい部分が強調表示される予定だという。
数字が人間によって計算されるのか、コンピューターによって完成されるのかと同じように、長い間誰も気にしていませんでした。
講演者の原稿が自分で書いたのか秘書が書いたのか誰も気にしないのでしょうか?
AIを題材とした人間行動研究
AI と人間のコンテンツを区別できないことは、悪いことばかりではないようです。
研究を加速するために、人間の被験者の代わりにAIを使用する心理学実験はすでに行われています。
Cell サブジャーナルの記事では、よく設計された実験シナリオでは、ChatGPT の応答が人間の参加者の約 95% の応答と相関していると指摘しました。
また、機械の被験者は疲れないため、科学者は前例のないスピードでデータを収集し、人間の行動に関する理論を検証することができます。
「AI は社会科学研究にとって大きな変革をもたらす可能性があります。社会科学研究では、慎重なバイアス管理とデータ忠実度が鍵となります。」
[1]
[2]
[3]
[4]
[5]
[6]