Willison氏の主張は分かりやすく、ChatGPTがWebページを読み取ることができれば、ハッカーや悪意のある人物がWebページを構築し、以前はブラウジングやその他の操作から隔離されていた「Advanced Data Analytics」モードで利用可能なコード生成機能を使用してプログラムするように秘密の指示を与えるというものです。 攻撃者は、ChatGPT に、インストール時に理論的に人のコンピューターやデバイスを乗っ取るプログラムを作成させるなど、自分たちの利益、いたずら、妨害行為、またはさらに悪いことに、あらゆる種類のことを実行させることができます。
ChatGPTプラグインのエコロジーは完全に「ノープレイ」? 新しいアップデートは、すべての機能を「オールインワン」にしたいと考えています
スタートアップのOpenAIは、1年前の2022年11月30日のリリース以来、人気のAIチャットボット「ChatGPT」を着実に改善してきましたが、すでに体験を開始したユーザーによると、ChatGPTの最新のアップデートは、以前の機能をすべて吸収し、それらを1つに統合しているようです。
複数のユーザーが、ChatGPT アカウントに送信された更新されたメッセージをソーシャル メディアで共有しました。
また、PDFやその他のドキュメントに関する質問の分析と回答、Webブラウジングとデータ分析、OpenAIの画像生成モデルであるDALL-E 3との統合(ユーザーがテキストプロンプトを使用して新しい画像を作成できる)などの機能は、過去数か月のChatGPTセッションで「GPT-4」ドロップダウンメニューで各アイテムを個別に開く必要がありました。 言い換えれば、ユーザーはこれまで、これらの ChatGPT 機能のうち 1 つしか使用できませんでした。
つまり、ドキュメントを分析してからそれに関する画像を生成する場合は、1 回のチャット セッションで最初のタスクを完了し、ChatGPT から返された分析されたテキストを手動でコピーしてから、DALL-E 3 を有効にして新しいチャット ウィンドウを起動する必要があります。 その後、最初のチャット セッションで残ったテキストを貼り付けて、新しい DALL-3 セッションで ChatGPT に画像を生成するように依頼できます。 OpenAI の最新のアップデートにより、これらすべてのタスクを同じチャット セッションで実行できるようになり、サービスの効率が大幅に向上します。
ユーザーは、この更新とモードを「すべてのツール」と見なします。
ユーザーからの最初の反応は非常に肯定的で、他のGPTベースのスタートアップにとっても同様に破壊的でした
"Breaking Thing: ChatGPT-4 は、ゴッド オブ ウォー キング コング (Voltron) スタイルのように、さまざまなクレイジー ツールをすべて 1 つのチャットに統合しました。 PDF、データ、DLLE、ビジュアル、ブラウジングをシームレスに処理します。 ニューヨーク大学スターン・スクール・オブ・ビジネスの学生部長であるコナー・グレナン氏は、20世紀の80年代に人間が操縦する大きな機械仕掛けのライオンが1人の戦士に組み合わされた、影響力のある漫画を引用して、LinkedInに投稿した。 (20世紀の90年代のダイナソー・トゥルーパーズは、実写番組でも同様のアプローチをとっていました)。
p-AIインキュベーターの創設者であるAlex Ker氏は、Xプラットフォーム上で「OpenAIがPDFチャット機能を追加したため、多くのスタートアップが今日死んだ。 また、データファイルやその他の種類のドキュメントとチャットすることもできます。 独立した企業というよりは、機能として向いている製品が次々と出てきています。 ラッパーは、一方ではOpenAIによって、他方では既存企業によって圧迫されています。 世の中は大変です。 "
NvidiaのシニアAIサイエンティストであるJim Fan氏もこれに同意し、Xに「気分を高揚させる前に、OpenAI/Anthropic/Microsoftが3人のエンジニアにハッカソンでこの機能を追加させることは可能か、と自問してみてください」と投稿しました。 彼はまた、このモデルに従うスタートアップは「薄い**ラッパーの墓場」に行き着くだろうと示唆した。
Ker氏とFan氏は、OpenAIがGPT-3.5とGPT-4の大規模言語モデル(LLM)へのAPIアクセスを可能にして以来、ChatGPTのさまざまなバージョンを支える多くの企業が誕生したことに言及しました。
サードパーティ企業は、これらのモデルにアクセスして、独自のOpenAIを利用したアプリケーションや製品を構築することができ、その一部はPDFやドキュメント分析を提供しています。 これらのアプリや製品は、技術コミュニティのメンバーから「ラッパー」と見なされ、本質的には基盤となるGPT-3.5/4テクノロジーに「包まれた」異なるユーザーインターフェイスにすぎないため、嘲笑されることさえあります。
実際、OpenAIは今年3月にサードパーティのChatGPTプラグインの独自のライブラリを公開し、PDFやドキュメント分析ツールなど、サードパーティの開発者が提供する多くの製品を公開しました。 ただし、それらを使用するエクスペリエンスは、ユーザーにとって少し面倒なことが多く、ドキュメントを別の Web サイトにアップロードして URL を ChatGPT に貼り付ける必要があります。
新しいアップデートにより、これらのプラグインは基本的に時代遅れになったようです。 さらに、一部のユーザーは、DALL-E 3画像生成とChatGPTの既存の対話理解と組み合わせたアップロード機能のおかげで、「すべてのツール」アップデートは自然言語コマンドを使用してユーザー提供の画像を編集でき、このタスクでPhotoshopと効果的に競合すると指摘しました。
...... しかし、セキュリティ上の懸念を抱えている人もいます
効率を向上させ、ユーザーにより強力なエクスペリエンスを提供するために、ChatGPT の増え続ける機能のリストを「ゴッド オブ ウォー (Voltron)」のような形式にバンドルすることは理にかなっています。 それでも、セキュリティ上の懸念を提起する人もいます。
DjangoのPythonウェブフレームワークの共同開発者であり、データ公開/探索ツールであるDatasetteの創設者であるSimon Willison氏は、「ブラウザとコードインタプリタの両方が同じセッションで利用できるのを見て本当に驚きました。この2つの組み合わせに対するクリエイティブなプロンプトインジェクション攻撃の効果的なベクトルのように感じました。 "
「Code Interpreter」は、ChatGPTの「Advanced Data Analytics」設定の名前で、ドキュメントをアップロードして分析できます。
しかし、さまざまなユーザーが示しているように、ChatGPTは、秘密の指示を与える白いテキストなど、特定の情報を含むアップロードによって簡単にだまされる可能性があります。
Willison氏は、その後のXの投稿で懸念を詳しく説明し、「ブラウズモードは、ブラウズモードでアクセスしたページに悪意のある指示が隠されている可能性があるため、迅速な注入の手段です。 現在、これらの悪意のある命令はサンドボックス内のPythonにアクセスでき、その出力にはブラウジングをトリガーするさらなる命令が含まれている可能性がありますか? "
Willison氏の主張は分かりやすく、ChatGPTがWebページを読み取ることができれば、ハッカーや悪意のある人物がWebページを構築し、以前はブラウジングやその他の操作から隔離されていた「Advanced Data Analytics」モードで利用可能なコード生成機能を使用してプログラムするように秘密の指示を与えるというものです。 攻撃者は、ChatGPT に、インストール時に理論的に人のコンピューターやデバイスを乗っ取るプログラムを作成させるなど、自分たちの利益、いたずら、妨害行為、またはさらに悪いことに、あらゆる種類のことを実行させることができます。
OpenAI はこれまで ChatGPT の新しいバンドル バージョンを発表しておらず、公開時点では、同社の公式ブログも ChatGPT リリース ノートの Web ページも、バンドルされた機能に関する新しい情報を含むように更新されていません。 OpenAIのCEOであるSam Altman氏、CTOのMira Murati氏、開発者向け広報アドボケイトのLogan Kilpatrick氏も、Xアカウントを通じて情報を公開していません。
リソース: