This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
本日、ChatGPT「コードインタープリター」が正式に解禁されました! 30秒で写真を動画に、口で時計を作る | 10のすごい魔法大全集
出典:新志源
ご家族の皆様、ついにここまで来ました!
たった今、ChatGPT「コードインタープリター」ベータ版がすべての Plus ユーザーに正式に公開されました。
これはあなたの個人データ アナリストです。アップロードされたファイルの読み取り、コードの実行、グラフの生成、統計分析などを行うことができます。コミュニティがその可能性を最大限に発揮するには、しばらく時間がかかると思います。
そして今、コードインタープリターが人々に再び感じさせ、おなじみの強力な GPT-4 が戻ってきました!
このプラグインが公開されるとすぐに、多くのネチズンがテストを開始しました。
機能ロック解除
では、「コード インタプリタ」は具体的に何ができるのでしょうか?
30秒で写真がビデオになります
いいえ、一部のネチズンは実際に ChatGPT を使用して写真をビデオに変換しました。この効果は、Midjourney や Runway よりもさらに爆発的です。
ステップ 1: 「コード インタープリター モデル」を開きます。有効にするには、[設定] -> [ベータ機能] -> [コード インタープリター] に移動します。
ドロップダウン メニューから [コード インタープリター] オプションを選択します。次に、アニメーションさせたい画像をアップロードします。
おしゃれなレストランの料理を紹介したいと思います。そこで、ChatGPT にこの食べ物の写真を左から右にアニメーション化するように依頼しました。 GPT ヒント (以下を参照) を変更することで、独自のアニメーションを作成できます。
Enterを押します。 30 秒後、ChatGPT はビデオのダウンロード リンクを提供します。
「適切なコードを自動的にテストします。プログラムしたい場合は、ta にファイルを投げて要求し、ta が提供するコードを確認します。」
中国の有名なインターネット技術ブロガーである「Bao Yu」は、「コード インタプリタ」を使用して PDF を画像に変換しました。
写真をビデオに変換するだけでなく、GIF をビデオに変換することもできます。
ネチズンは ChatGPT にヒントを与えました。私は GIF をアップロードし、あなたは 5 秒の MP4 を与え、ストーリー レンズを使用してゆっくりとズームインします。
さらに、ChatGPT は「マトリックス」GIF を作成することもできます。
2 日前、OpenAI は ChatGPT 「コード インタプリタ」が完全にオープンになると発表しました。
QRコードを生成する例を示していますが、一言で口を動かすだけで完了します。
コードインタープリタの最大の使用例はデータ分析です。
たとえば、さまざまな国や世界最大の都市の平均寿命データを分析してみましょう (CSV、Word、PDF、またはビデオ ファイルをアップロードできます)。
あるいは、驚くべき結果を得るために、データから独自のランダムな傾向を抽出するよう依頼してください。
たとえば、2 つのデータ セットから固有の傾向を見つけて、表形式で表示します。
データを任意のチャートやグラフに変換します。何よりも、ワンクリックで完了します。
たとえば、国の 1 人当たり GDP と平均寿命の関係を示す散布図を生成します。
ユーザーのガイダンス
「コードインタープリタ」の使い方は?ウォートン大学のイーサン・モリック教授は、このためだけにガイドを書きました。
なぜなら、これは「コード インタプリタ」と呼ばれていますが、実際には、プログラミングをまったく理解していない人にとって最も便利だからです。
基本的に、「コード インタープリター」により、GPT-4 は情報をアップロードおよびダウンロードし、ユーザーに代わってプログラムを作成および実行できるようになります。これにより、AI はこれまでできなかったあらゆる種類のことを実行できるようになります。
具体的には、AI に一般的な問題解決ツールボックス (Python でコードを記述することによって)、大容量メモリ (最大 100MB、圧縮形式も可能) を提供し、ユーザーはこのツールボックスを AI に統合して LLM を実行できるという利点があります。
これは、ChatGPT の以前のバージョンに関する多くの問題を修正するのに役立ちます。例えば、
これにより、AI は数学 (複雑であっても) を処理できるだけでなく、単語をより正確に処理できるようになります (段落内の単語を実際に数えるなど)。その根本的な理由は、数学と数学における LLM の本来の弱点に対処する Python コードを記述できることです。言語。
例えば下の写真のような感じです。
さらに、「コードインタープリタ」は幻覚やナンセンスの可能性を減らします。
AI が Python を直接使用する場合、コードは AI を「正直」に保つのに役立ちます。理由も非常に単純で、コードが間違っていると Python がエラーを報告してしまうからです。コードはデータを操作するため、AI はデータにエラーを挿入できません。
もちろん、完璧ではありません。 AI が幻覚を起こす可能性はまだありますが、これは一般的ではなく、コードやデータ自体に影響を与える可能性は低いです。
このように、AI は一般的な人工知能に近づいており、多くの問題をコードで解決できます。
さらに、GPT-4 は、新しく興味深い方法で「コード インタプリタ」をいつ使用するかを決定するのに非常に優れています。
モリック氏は例を挙げ、地球が丸いことをユーザーにGPT-4に証明させた場合、テキストとコードや画像を組み合わせて複数の引数を提供する「コードインタープリタ」が使用されるだろうと述べた。
そして、「コードインタープリタ」により、AI が自らエラー修正やデバッグを行うことができるようになりました。
次に、Mollick 氏は、多くのユーザーにとって本当の問題点とみなされる、「コード インタープリター」を使用してデータを処理する方法について話しました。
モリック氏は、「コードインタープリター」は非常に高度なレベルで動作し、多くの複雑な定量分析を自動的に処理でき、非常に複雑なデータ手法を採用できると述べた。
ZIPファイルなどの圧縮データでもプラス記号をクリックするだけで簡単にアップロードできます。
さらに、モリック氏は、「コードインタープリター」を使用すると、ユーザーはAIとより「対話」するようになり、厳密で簡潔なコードを書くために頭を悩ませる必要がなくなると指摘した。
データ アナリストとチャットするのと同じように、人々とどのように話すかが、「コード インタプリタ」とのコミュニケーション方法になります。
ただし、ここには 2 つの特殊なケースがあり、同様の内容を記述する必要があります。
1 つは、AI が自分に何ができるかを覚えていない場合があり、現時点では AI を目覚めさせるために AI が必要であるということです。
例: 「GIF を作成できます。試してみてください。」
別の状況として、ユーザーが結果に満足できない場合、「コード インタプリタ」を使用して結果を最適化できます。
例: 「この結果に対してさらにテストを実行してください」または「このグラフはもっと改善できますか」。
同時に、Mollick氏は、何か問題が発生した場合に備えて、AIが自らを修正して修正した後に結果を確認するのが最善であることをユーザーに思い出させます。
ご覧のとおり、「コード インタプリタ」はランダム フォレスト ディストリビュータを構築します。
しかし、GPT と対話して、別の処理方法に変更させることも可能であると同氏は指摘しました。
その後、モリック氏は GPT に「別の複雑で興味深い分析を行うことはできますか?」という質問を送りました。彼は、Code Interpreter が選択したいくつかの分析手法に感銘を受けたと述べました。
下の写真のようになります。
「コードインタープリター」は超大国のネットワーク状況を巧みに分析する。ご覧のとおり、手法は多様で非常に興味深いです。
さらに、ビジュアライゼーションのインタラクティブ性のレベルは依然としてオンラインで向上しています。ユーザーはAIに継続的に出力内容の改善や変更をさせることができます。
モリック氏は AI に、3D グラフを含む 6 つのグラフを含むインタラクティブな表を作成させました。
チャートをより美しくするために、モリックは入力と結果の調整を続けました。
最終結果は、下の画像の右側のようになります。
素晴らしいマジック トップ 10
Netizen @GPTDOACN は最近、ChatGPT の衝撃的な使用例トップ 10 をまとめました。
GIF を MP4 に変換: ダイナミック ピクチャ (GIF) をビデオ ファイル (MP4) に変換できるため、共有や使用が容易になります。
さまざまなグラフィックの作成: この機能を使用して、ヒストグラム、折れ線グラフ、円グラフなどのさまざまなグラフィックを生成し、データを視覚的に表示および分析できます。
画像から色を抽出して PNG パレットを作成: この機能は、任意の画像から主要な色を抽出し、PNG 形式でパレットを生成できます。
データを整理して詳細な視覚化を生成する: 乱雑なデータがある場合、この機能を使用すると、データを整理して整理し、明確な視覚化に変換できます。
CSV ファイルを GIF に変換: この機能は、CSV (カンマ区切り値) ファイル内のデータを動的に表示し、GIF 画像を生成します。
プレイリストを分析して音楽の好みを要約する: この機能を使用して、音楽プレイリストを分析して音楽の好みを要約することができます。
データ セットを完全に機能する HTML Web サイトに変換する: この機能により、データを表示および共有できる完全に機能する Web サイトにすばやく変換できます。
ダウンロード可能な株式データ セットの作成: この機能は株式データ セットの作成に役立ち、このデータ セットは詳細な分析や調査のためにダウンロードできます。
画像をテキスト ファイルに変換: 画像からテキストを抽出する必要がある場合、この機能は画像内のテキストをテキスト ファイルに変換するのに役立ちます。
フォーマットされていないデータの詳細な分析: フォーマットが指定されていない生データについて、この機能は詳細な分析を実行して貴重な情報を取得するのに役立ちます。
実際、コード インタプリタの使用例はこれよりもはるかに多くあります。
ネチズンからのコメント
ChatGPTコードインタープリタを試しています。今のところ、私が提案できるのは、「すべての開発者が今すぐに取り組み始める」ということだけです。