本日、ChatGPT「コードインタープリター」が正式に解禁されました! 30秒で写真を動画に、口で時計を作る | 10のすごい魔法大全集

出典:新志源

3 か月以上待って、ChatGPT の「コード インタプリタ」がついに完全にオープンになり、魔法の波が来ています。

ご家族の皆様、ついにここまで来ました!

たった今、ChatGPT「コードインタープリター」ベータ版がすべての Plus ユーザーに正式に公開されました。

OpenAI の科学者である Karpathy 氏もこれを公表しており、コード インタプリタのベータ版は非常に強力です。

これはあなたの個人データ アナリストです。アップロードされたファイルの読み取り、コードの実行、グラフの生成、統計分析などを行うことができます。コミュニティがその可能性を最大限に発揮するには、しばらく時間がかかると思います。

少し前にGPT4の能力低下がネット上で大騒ぎになり、GPT3.5より少し強いのではないかという意見もあった。

そして今、コードインタープリターが人々に再び感じさせ、おなじみの強力な GPT-4 が戻ってきました!

このプラグインが公開されるとすぐに、多くのネチズンがテストを開始しました。

機能ロック解除

では、「コード インタプリタ」は具体的に何ができるのでしょうか?

30秒で写真がビデオになります

いいえ、一部のネチズンは実際に ChatGPT を使用して写真をビデオに変換しました。この効果は、Midjourney や Runway よりもさらに爆発的です。

これはどのように行われるのでしょうか?ネチズンは完全なチュートリアルを提供しました。

ステップ 1: 「コード インタープリター モデル」を開きます。有効にするには、[設定] -> [ベータ機能] -> [コード インタープリター] に移動します。

ステップ2:

ドロップダウン メニューから [コード インタープリター] オプションを選択します。次に、アニメーションさせたい画像をアップロードします。

ステップ 3:

おしゃれなレストランの料理を紹介したいと思います。そこで、ChatGPT にこの食べ物の写真を左から右にアニメーション化するように依頼しました。 GPT ヒント (以下を参照) を変更することで、独自のアニメーションを作成できます。

詳細は次のとおりです。

ステップ 4:

Enterを押します。 30 秒後、ChatGPT はビデオのダウンロード リンクを提供します。

共同創設者の Greg Brockman は、ffmpeg 呼び出しを思い出せない場合に画像変換用のコード インタプリタをリツイートしています。

「コード インタプリタ」が非常に優れていることは事実によって証明されており、ビデオを切り取る場合、たった 1 つの文を入力するだけで完了します。

「メモリ容量には一定の制限がありますが、小さなファイルの処理には問題ありません。4 秒の gen-2 ビデオを TA に投げ、最初の 2 秒をインターセプトしたところ、問題なく、すぐに完了しました。

「適切なコードを自動的にテストします。プログラムしたい場合は、ta にファイルを投げて要求し、ta が提供するコードを確認します。」

### PDF から画像へ

中国の有名なインターネット技術ブロガーである「Bao Yu」は、「コード インタプリタ」を使用して PDF を画像に変換しました。

以前は、各ページの内容を 1 つの画像に結合する必要がありましたが、今ではそれが可能です。

### GIF からビデオへ

写真をビデオに変換するだけでなく、GIF をビデオに変換することもできます。

ネチズンは ChatGPT にヒントを与えました。私は GIF をアップロードし、あなたは 5 秒の MP4 を与え、ストーリー レンズを使用してゆっくりとズームインします。

GIFをアップロードする

最後にChatGPTはすぐにビデオを生成しました

、再生時間 00:05

さらに、ChatGPT は「マトリックス」GIF を作成することもできます。

### QR コードを生成

2 日前、OpenAI は ChatGPT 「コード インタプリタ」が完全にオープンになると発表しました。

QRコードを生成する例を示していますが、一言で口を動かすだけで完了します。

### 「ポケット」データ アナリスト

コードインタープリタの最大の使用例はデータ分析です。

たとえば、さまざまな国や世界最大の都市の平均寿命データを分析してみましょう (CSV、Word、PDF、またはビデオ ファイルをアップロードできます)。

次に、データと対話して、質問したいことがあれば質問してください。

あるいは、驚くべき結果を得るために、データから独自のランダムな傾向を抽出するよう依頼してください。

たとえば、2 つのデータ セットから固有の傾向を見つけて、表形式で表示します。

最後のステップは視覚化です。

データを任意のチャートやグラフに変換します。何よりも、ワンクリックで完了します。

たとえば、国の 1 人当たり GDP と平均寿命の関係を示す散布図を生成します。

このような強力な「データアナリスト」を見て、ネチズンは再び安堵し始めました。

ユーザーのガイダンス

「コードインタープリタ」の使い方は?ウォートン大学のイーサン・モリック教授は、このためだけにガイドを書きました。

まず第一に、Mollick 氏は、Code Interpreter という名前は、OpenAI が自社製品に悪い名前を付けるという長い伝統を引き継いでいると指摘しました。

なぜなら、これは「コード インタプリタ」と呼ばれていますが、実際には、プログラミングをまったく理解していない人にとって最も便利だからです。

基本的に、「コード インタープリター」により、GPT-4 は情報をアップロードおよびダウンロードし、ユーザーに代わってプログラムを作成および実行できるようになります。これにより、AI はこれまでできなかったあらゆる種類のことを実行できるようになります。

具体的には、AI に一般的な問題解決ツールボックス (Python でコードを記述することによって)、大容量メモリ (最大 100MB、圧縮形式も可能) を提供し、ユーザーはこのツールボックスを AI に統合して LLM を実行できるという利点があります。

これは、ChatGPT の以前のバージョンに関する多くの問題を修正するのに役立ちます。例えば、

これにより、AI は数学 (複雑であっても) を処理できるだけでなく、単語をより正確に処理できるようになります (段落内の単語を実際に数えるなど)。その根本的な理由は、数学と数学における LLM の本来の弱点に対処する Python コードを記述できることです。言語。

例えば下の写真のような感じです。

ご覧のとおり、「コード インタプリタ」は段落内の単語数を正確にカウントできます。

さらに、「コードインタープリタ」は幻覚やナンセンスの可能性を減らします。

AI が Python を直接使用する場合、コードは AI を「正直」に保つのに役立ちます。理由も非常に単純で、コードが間違っていると Python がエラーを報告してしまうからです。コードはデータを操作するため、AI はデータにエラーを挿入できません。

もちろん、完璧ではありません。 AI が幻覚を起こす可能性はまだありますが、これは一般的ではなく、コードやデータ自体に影響を与える可能性は低いです。

このように、AI は一般的な人工知能に近づいており、多くの問題をコードで解決できます。

さらに、GPT-4 は、新しく興味深い方法で「コード インタプリタ」をいつ使用するかを決定するのに非常に優れています。

モリック氏は例を挙げ、地球が丸いことをユーザーにGPT-4に証明させた場合、テキストとコードや画像を組み合わせて複数の引数を提供する「コードインタープリタ」が使用されるだろうと述べた。

以前は、さまざまな専攻でプログラミングを必要とする人はコードの書き方を知る必要がありましたが、書いた後は自分でデバッグする必要がありました。従来のAIがある程度助けてくれたとしても、Pythonの基礎知識がない人にとってはかなり難しく、AIの力を借りて何度もコードを修正しなければなりません。

そして、「コードインタープリタ」により、AI が自らエラー修正やデバッグを行うことができるようになりました。

次に、Mollick 氏は、多くのユーザーにとって本当の問題点とみなされる、「コード インタープリター」を使用してデータを処理する方法について話しました。

モリック氏は、「コードインタープリター」は非常に高度なレベルで動作し、多くの複雑な定量分析を自動的に処理でき、非常に複雑なデータ手法を採用できると述べた。

ZIPファイルなどの圧縮データでもプラス記号をクリックするだけで簡単にアップロードできます。

同時に、データを提供する場合は、ユーザーが提供できるのが最善です。 AI はコンテキストからデータの意味と構造を理解できるようになります。

さらに、モリック氏は、「コードインタープリター」を使用すると、ユーザーはAIとより「対話」するようになり、厳密で簡潔なコードを書くために頭を悩ませる必要がなくなると指摘した。

データ アナリストとチャットするのと同じように、人々とどのように話すかが、「コード インタプリタ」とのコミュニケーション方法になります。

ただし、ここには 2 つの特殊なケースがあり、同様の内容を記述する必要があります。

1 つは、AI が自分に何ができるかを覚えていない場合があり、現時点では AI を目覚めさせるために AI が必要であるということです。

例: 「GIF を作成できます。試してみてください。」

別の状況として、ユーザーが結果に満足できない場合、「コード インタプリタ」を使用して結果を最適化できます。

例: 「この結果に対してさらにテストを実行してください」または「このグラフはもっと改善できますか」。

データをロードした後、GPT はデータのマージとクリーニング操作を実行できます。具体的な処理方法は非常に複雑ですが、前述したように「コードインタープリタ」は対面のデータアナリストと考えてください。

同時に、Mollick氏は、何か問題が発生した場合に備えて、AIが自らを修正して修正した後に結果を確認するのが最善であることをユーザーに思い出させます。

モリックはそれを実践した直後、スーパーヒーローがどのようなスーパーパワーを持っているかを予測するための予測モデルを作成するよう「コードインタープリター」に依頼した。

ご覧のとおり、「コード インタプリタ」はランダム フォレスト ディストリビュータを構築します。

もちろん、実際の運用プロセスでは、ユーザーは GPT と「さらに通信」する必要があります。モリック氏は、AI が欠損データを推定するために数値データを使用することを望んでおらず、欠損部分を直接破棄したいと考えています。

しかし、GPT と対話して、別の処理方法に変更させることも可能であると同氏は指摘しました。

その後、モリック氏は GPT に「別の複雑で興味深い分析を行うことはできますか?」という質問を送りました。彼は、Code Interpreter が選択したいくつかの分析手法に感銘を受けたと述べました。

下の写真のようになります。

「コードインタープリター」は超大国のネットワーク状況を巧みに分析する。ご覧のとおり、手法は多様で非常に興味深いです。

「コードインタプリタ」の最も素晴らしい点は、その推論能力でしょう。モリックはそれを非常に「人間的」なものだと要約した。

さらに、ビジュアライゼーションのインタラクティブ性のレベルは依然としてオンラインで向上しています。ユーザーはAIに継続的に出力内容の改善や変更をさせることができます。

モリック氏は AI に、3D グラフを含む 6 つのグラフを含むインタラクティブな表を作成させました。

チャートをより美しくするために、モリックは入力と結果の調整を続けました。

最終結果は、下の画像の右側のようになります。

素晴らしいマジック トップ 10

Netizen @GPTDOACN は最近、ChatGPT の衝撃的な使用例トップ 10 をまとめました。

コードインタープリタの視覚化

  1. GIF を MP4 に変換: ダイナミック ピクチャ (GIF) をビデオ ファイル (MP4) に変換できるため、共有や使用が容易になります。

  2. さまざまなグラフィックの作成: この機能を使用して、ヒストグラム、折れ線グラフ、円グラフなどのさまざまなグラフィックを生成し、データを視覚的に表示および分析できます。

  3. 画像から色を抽出して PNG パレットを作成: この機能は、任意の画像から主要な色を抽出し、PNG 形式でパレットを生成できます。

  4. データを整理して詳細な視覚化を生成する: 乱雑なデータがある場合、この機能を使用すると、データを整理して整理し、明確な視覚化に変換できます。

  5. CSV ファイルを GIF に変換: この機能は、CSV (カンマ区切り値) ファイル内のデータを動的に表示し、GIF 画像を生成します。

  6. プレイリストを分析して音楽の好みを要約する: この機能を使用して、音楽プレイリストを分析して音楽の好みを要約することができます。

  7. データ セットを完全に機能する HTML Web サイトに変換する: この機能により、データを表示および共有できる完全に機能する Web サイトにすばやく変換できます。

  8. ダウンロード可能な株式データ セットの作成: この機能は株式データ セットの作成に役立ち、このデータ セットは詳細な分析や調査のためにダウンロードできます。

  9. 画像をテキスト ファイルに変換: 画像からテキストを抽出する必要がある場合、この機能は画像内のテキストをテキスト ファイルに変換するのに役立ちます。

  10. フォーマットされていないデータの詳細な分析: フォーマットが指定されていない生データについて、この機能は詳細な分析を実行して貴重な情報を取得するのに役立ちます。

実際、コード インタプリタの使用例はこれよりもはるかに多くあります。

ネチズンからのコメント

ChatGPTコードインタープリタを試しています。今のところ、私が提案できるのは、「すべての開発者が今すぐに取り組み始める」ということだけです。

コードインタープリターによって何人の命が奪われたのでしょうか?あまりに多くの管理者が毎日非効率的にデータを処理しており、オフィスを自動化するには自然言語だけが必要になっています。

参考文献:

原文表示
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)