4 番目の更新は、新しいモダリティである DALL· E 3、GPT-4 Turbo のビジュアル機能、新しいテキスト読み上げモデルはすべて本日 API に導入され、すでに少数のお客様が DALL· E 3 プログラムで画像とデザインを生成します。 本日、コカ・コーラは、お客様がDALL· E 3 ディワリのグリーティングカードを生成します。
Assistance API には、永続スレッド、組み込みの取得コード インタープリター、動作する Python インタープリターとサンドボックス環境、および前述の改善された関数呼び出し機能が含まれています。
続いて、OpenAIの開発者エクスペリエンス責任者であるRaman氏が、これがどのように機能するかを示しました。 Ramon 氏は、多くの人が AI をアプリケーションに組み込んでいるのを見て勇気づけられたと言います。 Ramon氏は、APIに新しいパターンを導入するだけでなく、開発者のエクスペリエンスを改善して、人々がセカンダリエージェントを簡単に構築できるようにすることにも興奮していると発表した。 次に、ビルド プロセスを直接示します。
ラモンは、世界中の探検家のために「wanderlust」という旅行アプリを構築しています。 また、GPT-4で生み出された目的地のアイデアや、新しいDALL· E 3 API によってプログラムによって生成されたイラスト。 その後、Ramonは簡単なアシスタントを追加してアプリを強化する方法を示しました。 新しい支援ツールのプレイグラウンドに切り替え、アシスタントを作成し、名前を付け、初期指示を入力し、モデルを選択し、コードインタープリターと取得機能を有効にしてから保存します。
Ramon 氏はまた、インスタント ユーザー メッセージングよりも多くの知識をアシスタントに提供するための取得機能についても説明しています。 PDF ファイルをアップロードし、システムによって読み取られ、画面に表示されます。 次に、Airbnb の予約情報も会話にドラッグ&ドロップします。
Ramon氏は、開発者は通常、埋め込みを計算し、チャンクアルゴリズムを設定する必要があり、これらすべてが新しいステートフルAPIによって処理されるようになったことを強調した。 また、開発者ダッシュボードでは、呼び出された関数やアップロードされた PDF ファイルなど、ツールによって実行された手順を確認できます。
OpenAI初の開発者会議:GPT-4 Turbo、GPT Store
出典:新しいNewinがあります
OpenAIの開発者初日の発表で、Sam Altman氏は、より強力で、より長いコンテキスト、より多くの制御を備えた新しいモデルであるGPT-4 Turbo、開発者が支援エージェントを構築するためのエクスペリエンスを簡素化するAssistance APIの立ち上げに限らず、同社にとって一連の重要な開発について詳しく説明し、OpenAIは、自然言語が将来的にコンピューターと対話するための重要な方法になることを強調し、会話を通じてGPTプログラミングも紹介しました アルトマンは、ユーザーが革新的なGPTアプリを共有および発見し、収益分配インセンティブを提供できるGPTストアの今後の立ち上げを発表しました。 Altman氏はまた、Microsoftとのコラボレーションの深化についても語り、新しいテキスト読み上げモデルと改善された機能呼び出しを紹介したが、その概要は以下のセッションで説明できる。
OpenAIの開発者初日の全コンテンツは次のとおりです。
まず、アルトマンは、11月30日のChatGPTのリリースを控えめな研究プレビューとして思い出し、現在世界で最も強力なモデルであるGPT-4を3月に発売することを誇らしげに発表しています。
Altman 氏はまた、過去数か月間に ChatGPT に導入された音声および視覚機能を紹介し、見たり、聞いたり、話したりする能力を与え、DALL· 世界で最も先進的な画像モデルであるE3の発売は、ChatGPTに統合されています。
OpenAI は、エンタープライズ レベルの顧客向けに、より高速な GPT アクセス、より長いコンテキスト ウィンドウ、よりエンタープライズ グレードのセキュリティとプライバシー保護を提供する ChatGPT Enterprise を発表しました。 アルトマン氏は、約200万人の開発者がAPIを使用しており、フォーチュン500企業の92%以上が自社製品に基づいてソリューションを構築しており、ChatGPTには現在、毎週約1億人のアクティブユーザーがいることを明らかにしました。 特に、この成果は、ユーザーが製品を便利だと感じ、友人に勧めるため、完全に口コミに依存していると指摘しました。 最後に、データは素晴らしいが、それよりも重要なのは、人々がこれらの製品をどのように利用し、AIをどのように活用しているかであると述べ、その進歩を可視化するビデオを見せた。
OpenAI の開発者会議で、Sam Altman 氏は、AI が人々の私生活や創造性にどのように大きな影響を与えるかをビデオで紹介しました。 動画の1つは、ChatGPTをロマンチックではないが、敬意を払い、愛情を込めて使用し、父親の母国語であるタガログ語と複雑な文法構造で父親に愛とサポートを伝える男性の事例です。 このケースは、文化的および言語的なニュアンスを理解して適用するChatGPTの能力を示しています。
アルトマン氏によると、ChatGPTのクリエイティブなアプリケーションは素晴らしく、クリエイターが思考を広げ、自信を高めるのに役立ちます。 例えば、冷蔵庫に足りないものをチェックしたり、ベジタリアンのレシピを計画したり、スプレッドシートの作成やコードの記述を手伝ったりするなど、日常業務を支援するためにChatGPTを使用している人がいて、別の動画のキャラクターはChatGPTの親和性、忍耐力、知識の豊富さ、応答性を発見しています。 4.0 の学生と 4 人の母親にとって、ChatGPT の質問や説明への回答を提供する機能は、家庭教師への依存を減らし、家族や自分自身とのより多くの時間を稼ぐことができます。 最後に、ビデオには、脊髄と脳の手術を受けた後、左手の使用に制限されたことを話す男性もいます。 現在、ChatGPT の音声入力と会話機能を使用することで、このユーザーは大いに支援され、促進されています。 これらのケースストーリーは、日常生活を支援し、学習をサポートし、障害を克服するChatGPTの可能性を示すと同時に、AIがかつてないほど世界規模でユーザーをつなぎ、力を与える方法を示しています。
その後、Sam Altman氏は、人々がテクノロジーをどのように活用しているかを共有し、それがまさに彼らの仕事であることを強調しました。 その後、彼は一連の新しい開発を発表しました。 Altman氏は、世界中の開発者と話をし、彼らのフィードバックに耳を傾けることに多くの時間を費やし、それが今日の展示内容に大きな影響を与えたと述べています。
OpenAIは、新モデル「GPT-4 Turbo」を発売しました。 この新しいモデルは、多くの開発者のニーズに対応します。 彼は6つの主要なアップデートを詳述し、1つ目はコンテキストの長さで、GPT-4は最大8,000トークンのコンテキストをサポートし、場合によっては32,000に達する可能性があります。 GPT-4 Turboは最大128,000トークンのコンテキストをサポートしており、これは標準的な書籍の300ページに相当し、8,000トークンのコンテキストの16倍の長さです。 コンテキストの長さが長くなったことに加えて、長いコンテキストを処理する際のこのモデルの精度も大幅に向上しました。
2 番目の更新は、より制御性が高いことです。 開発者がモデルの応答と出力をより詳細に制御できるように、モデルが有効なJSONに応答するようにするJSONスキーマと呼ばれる新機能を導入し、API呼び出しを大幅に簡素化しました。 このモデルは、関数呼び出しに関しても改善され、複数の関数を同時に呼び出し、命令に適切に従うことができるようになりました。 また、"Reproducible Output"と呼ばれる新機能も導入され、モデルがシードパラメータを渡すことで一貫した出力を返すことができ、モデルの動作をより詳細に制御できるようになりました。 この機能は現在ベータ版です。
今後数週間のうちに、ログプローブをAPIで表示できる新機能を展開する予定です。 3つ目のアップデートは、世界についての知識を深めることです。 モデルがより正確な世界の知識にアクセスできるようにするために、外部のドキュメントやデータベースから知識を抽出できる検索機能を導入しました。 また、知識の締め切りも更新され、GPT-4 Turboの世界の知識は2023年4月に更新され、今後も改善が続けられます。
4 番目の更新は、新しいモダリティである DALL· E 3、GPT-4 Turbo のビジュアル機能、新しいテキスト読み上げモデルはすべて本日 API に導入され、すでに少数のお客様が DALL· E 3 プログラムで画像とデザインを生成します。 本日、コカ・コーラは、お客様がDALL· E 3 ディワリのグリーティングカードを生成します。
もちろん、彼らのセキュリティシステムは、開発者がアプリケーションの誤用を防ぐのに役立ち、これらのツールはAPIで使用できます。 GPT-4 Turboは、APIを介した画像入力を受け入れ、キャプション、分類、分析を生成できるようになりました。 例えば、Miisではこの技術を使って、目の前にある商品を識別するなど、目の不自由な人や弱視の人が日常業務を行うのを支援しています。 また、新しいテキスト読み上げモデルでは、API のテキストから自然な音声を生成し、6 つのプリセット サウンドから選択できます。
Altman氏は、新しいテキスト読み上げモデルの自然さを示すサウンドの例を演奏しました。 この音声合成技術により、アプリのインタラクションがより自然でアクセスしやすくなり、言語学習や音声アシスタントなどの多くのユースケースが実現します。
Altman氏はまた、オープンソースの音声認識モデルの次期バージョンであるWhisper v3を発表し、近日中にAPIを追加する予定だと述べた。 このバージョンでは、複数の言語でのパフォーマンスが向上しており、開発者は本当に気に入るだろうと彼は考えています。
次に、カスタマイズの問題について議論しました。 数か月前にGPT 3.5がリリースされて以来、微調整機能はうまく機能しています。 本日より、16Kバージョンに拡張されます。 また、fine-tuningを積極的に利用しているユーザーには、GPT-4 Fine-Tuning Experiment Access Programへの応募を呼びかけています。 微調整 API は、まったく新しい知識分野を学習する場合でも、大量の独自のデータを扱う場合でも、さまざまなアプリケーションで比較的少ないデータでモデルのパフォーマンスを向上させるのに理想的です。
5回目のアップデートで、Altmanは「Custom Models」と呼ばれる新しいイニシアチブを発表し、OpenAIの研究者が同社と緊密に連携して、特定のユースケースに特化したカスタムモデルを構築するためのツールを使用する予定だ。 これには、モデルトレーニングプロセスの各ステップの変更、ドメイン固有の事前トレーニングの実行、強化学習のトレーニング後のプロセスのカスタマイズなどが含まれます。 彼は、最初は多くの企業と仕事をすることができず、少なくとも最初は多くの仕事であり、安くはないことを認めています。 しかし、現在の限界まで物事を押し上げようとしている企業がある場合は、彼らに手を差し伸べてください。
さらに、アルトマンはレート制限の引き上げを発表しました。 既存のすべてのGPT-4顧客の1分あたりのトークン数を2倍にし、より多くのことをより簡単に行えるようにし、APIアカウント設定で直接、レート制限とクォータの変更をリクエストできます。 これらのレート制限に加えて、Copyright Shieldも導入されており、顧客が著作権侵害の法的請求に直面した場合、OpenAIが介入して顧客を保護し、発生した費用を負担します。 これは、ChatGPT Enterprise と API の両方に適用されます。 彼は、API や ChatGPT Enterprise からのデータをトレーニングに使用しないことを全員に明確に思い出させています。
Altman氏は続けて、これまでのどの要求よりも大きな開発者の要求について話し、それは価格の問題だった。 彼は、GPT-4 TurboがGPT-4よりも賢いだけでなく、より安価であることを発表し、トークンの3倍の削減と完了トークンの2倍の削減を促しました。 新しい価格は、プロンプト トークン 1,000 個あたり $0.01、完了トークン 1,000 個あたり $0.03 です。 これにより、GPT-4 Turboの複合レートはGPT-4の2.75倍以上安くなります。 彼らはこれを達成するために一生懸命働いてきました、そして誰もがそれに興奮することを願っています。
価格の問題を優先すると決めた時点で、価格とスピードのどちらかを選ばなければならなかったが、次はスピードを上げることに取り組む。 また、GPT 3.5 Turbo 16Kの値下げを発表し、インプットトークンを3倍、アウトプットトークンを2倍に削減することで、GPT 3.516Kは以前のGPT 3.54Kモデルよりも安くなったことになります。 また、微調整されたGPT 3.5 Turbo 16Kバージョンは、従来の微調整された4Kバージョンよりも安価に動作するため、この変更がすべての人のフィードバックに対応することを期待しており、これらの改善をすべての人に提供できることを嬉しく思います。
そのすべてを紹介しながら、OpenAIはこれを可能にする上で重要な役割を果たすパートナーに恵まれていると述べました。 そこで彼は、マイクロソフトのCEOであるサティア・ナデラ氏を特別ゲストに迎えました。
Nadella 氏は、Altman 氏から Azure クレジットが利用できるかどうか尋ねられたときに OpenAI に初めて出会ったことを思い出し、それ以来、Azure クレジットは長い道のりを歩んできました。 彼は、OpenAIが魔法のようなものを構築したことを称賛し、パートナーシップに関するMicrosoftの2つの考えを共有しました。 まず、ワークロードは、電力からデータセンター、ラックやアクセラレーター、ネットワークまで、OpenAIが構築しているモデルをサポートするシステムを共同で構築します。 Microsoftの目標は、OpenAIが最高のモデルを構築し、開発者が利用できるように、最高のシステムを構築することです。 第二に、マイクロソフトは開発者であり、製品を構築しています。 Nadella 氏は、GitHub Copilot と GPT に初めて出会ったとき、ベース モデルの全世代に対する信念が完全に変わったと述べています。 彼らはOpenAIのAPIの上に製品を構築することに取り組んでおり、GitHub Copilot Enterpriseを出席したすべての参加者が利用できるようにして試してみたいと考えています。
アルトマン氏はまた、ナデラ氏にパートナーシップの未来とAIの未来についての考えを尋ねた。 Nadella氏は、MicrosoftがOpenAIのロードマップを大胆に前進させるのをサポートするために必要なシステムとコンピューティングリソースの提供に全力で取り組んでいることを強調しました。 彼らは、OpenAIが最先端をプッシュし続けることができるように、最高のトレーニングおよび推論システム、および最も多くのコンピューティングリソースを提供することに取り組んでいます。 ナデラは、AIの真の価値は人々に力を与える能力にあると信じており、これは地球上のすべての人とすべての組織がより多くのことを行えるようにするというOpenAIとMicrosoftの使命と一致しています。 同氏は、セキュリティは両国のコラボレーションにおける重要な焦点であり、後付けではなく、共同の取り組みの焦点であると述べました。 ナデラ氏の言葉は、OpenAIとマイクロソフトのパートナーシップの深さと目的を強調し、AIの成長と採用を促進するという両社の共通のビジョンを示しています。
その後、アルトマン氏はカンファレンスの話題に移り、開発者向けのカンファレンスではありましたが、ChatGPTにいくつかの改良を加えました。 現在、ChatGPT は GPT-4 Turbo と、最新の知識カットオフ時間を含むすべての最新の改善を使用しており、同じ日にすでに有効になっている更新が継続されます。 ChatGPT は、必要に応じて、Web の閲覧、コードの記述と実行、データの分析、画像の生成などを行えるようになりました。 また、モデルセレクタが非常に煩わしいため、削除されたというユーザーからのフィードバックも寄せられています。 今日から、ユーザーはドロップダウン メニューをクリックする必要がなくなり、ChatGPT はどの機能をいつ使用するかを自動的に認識します。
Altman氏は、価格は重要な問題ではあるが、開発者の要求の主旨ではないと指摘する。 彼らは、人々がより良いツールを与えられれば、驚くべきことを成し遂げると信じています。 人々は、AIがより賢く、よりパーソナライズされ、よりカスタマイズ可能で、ユーザーに代わってより多くのことができることを望んでいます。 最終的に、ユーザーはPCを要求するだけで、これらすべてのタスクが自動的に実行されます。 AIの分野では、これらの機能はしばしば「エージェント」と呼ばれます。 OpenAIは、AIのセキュリティに対処するために、段階的かつ反復的なデプロイが最善のアプローチであると考えており、この「エージェント」の将来に向けて慎重に動くことが特に重要であると考えています。 これには、多くの技術的作業と、社会の側での多くの思慮深さが必要になります。
そして、この未来への小さな一歩を踏み出したのです。 アルトマンは、特定の目的に合わせて調整されたChatGPTのバージョンであるGPTを導入することに興奮していました。 ChatGPT のカスタマイズ バージョンを、指示、拡張された知識、およびアクションを使用して構築し、他のユーザーが使用できるように公開できます。 指示、拡張された知識、およびアクションが組み合わされているため、より便利で、複数のコンテキストに適しており、より優れた制御を提供できます。
それらは、さまざまなタスクを簡単に達成したり、単にあなたにとってより楽しくしたりします。 ChatGPT で直接使用できます。 実際、GPTに話しかけることで、GPTを言語でプログラムすることができます。 ニーズに合わせて動作を簡単にカスタマイズできます。 これにより、それらを非常に簡単に構築でき、すべての人に力を与えることができます。
Altman氏はさらに、GPTとは何か、どのように使うか、どのように構築するかを示し、その後、GPTがどのように配布され、発見されるかについて話し合うと述べました。 次に、開発者向けに、これらのエージェントのようなエクスペリエンスを独自のアプリに組み込む方法を示します。
彼はいくつかの例を挙げた。 Code.orgのパートナーは、同校のコンピュータサイエンスカリキュラムの拡大に取り組んでおり、世界中の何千万人もの学生が利用するコースがあります。 Code.org は、教師が中学生により魅力的な体験を提供できるように、授業計画と GPT を開発しました。 例えば、先生がループを説明するクリエイティブな方法を求めた場合、その通りになりますが、この場合、ビデオゲームのキャラクターが繰り返しコインを拾う方法で説明し、8年生にとって非常に理解しやすいものです。 このGPTは、code.orgの広範なカリキュラムと専門知識を組み合わせて、教師がニーズに迅速かつ簡単に適応できるようにします。
次に、CanvaはGPTを構築し、必要なデザインを自然言語で記述することでデザイン作業を開始できます。 今日の午後に開催されるDev Dayのレセプションのポスターを作成し、詳細を記入すると、CanvaのAPIを呼び出して開始オプションが生成されます。
アルトマンは、この概念は一部の人に馴染みがあるかもしれないと指摘しています。 彼らはプラグインをGPTのカスタムアクションに開発しました。 このバージョンとチャットを続けてさまざまなイテレーションを確認したり、気に入ったものを見つけたらクリックしてCanvaに移動し、完全なデザイン体験を体験したりできます。
そして、GPTをライブで見せたいと考えました。 Zapier は、6000 のアプリでアクションを実行できる GPT を構築し、幅広い統合の可能性を解き放ちます。 Altman氏は、プレゼンテーションを担当するOpenAIのソリューションアーキテクトであるJessica氏を紹介した。
ソリューションアーキテクトのJessica Shei氏が登壇し、すぐにデモを開始し、Jessica氏はGPTがインターフェースの左上隅に配置されることを指摘し、Zapier AIアクションと呼ばれる例を示しました。 彼女はその日のカレンダーを披露し、GPTをカレンダーに接続したと述べました。
プレゼンテーション中、ジェシカはその日のスケジュールについて尋ねました。 同氏は、GPTはセキュリティを念頭に置いて構築されており、システムはアクションやデータを共有する前にユーザーの許可を求めることを強調しました。 彼女は GPT にスケジュールへのアクセスを許可し、GPT はユーザーから指示を受けて、適切なアクションを実行するためにどの関数を呼び出すかを決定するように設計されていると説明します。
次に、ジェシカはGPTがカレンダーに正常に接続され、イベント情報を抽出する方法を示しました。 彼女はまた、GPTにカレンダー上の競合をチェックするように指示し、競合の特定に成功したことを示しました。 次に、Sam という人物に早退する必要があることを知らせ、Sam との会話に切り替えて早退を依頼する方法を示します。
GPT がリクエストを完了すると、Jessica は Sam に通知を受け取ったかどうかを尋ね、Sam は受信を確認しました。 ジェシカはこれを例にGPTの可能性を説明し、他の人が何を作るかを見るのが楽しみだと表明しました。
その後、サムはGPTの例をさらに紹介しました。 彼は、デモされたものに加えて、作成中であり、まもなく作成されるであろう多くのGPTがあると述べました。 GPTを作りたいと思っている人の多くはプログラミングができないことに気づいたので、会話を通じてGPTをプログラムできるようにしました。 アルトマンは、自然言語が将来、人々がコンピュータをどのように使用するかの重要な部分になると考えており、これを興味深い初期の例と見なしています。
次に、Altman は GPT の構築方法を示します。 彼は、創業者や開発者が新しいプロジェクトを立ち上げる際にアドバイスを提供するのに役立つGPTを作りたいと考えていました。 彼はGPTビルダーに入り、彼が望むものを伝え、GPTは彼の説明に基づいて詳細な指示を作り始めます。 また、「Startup Mentor」という名前が付けられ、プレビューモードで情報と可能な質問の入力が開始されます。 アルトマン氏は、起業家精神に関する以前のスピーチの書き起こしをアップロードし、それに基づいてアドバイスを提供し、指令に「簡潔で建設的なフィードバック」を追加しました。
その後、Altman はこの GPT をプレビュー タグで試し、結果に満足しました。 とりあえず自分宛てに投稿して、後でさらに洗練させて共有できるようにすることにしました。 そんなロボットをつくりたいとずっと思っていたが、それが実現できてうれしいと話した。 アルトマン氏は、GPTを使用すると、ChatGPTで行っている興味深いことを簡単に共有し、発見できると強調しました。 ChatGPT Enterprise を使用している場合は、GPT を非公開で作成したり、リンクを介して公開して共有したり、会社のためだけに GPT を作成したりできます。 彼らは今月下旬にGPTストアを立ち上げる予定で、そこではGPTをリストアップすることができ、OpenAIは最高かつ最も人気のあるGPTを特集する予定だ。
Altman氏はまた、OpenAIが店舗のGPTが同社のポリシーに従うことを保証し、OpenAIは収益分配を重視し、最も有用で人気のあるGPTを構築した人々に収益の一部を支払うと述べました。 彼らは、GPTストアを通じて活気のあるエコシステムを育むことを楽しみにしており、より多くの情報が共有されることに興奮しています。
Altman氏はまた、このカンファレンスは、同じ概念をAPIに持ち込もうとする開発者のためのカンファレンスであることを強調した。 彼は、Shopify SidekickやDiscordのCollideなどのAPIや、グループチャットに追加してレコメンデーションを提供できるカスタムチャットボットである私のAIなど、多くの人がすでにプロキシのようなエクスペリエンスを構築していると述べました。 これらの経験は素晴らしいものですが、その構築はしばしば困難であり、時には数か月と数十人のエンジニアのチームが必要です。 このプロセスを簡素化するために、新しいアシスタンスAPIをリリースしました。
Assistance API には、永続スレッド、組み込みの取得コード インタープリター、動作する Python インタープリターとサンドボックス環境、および前述の改善された関数呼び出し機能が含まれています。
続いて、OpenAIの開発者エクスペリエンス責任者であるRaman氏が、これがどのように機能するかを示しました。 Ramon 氏は、多くの人が AI をアプリケーションに組み込んでいるのを見て勇気づけられたと言います。 Ramon氏は、APIに新しいパターンを導入するだけでなく、開発者のエクスペリエンスを改善して、人々がセカンダリエージェントを簡単に構築できるようにすることにも興奮していると発表した。 次に、ビルド プロセスを直接示します。
ラモンは、世界中の探検家のために「wanderlust」という旅行アプリを構築しています。 また、GPT-4で生み出された目的地のアイデアや、新しいDALL· E 3 API によってプログラムによって生成されたイラスト。 その後、Ramonは簡単なアシスタントを追加してアプリを強化する方法を示しました。 新しい支援ツールのプレイグラウンドに切り替え、アシスタントを作成し、名前を付け、初期指示を入力し、モデルを選択し、コードインタープリターと取得機能を有効にしてから保存します。
Ramon氏は続けて、アシスタントをアプリケーションに統合する方法を説明し、いくつかのコードを見て、新しいユーザーごとに新しいスレッドを作成し、それらのスレッドにメッセージを追加する方法を示した。 また、アシスタントをいつでも実行して、アプリケーションに応答を返す方法も示します。
次に、Ramon氏は、彼が特に気に入った機能である関数呼び出しを披露しました。 関数呼び出しで JSON 出力が保証され、複数の関数を同時に呼び出せるようになりました。 次に、アシスタントが右側のマップにラベルを含めるためのフィーチャを認識し、リアルタイムでマップにマーカーを追加する方法を実演しました。
Ramon 氏はまた、インスタント ユーザー メッセージングよりも多くの知識をアシスタントに提供するための取得機能についても説明しています。 PDF ファイルをアップロードし、システムによって読み取られ、画面に表示されます。 次に、Airbnb の予約情報も会話にドラッグ&ドロップします。
Ramon氏は、開発者は通常、埋め込みを計算し、チャンクアルゴリズムを設定する必要があり、これらすべてが新しいステートフルAPIによって処理されるようになったことを強調した。 また、開発者ダッシュボードでは、呼び出された関数やアップロードされた PDF ファイルなど、ツールによって実行された手順を確認できます。
Ramon氏は次に、多くの開発者が待ち望んでいた新機能、APIでも利用できるようになったコードインタプリタについて説明した。 これにより、AI はコードを記述して実行し、その場でファイルを生成することさえできます。 彼は、通貨換算と日数の計算を必要とする問題を言う場合に、コードインタプリタがどのように機能するかを示しています。 最後に、Ramon は、ユーザーとの会話の状態を管理し、知識検索やコード インタープリターなどの外部ツールを活用し、独自の関数を呼び出して機能を実装できるエージェントをすばやく作成する方法について概説します。
Ramon氏はまた、新しくリリースされたパターンと機能呼び出しを組み合わせた機能を導入し、Dev Day用のカスタムアシスタントを構築した。 さらに、彼はチャットインターフェイスの代わりに音声を使用することにしました。 彼は、マイク入力を受信し、バックグラウンドで何が起こっているかを端末ログに表示できるシンプルなSwiftアプリを示しました。 ウィスパーを使って音声入力をテキストに変換し、GPT-4 Turboのアシスタントを利用し、新しいTTS APIを使って音を鳴らしました。
Ramon は、アシスタントがインターネットに接続し、ユーザーに代わって実際のアクションを実行する方法も示します。 彼は、Dev Day の参加者を無作為に選んだ 5 人に 500 ドルの OpenAI クレジットを渡すことを提案し、アシスタントはタスクを無事に完了しました。
最後に、OpenAIのDeveloper Dayでの閉会の挨拶で、Sam Altman氏は、Assistive APIはベータテスト中であり、開発者がそれをどのように使用するかを見るのが楽しみであると述べました。 彼は、GPTと支援ツールは、ユーザーのためにより複雑なタスクを計画して実行できる、より複雑なエージェントへの道のパイオニアであることを強調しました。
Altman氏は、段階的な反復的な展開の重要性を繰り返し強調し、より能力が高まる将来の世界に適応するために、これらのエージェントを今すぐ使用し始めることを奨励しています。 同氏は、OpenAIは優れた人材密度を持っているが、これらすべてを達成するには多くの努力と調整が必要であると述べ、OpenAIがユーザーからのフィードバックに基づいてシステムを更新し続けることを保証しました。 彼は世界最高の同僚がいると感じており、彼らと一緒に仕事ができることに信じられないほど感謝しています。
OpenAIのチームが懸命に取り組んでいる理由は、AIがさまざまな方法で世界を変える技術的および社会的革命の一部になると信じているからです。 アルトマンは、より良いツールを人々に与えることで、世界を変えることができると以前に話し合ったと述べました。 彼は、AIが前例のない個人のエンパワーメントとエージェンシーの規模をもたらし、それによって人類を前例のないレベルに引き上げると信じています。 知性がよりユビキタスになるにつれて、私たちは皆、常に超能力を持っています。 彼は、皆さんがテクノロジーをどのように活用し、私たちが一緒に築き上げていく新しい未来を楽しみにしています。