AI をトレーニングして機能させるにはどうすればよいでしょうか?プロンプトワードの秘密 (_)

出典: マトリックスパートナーズ

画像の出典: Unbounded AI ツールによって生成

少し前に、Zhang Ying は、Chaos Academy の AI カンファレンスで、AI のトレンドに関するいくつかの判断と AI 起業家精神に関する 7 つの提案を共有しました。

  • 「誰もが AI の学習と応用に注意を払う必要があります。効果的な反復が何よりも重要です。重要な点は、即効性のある言葉を書く方法を学ぶことです。質問の仕方を知ることは非常に重要です。AI とより良く対話する方法科学でもあります。」 *

今日は「工学」について少しお話します。今年の初めに、次のようなさまざまな Midjourney 辞書がインターネット上で人気になりました。

きらびやかなネオンライト

高い角度から見た図 高い角度から見た図

未来的な研磨された表面

クラシックなスタイル、18 ~ 19 世紀のヴィンテージ

浮世絵 日本の伝統的な浮世絵

……

最近まで、偉大な神々は再び QR コードにいたずらをしており、スタイルや要素のプロンプトを書き込んだ後、いくつかのユニークな「AI アート QR コード」を生成することができました。

**大規模な言語モデルを使用できるかどうかは、プロンプトの単語の質に大きく依存することはわかっていますが、プロンプトの単語を単純なものとして考えないでください。質問するときに単に単語や文をいくつか追加するだけではありません。単語は次のとおりです。非常に単純ですが、エンジニアリング(即時エンジニアリング)と呼ばれる理由は、複雑なエンジニアリングの実践が多いためです。 **

今日の記事では、2 つのケースから始めます。1 つ目はプレーン テキストの例であり、2 つ目はコードの実装が必要な例です。エンジニアリングの重要な原則とテクニックをいくつか紹介します。

  • **最初のケースは、一部の AI コミュニティで非常に人気のある「ホット スタイル コピーライティング モデル」で、主にプレーン テキストを使用して AI のテンプレートとルール プロンプトを作成します。 **
  • **2番目の事例は、Ng EndaとOpenAIが正式に協力したChatGPTプロンプトエンジニアリングコースにおける「食品注文ロボット」の例です。 **
  • **最後に、基本的な原則とテクニックをいくつかまとめてみましょう。 **

もちろん、プロンプト ワードのプレーン テキストとコードの作成には本質的な違いはありません。コードを使用する目的は、トークンを節約し、出力をより安定して正確にすることです。中国語は依然としてより多くのトークンを使用するためです。 API を大規模に呼び出すと、コストが大幅に上昇する場合があります。プレーン テキスト プロンプトは非常に複雑になる場合もあります。たとえば、600 行を超えるテキスト プロンプトを見たことがありますが、それらは複数のモジュール グループで構成されています。

1コピーライティングの人気モデル (プレーンテキスト)

「エンジニアリング」(即時エンジニアリング)とは何なのか、簡単にご紹介します。通常、これは、AI がタスクをよりよく理解し、対応する回答を提供できるように、尋ねたい質問を特定の形式の入力に変換し、事前定義されたテンプレート、ルール、アルゴリズムを使用して処理することを意味します。 AI がタスクを最大限に正確に理解できるようにし、不明瞭な言語表現によって引き起こされる誤解やエラーを軽減し、特定のタスクを正確かつ確実に実行できるようにします。

このテキストの例に移りましょう。電子商取引ページ、小紅書によるコピーライティング、フォーラムへの投稿など、コピーライティングが必要な多くのシナリオでは、AI に直接書かせると効果が良くない可能性があります**が、これらの「5 つのステップ」を通じて、 make 出力品質が向上し、結果がより安定しました。 **

最初のステップ、あなたが良いと思うコピーライティングを AI に「フィード」します。AI がこのコピーライティングを学習できるようにするには、AI に次のように明確に言う必要があります。「次に、コピーライティングの調査結果をお送りします」の目的は、人気のあるモデルのコピーライティング モデルを作成することです。学習が完了したら、次のように答えるだけです。「学習しました。コピーライティングは次のとおりです。」

**第 2 ステップでは、AI が「学習しました」と返答した後、このコピーライティングの書き方を AI にモデル化させ始めます。

第 3 ステップ 一般に、現時点では AI はうまく要約できません。AI にさらに学習させて答えを変えさせる必要があります。この時点で、AI にフレームワークを与えることができます。もちろん、このステップは前のステップに直接統合することもできます。

第 4 ステップでは、AI に各パーツに重みを割り当てます。

ステップ 5、 AI がすぐに呼び出せるように、このテンプレートに名前を付けます。

以下にいくつかの応用例を示します。

比較的フォーマットされており、高い創造性を必要としない多くのコピーライティング分野では、AI のコンテンツはベースラインを超えており、残りは手動で変更できます。

**また、AI にもっと創造的に書くよう依頼したり、ニーズに適した初期コピーを AI に「フィード」するなど、このモデルの微調整を続けることもできます。また、このトレーニングのアイデアとフレームワークを使用して、より適切なトレーニングを行うこともできます。あなたのための記事モデル。 **

最後に、このトレーニング モデルのリンクは次のとおりです。興味のある友人は試してみてください。

このトレーニングのアイデアに基づいて、ネチズンは多くの興味深いシナリオも開発しました。次のことを試すことができます。

2** 注文ロボット モデル (コードによって実装)**

ChatGPT を使用して食事注文ロボットを構築するにはどうすればよいですか?私たちはエンジニアリングを通じてそれを実現できます。

この食事注文ロボットの例は、DeepLearning.ai コースからのものです。 DeepLearning.ai の創設者である Wu Enda は、OpenAI 開発者の Iza Fulford と協力して、開発者向けのエンジニアリング コースを立ち上げました。 Wu Enda は AI 分野のスター教授であり、スタンフォード大学のコンピュータ サイエンスおよび電気工学科の客員教授であり、かつてはスタンフォード人工知能研究所の所長を務めていました。

ChatGPT はチャット対話インターフェイスであり、レストランの AI カスタマー サービス エージェントや AI 注文者などの役割を備えたカスタム機能を備えたチャット ロボットを構築できます。

ただし、これは商用シナリオであるため、ChatGPT からの正確で安定した応答が必要です。現時点では、プレーン テキストよりもコンピューター言語を使用する方が適切であるため、最初に OpenAI Python パッケージをデプロイする必要があります。

このカスタム チャットボット モデルでは、基本的に、一連のメッセージを入力として受け取り、モデルによって生成されたメッセージを出力するボットをトレーニングしています。この例では GPT-3.5 が使用されていますが、GPT-4 は高価すぎるため、現段階では商用利用には 3.5 の方が適している可能性があります。

**この注文ロボットの適用シナリオはピザ屋で、最初に顧客に挨拶し、次に注文を受け取り、引き取りか配送が必要かを尋ねる機能が実現されます。 **配達の場合、注文ボットは住所を尋ねることができます。最後に、注文ボットが支払いを受け取ります。

実際の会話では、注文ロボットはユーザーの入力とシステムの指示に従って応答を生成します。

ユーザーが言う:「こんにちは、ピザを注文したいのですが」

注文ボットは次のように応答します。「わかりました。どのような種類のピザを注文しますか? ペパロニ、チーズ、ナスのピザがあります。価格はいくらですか?」

会話全体を通じて、注文ロボットはユーザーの入力とシステムの指示に基づいて応答を生成し、会話をより自然かつスムーズにすると同時に、明らかなプロンプト情報が会話に挿入されることを避けます。

まず、ユーザー メッセージを収集して手動で入力する手間を省く「ヘルパー関数」を定義します。この関数は UI からヒントを収集し、コンテキストと呼ばれるリストに追加します。コンテキストは、システム情報やメニューなどのモデルを毎回呼び出すために使用されます。

ChatGPT フィードバックとユーザー フィードバックがコンテキストに追加され、このコンテキストはますます長くなります。そうすることで、ChatGPT は次に何をするかを決定するために必要な情報をすべて入手できます。コンテキストによって展開されるプロンプト ワードは次のとおりです。「あなたは、ピザ屋から注文を集める自動サービスである注文ボットです。最初に顧客に挨拶し、次に注文を受け取り、受け取りたいか配達したいかを尋ねます。」 (詳しくは下の画像をご覧ください)

実際に機能した場合は、次のようになります。ユーザーは「こんにちは、ピザを注文したいのですが」と言います。次に、注文ボットは「それでは、どのような種類のピザを注文しますか? ペパロニ、チーズ、ナスのピザがありますが、どれくらいかかりますか?」と言いました。

プロンプトワードにはすでに価格が含まれているため、ここに直接リストされます。ユーザーは次のように答えるかもしれません: 私は中くらいのナスのピザが好きです。そのため、ユーザーと注文ロボットは、配達したいかどうか、追加の材料が必要かどうか、他のもの (水? それともチップス?) が必要かどうかを再確認するなど、この会話を永遠に続けることができます。

最後に、注文ボットに、注文システムに送信できる会話ベースの概要を作成するように依頼します。

最後の出力リンクの出力には、製品カテゴリ (ピザ、食材、ドリンク、スナックなど)、タイプ、サイズ、価格、配送が必要かどうか、および住所が含まれます。結果を完全に安定させ、創造性を持たずに予測できるようにしたいため、温度を 0 に設定します。最終的に、そのような結果は注文システムに直接送信できます。

この記事はコードだらけではないので、携帯電話で密集したコードを見るのは嫌だと思いますので、ここでは要点のみを記載します。さらに詳しく知りたい場合は、次の詳細な説明ビデオをご覧ください。

##3 いくつかの重要な原則とテクニック

最後に、大規模言語モデルの 2 つの重要な原則と現在の制限を要約しましょう。大規模言語モデルの機能の現在の下限がどこにあるのかを知る必要があります。これは、特定のアプリケーション シナリオを見つけるのに役立ちます。

**2 つの原則は、明確で具体的な指示を書き、モデルに考えるための十分な時間を与えることです。 **

**原則 1: 明確で具体的な指示を書きます。 **

この原則は、ChatGPT などの言語モデルを使用する場合は、明確かつ具体的な指示を与える必要があることを強調しています。明確さは短いという意味ではありません。プロンプトの単語が短すぎると、モデルが推測に陥ることがよくあります。この原則に基づく具体的な戦略は 4 つあります。

**1) 入力のさまざまな部分を明確に区切るには、区切り文字を使用します。 **

区切り文字には、バッククォートや引用符などを使用できます。中心的な考え方は、入力のさまざまな部分を明確に識別することであり、これにより、モデルが出力を理解して処理するのに役立ちます。区切り文字は、これが独立した部分であることをモデルに明確に知らせることで、「ヒントの挿入」を効果的に回避できます。いわゆるプロンプト インジェクションとは、一部のユーザーが新しい入力を追加したときに誤って生成され、不正確な結果が生じる可能性があるいくつかの矛盾する命令を指します。

**2) 構造化出力のリクエスト: モデル出力の解析を容易にするために、構造化出力をリクエストできます。 **

プロンプト ワードで次のことを指定できます。 書籍 ID、タイトル、著者、ジャンルの形式で指定された 3 つの架空の本のタイトルとその著者およびジャンルを生成します。

**3) モデルに条件が満たされているかどうかを確認してもらいます。 **

タスクに前提条件があり、これらの条件が必ずしも満たされるわけではない場合、最初にこれらの前提条件をチェックし、満たされていないかどうかを示し、予期せぬ間違った結果を避けるためにタスクの直接フィードバックを停止するようにモデルに指示できます。

次の例のように、お茶の淹れ方を説明した段落をコピーしてから、テキストに一連の指示が含まれている場合は、その指示を次の形式で書き換えてくださいというプロンプトをコピーし、その後に次の手順を続けます。 - ステップごとの説明。テキストに一連の指示が含まれていない場合は、単に「手順は提供されていません」と記入してください。

**4) ミニバッチのヒント: モデルに実際のタスクの完了を要求する前に、タスクの実行の成功例を提供します。 **

この戦略は単純ですが重要です。つまり、プロンプトの単語に正しい例を含めることができます。たとえば、モデルに一貫した口調で答えるように求めます。入力タスクは「一貫したスタイルで質問に答える」です。次に、子供と祖父の間の会話の例を示します。子供はこう言いました。「教えてください」忍耐は」と祖父は例えで答えます。

ここで、次の質問が「回復力とは何かを教えてください」である場合、モデルに一貫した口調で答えるように依頼します。モデルにはすでにこのいくつかの例があるため、次のタスクにも同様の口調で答えます。「復元力は、風で曲がることはあっても折れない木のようなものです。」と答えます。

**原則 2: モデルに考えるのに十分な時間を与えます。 **

モデルが間違った結論を導き出そうとするために推論エラーを犯した場合、プロンプトの言葉を再構築しようとする必要があります。中心的なアイデアは、最終的な答えを提供する前に、モデルに一連の関連する推論を実行させることです。この原則に基づいて 2 つの戦略があります。

1) タスクを完了する手順を指定します:

タスクを完了するために必要な手順を明示的に記述すると、モデルがタスクをより深く理解し、より正確な出力を生成するのに役立ちます。

2) モデルに (結論を急ぐ前に) 独自の解決策を定式化するように指示します。

結論に達する前にモデル自身で解決策を推論するように明示的に指示すると、モデルがタスクをより正確に完了するのに役立ちます。

**追加の議論: モデルの制限をどのように見るか? **

現在、大規模言語モデルの商用化における最大の問題は「幻想」です。なぜなら、大規模なモデルはトレーニング プロセス中に大量の知識にさらされることになりますが、見た情報を完全に記憶しているわけではなく、知識の境界がどこにあるのかが明確ではないからです。これは、大きなモデルがすべての質問に答えようとして、もっともらしく聞こえるが実際はそうではないことをでっち上げてしまう可能性があることを意味します。

幻覚を減らす戦略は、まず大規模言語モデルにテキストからすべての関連部分を見つけるように依頼し、次にそれらの引用を使用して質問に答えるように依頼し、その回答をソース文書まで追跡することです。この戦略により、幻覚の発生を減らすことができます。幻覚の。

今日の記事はより実践的なもので、2 つのケース (プレーン テキストとプログラミング) を通して、エンジニアリング (即時エンジニアリング) の詳細な応用例を説明します。

GPT-3.5 や GPT-4 のような大きな言語モデルはすべてを理解しますが、範囲が広すぎるため、ヒントを与えないと、得られる答えは車の車輪にすぎないことがよくあります。

このときの(プロンプト)の重要性は自明の理であり、単なる単語や単純な文ではなく、より複雑な機能を実現したい場合は、より複雑なプロンプト単語も必要になります。

また、全員でブレインストーミングを行って、より斬新な、またはより適切なゲームプレイを考案する必要があり、その「独占性」も非常に強いです。たとえば、前回受賞した「スペース オペラ ハウス」では、著者はこの作品を思いつくまでに 80 時間以上、900 回以上の反復を費やしたと主張し、ミッドジャーニーがこれまでに使用した動機について共有することを拒否しました。

** もちろん、それ自体は段階的な要求にすぎない可能性がありますが、サム アルトマンはかつてこう言いました: AI は自ら学習する能力を持つようになるため、5 年後にはエンジニアの職に就くよう促す必要はなくなるかもしれません。しかし、この「段階的な需要」が、AI がビジネスのあらゆる側面に本格的に参入するのに役立つ重要な武器であることは否定できません。 **

今すぐゼロから始める必要はありません。国内外に多くの優れたコミュニティがあり、誰もがプロンプト ワードの使用に関する経験を交換しており、現在人気のあるプロンプト ワードのリストも提供しています。記事の終わり。

** 起業家精神/投資の観点から、アプリケーション層のチャンスがどこにあるかについて誰もが議論しています。私はよくこれらの人気のプロンプトワード Web サイトにアクセスして見ていますが、新しくリリースされた人気の Web サイトからアプリケーション シナリオの革新を見つけることができるかもしれません。言葉のインスピレーションを促します。どれだけ見たことがあっても、試してみる方が良いです。 **

補遺: いくつかのプロンプトワードディスカッションサイト

  1. AI のコミュニティ:

(人気順にソートでき、あらゆるシーンを網羅した海外の人気プロンプトワードサイト)

2、 Reddit への書き込み (r/Writings):

(Reddit の Writings サブレディットは、ユーザーが投稿し、さまざまな書き込みプロンプトに応答する非常に活発なコミュニティです。)

3. 最高のプロンプトワード 100 をリストアップ

(ワークフローを強化する 100 のベスト ChatGPT プロンプト ワード。)

4. 中国語プロンプトワード Web サイト:

(人気順に並び替えることができ、ライティング、プログラミングから金融、医療など、対象となるシナリオが非常に充実しています)

5. 別の中国語プロンプト単語 Web サイト: Tip Wizard

(Xiaohongshu のコピーライティングは最高ランクにあり、プロンプトの言葉がより直感的に表示されます。)

原文表示
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)