もちろん、プロンプト ワードのプレーン テキストとコードの作成には本質的な違いはありません。コードを使用する目的は、トークンを節約し、出力をより安定して正確にすることです。中国語は依然としてより多くのトークンを使用するためです。 API を大規模に呼び出すと、コストが大幅に上昇する場合があります。プレーン テキスト プロンプトは非常に複雑になる場合もあります。たとえば、600 行を超えるテキスト プロンプトを見たことがありますが、それらは複数のモジュール グループで構成されています。
1コピーライティングの人気モデル (プレーンテキスト)
「エンジニアリング」(即時エンジニアリング)とは何なのか、簡単にご紹介します。通常、これは、AI がタスクをよりよく理解し、対応する回答を提供できるように、尋ねたい質問を特定の形式の入力に変換し、事前定義されたテンプレート、ルール、アルゴリズムを使用して処理することを意味します。 AI がタスクを最大限に正確に理解できるようにし、不明瞭な言語表現によって引き起こされる誤解やエラーを軽減し、特定のタスクを正確かつ確実に実行できるようにします。
このテキストの例に移りましょう。電子商取引ページ、小紅書によるコピーライティング、フォーラムへの投稿など、コピーライティングが必要な多くのシナリオでは、AI に直接書かせると効果が良くない可能性があります**が、これらの「5 つのステップ」を通じて、 make 出力品質が向上し、結果がより安定しました。 **
最初のステップ、あなたが良いと思うコピーライティングを AI に「フィード」します。AI がこのコピーライティングを学習できるようにするには、AI に次のように明確に言う必要があります。「次に、コピーライティングの調査結果をお送りします」の目的は、人気のあるモデルのコピーライティング モデルを作成することです。学習が完了したら、次のように答えるだけです。「学習しました。コピーライティングは次のとおりです。」
**第 2 ステップでは、AI が「学習しました」と返答した後、このコピーライティングの書き方を AI にモデル化させ始めます。
第 3 ステップ 一般に、現時点では AI はうまく要約できません。AI にさらに学習させて答えを変えさせる必要があります。この時点で、AI にフレームワークを与えることができます。もちろん、このステップは前のステップに直接統合することもできます。
この食事注文ロボットの例は、DeepLearning.ai コースからのものです。 DeepLearning.ai の創設者である Wu Enda は、OpenAI 開発者の Iza Fulford と協力して、開発者向けのエンジニアリング コースを立ち上げました。 Wu Enda は AI 分野のスター教授であり、スタンフォード大学のコンピュータ サイエンスおよび電気工学科の客員教授であり、かつてはスタンフォード人工知能研究所の所長を務めていました。
ChatGPT はチャット対話インターフェイスであり、レストランの AI カスタマー サービス エージェントや AI 注文者などの役割を備えたカスタム機能を備えたチャット ロボットを構築できます。
** 起業家精神/投資の観点から、アプリケーション層のチャンスがどこにあるかについて誰もが議論しています。私はよくこれらの人気のプロンプトワード Web サイトにアクセスして見ていますが、新しくリリースされた人気の Web サイトからアプリケーション シナリオの革新を見つけることができるかもしれません。言葉のインスピレーションを促します。どれだけ見たことがあっても、試してみる方が良いです。 **
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
AI をトレーニングして機能させるにはどうすればよいでしょうか?プロンプトワードの秘密 (_)
出典: マトリックスパートナーズ
少し前に、Zhang Ying は、Chaos Academy の AI カンファレンスで、AI のトレンドに関するいくつかの判断と AI 起業家精神に関する 7 つの提案を共有しました。
今日は「工学」について少しお話します。今年の初めに、次のようなさまざまな Midjourney 辞書がインターネット上で人気になりました。
きらびやかなネオンライト
高い角度から見た図 高い角度から見た図
未来的な研磨された表面
クラシックなスタイル、18 ~ 19 世紀のヴィンテージ
浮世絵 日本の伝統的な浮世絵
……
最近まで、偉大な神々は再び QR コードにいたずらをしており、スタイルや要素のプロンプトを書き込んだ後、いくつかのユニークな「AI アート QR コード」を生成することができました。
今日の記事では、2 つのケースから始めます。1 つ目はプレーン テキストの例であり、2 つ目はコードの実装が必要な例です。エンジニアリングの重要な原則とテクニックをいくつか紹介します。
もちろん、プロンプト ワードのプレーン テキストとコードの作成には本質的な違いはありません。コードを使用する目的は、トークンを節約し、出力をより安定して正確にすることです。中国語は依然としてより多くのトークンを使用するためです。 API を大規模に呼び出すと、コストが大幅に上昇する場合があります。プレーン テキスト プロンプトは非常に複雑になる場合もあります。たとえば、600 行を超えるテキスト プロンプトを見たことがありますが、それらは複数のモジュール グループで構成されています。
1コピーライティングの人気モデル (プレーンテキスト)
「エンジニアリング」(即時エンジニアリング)とは何なのか、簡単にご紹介します。通常、これは、AI がタスクをよりよく理解し、対応する回答を提供できるように、尋ねたい質問を特定の形式の入力に変換し、事前定義されたテンプレート、ルール、アルゴリズムを使用して処理することを意味します。 AI がタスクを最大限に正確に理解できるようにし、不明瞭な言語表現によって引き起こされる誤解やエラーを軽減し、特定のタスクを正確かつ確実に実行できるようにします。
このテキストの例に移りましょう。電子商取引ページ、小紅書によるコピーライティング、フォーラムへの投稿など、コピーライティングが必要な多くのシナリオでは、AI に直接書かせると効果が良くない可能性があります**が、これらの「5 つのステップ」を通じて、 make 出力品質が向上し、結果がより安定しました。 **
最初のステップ、あなたが良いと思うコピーライティングを AI に「フィード」します。AI がこのコピーライティングを学習できるようにするには、AI に次のように明確に言う必要があります。「次に、コピーライティングの調査結果をお送りします」の目的は、人気のあるモデルのコピーライティング モデルを作成することです。学習が完了したら、次のように答えるだけです。「学習しました。コピーライティングは次のとおりです。」
**また、AI にもっと創造的に書くよう依頼したり、ニーズに適した初期コピーを AI に「フィード」するなど、このモデルの微調整を続けることもできます。また、このトレーニングのアイデアとフレームワークを使用して、より適切なトレーニングを行うこともできます。あなたのための記事モデル。 **
最後に、このトレーニング モデルのリンクは次のとおりです。興味のある友人は試してみてください。
このトレーニングのアイデアに基づいて、ネチズンは多くの興味深いシナリオも開発しました。次のことを試すことができます。
2** 注文ロボット モデル (コードによって実装)**
ChatGPT を使用して食事注文ロボットを構築するにはどうすればよいですか?私たちはエンジニアリングを通じてそれを実現できます。
この食事注文ロボットの例は、DeepLearning.ai コースからのものです。 DeepLearning.ai の創設者である Wu Enda は、OpenAI 開発者の Iza Fulford と協力して、開発者向けのエンジニアリング コースを立ち上げました。 Wu Enda は AI 分野のスター教授であり、スタンフォード大学のコンピュータ サイエンスおよび電気工学科の客員教授であり、かつてはスタンフォード人工知能研究所の所長を務めていました。
ただし、これは商用シナリオであるため、ChatGPT からの正確で安定した応答が必要です。現時点では、プレーン テキストよりもコンピューター言語を使用する方が適切であるため、最初に OpenAI Python パッケージをデプロイする必要があります。
**この注文ロボットの適用シナリオはピザ屋で、最初に顧客に挨拶し、次に注文を受け取り、引き取りか配送が必要かを尋ねる機能が実現されます。 **配達の場合、注文ボットは住所を尋ねることができます。最後に、注文ボットが支払いを受け取ります。
実際の会話では、注文ロボットはユーザーの入力とシステムの指示に従って応答を生成します。
ユーザーが言う:「こんにちは、ピザを注文したいのですが」
注文ボットは次のように応答します。「わかりました。どのような種類のピザを注文しますか? ペパロニ、チーズ、ナスのピザがあります。価格はいくらですか?」
会話全体を通じて、注文ロボットはユーザーの入力とシステムの指示に基づいて応答を生成し、会話をより自然かつスムーズにすると同時に、明らかなプロンプト情報が会話に挿入されることを避けます。
まず、ユーザー メッセージを収集して手動で入力する手間を省く「ヘルパー関数」を定義します。この関数は UI からヒントを収集し、コンテキストと呼ばれるリストに追加します。コンテキストは、システム情報やメニューなどのモデルを毎回呼び出すために使用されます。
プロンプトワードにはすでに価格が含まれているため、ここに直接リストされます。ユーザーは次のように答えるかもしれません: 私は中くらいのナスのピザが好きです。そのため、ユーザーと注文ロボットは、配達したいかどうか、追加の材料が必要かどうか、他のもの (水? それともチップス?) が必要かどうかを再確認するなど、この会話を永遠に続けることができます。
最後に、注文ボットに、注文システムに送信できる会話ベースの概要を作成するように依頼します。
この記事はコードだらけではないので、携帯電話で密集したコードを見るのは嫌だと思いますので、ここでは要点のみを記載します。さらに詳しく知りたい場合は、次の詳細な説明ビデオをご覧ください。
##3 いくつかの重要な原則とテクニック
最後に、大規模言語モデルの 2 つの重要な原則と現在の制限を要約しましょう。大規模言語モデルの機能の現在の下限がどこにあるのかを知る必要があります。これは、特定のアプリケーション シナリオを見つけるのに役立ちます。
**2 つの原則は、明確で具体的な指示を書き、モデルに考えるための十分な時間を与えることです。 **
この原則は、ChatGPT などの言語モデルを使用する場合は、明確かつ具体的な指示を与える必要があることを強調しています。明確さは短いという意味ではありません。プロンプトの単語が短すぎると、モデルが推測に陥ることがよくあります。この原則に基づく具体的な戦略は 4 つあります。
**1) 入力のさまざまな部分を明確に区切るには、区切り文字を使用します。 **
区切り文字には、バッククォートや引用符などを使用できます。中心的な考え方は、入力のさまざまな部分を明確に識別することであり、これにより、モデルが出力を理解して処理するのに役立ちます。区切り文字は、これが独立した部分であることをモデルに明確に知らせることで、「ヒントの挿入」を効果的に回避できます。いわゆるプロンプト インジェクションとは、一部のユーザーが新しい入力を追加したときに誤って生成され、不正確な結果が生じる可能性があるいくつかの矛盾する命令を指します。
プロンプト ワードで次のことを指定できます。 書籍 ID、タイトル、著者、ジャンルの形式で指定された 3 つの架空の本のタイトルとその著者およびジャンルを生成します。
タスクに前提条件があり、これらの条件が必ずしも満たされるわけではない場合、最初にこれらの前提条件をチェックし、満たされていないかどうかを示し、予期せぬ間違った結果を避けるためにタスクの直接フィードバックを停止するようにモデルに指示できます。
次の例のように、お茶の淹れ方を説明した段落をコピーしてから、テキストに一連の指示が含まれている場合は、その指示を次の形式で書き換えてくださいというプロンプトをコピーし、その後に次の手順を続けます。 - ステップごとの説明。テキストに一連の指示が含まれていない場合は、単に「手順は提供されていません」と記入してください。
この戦略は単純ですが重要です。つまり、プロンプトの単語に正しい例を含めることができます。たとえば、モデルに一貫した口調で答えるように求めます。入力タスクは「一貫したスタイルで質問に答える」です。次に、子供と祖父の間の会話の例を示します。子供はこう言いました。「教えてください」忍耐は」と祖父は例えで答えます。
ここで、次の質問が「回復力とは何かを教えてください」である場合、モデルに一貫した口調で答えるように依頼します。モデルにはすでにこのいくつかの例があるため、次のタスクにも同様の口調で答えます。「復元力は、風で曲がることはあっても折れない木のようなものです。」と答えます。
**原則 2: モデルに考えるのに十分な時間を与えます。 **
モデルが間違った結論を導き出そうとするために推論エラーを犯した場合、プロンプトの言葉を再構築しようとする必要があります。中心的なアイデアは、最終的な答えを提供する前に、モデルに一連の関連する推論を実行させることです。この原則に基づいて 2 つの戦略があります。
タスクを完了するために必要な手順を明示的に記述すると、モデルがタスクをより深く理解し、より正確な出力を生成するのに役立ちます。
2) モデルに (結論を急ぐ前に) 独自の解決策を定式化するように指示します。
結論に達する前にモデル自身で解決策を推論するように明示的に指示すると、モデルがタスクをより正確に完了するのに役立ちます。
**追加の議論: モデルの制限をどのように見るか? **
現在、大規模言語モデルの商用化における最大の問題は「幻想」です。なぜなら、大規模なモデルはトレーニング プロセス中に大量の知識にさらされることになりますが、見た情報を完全に記憶しているわけではなく、知識の境界がどこにあるのかが明確ではないからです。これは、大きなモデルがすべての質問に答えようとして、もっともらしく聞こえるが実際はそうではないことをでっち上げてしまう可能性があることを意味します。
幻覚を減らす戦略は、まず大規模言語モデルにテキストからすべての関連部分を見つけるように依頼し、次にそれらの引用を使用して質問に答えるように依頼し、その回答をソース文書まで追跡することです。この戦略により、幻覚の発生を減らすことができます。幻覚の。
GPT-3.5 や GPT-4 のような大きな言語モデルはすべてを理解しますが、範囲が広すぎるため、ヒントを与えないと、得られる答えは車の車輪にすぎないことがよくあります。
このときの(プロンプト)の重要性は自明の理であり、単なる単語や単純な文ではなく、より複雑な機能を実現したい場合は、より複雑なプロンプト単語も必要になります。
また、全員でブレインストーミングを行って、より斬新な、またはより適切なゲームプレイを考案する必要があり、その「独占性」も非常に強いです。たとえば、前回受賞した「スペース オペラ ハウス」では、著者はこの作品を思いつくまでに 80 時間以上、900 回以上の反復を費やしたと主張し、ミッドジャーニーがこれまでに使用した動機について共有することを拒否しました。
今すぐゼロから始める必要はありません。国内外に多くの優れたコミュニティがあり、誰もがプロンプト ワードの使用に関する経験を交換しており、現在人気のあるプロンプト ワードのリストも提供しています。記事の終わり。
** 起業家精神/投資の観点から、アプリケーション層のチャンスがどこにあるかについて誰もが議論しています。私はよくこれらの人気のプロンプトワード Web サイトにアクセスして見ていますが、新しくリリースされた人気の Web サイトからアプリケーション シナリオの革新を見つけることができるかもしれません。言葉のインスピレーションを促します。どれだけ見たことがあっても、試してみる方が良いです。 **
補遺: いくつかのプロンプトワードディスカッションサイト
(人気順にソートでき、あらゆるシーンを網羅した海外の人気プロンプトワードサイト)
(Reddit の Writings サブレディットは、ユーザーが投稿し、さまざまな書き込みプロンプトに応答する非常に活発なコミュニティです。)
(ワークフローを強化する 100 のベスト ChatGPT プロンプト ワード。)
(人気順に並び替えることができ、ライティング、プログラミングから金融、医療など、対象となるシナリオが非常に充実しています)
(Xiaohongshu のコピーライティングは最高ランクにあり、プロンプトの言葉がより直感的に表示されます。)