Comment entraîner l'IA à travailler pour vous ? Le secret du mot prompt (_)

Question

Source : Partenaires matriciels![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-0bf6efba27-dd1a6f-7649e1) *Source de l'image : générée par l'outil d'IA illimitée*Il y a quelque temps, Zhang Ying a partagé quelques jugements sur les tendances de l'IA et 7 suggestions pour l'entrepreneuriat en IA lors de la Conférence sur l'IA de la Chaos Academy. Il a mentionné dans la première suggestion :* "Tout le monde doit faire attention à l'apprentissage et à l'application de l'IA. Une itération efficace est plus importante que toute autre chose. Un point clé est d'apprendre à écrire des mots rapides. Savoir comment poser des questions est très important. Comment mieux interagir avec l'IA est aussi une science." *Aujourd'hui, nous allons parler un peu de "l'ingénierie". Au début de l'année, divers dictionnaires Midjourney sont devenus populaires sur Internet, tels que :néons scintillantsvue en plongée vue en plongéesurfaces polies futuristesStyle classique, XVIIIe-XIXe siècle VintageUkiyo-e ukiyoe japonais traditionnel……Jusqu'à récemment, les grands dieux ont encore joué des tours au code QR. Après avoir écrit les mots rapides du style et des éléments, ils peuvent produire des "codes QR d'art IA" uniques :![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-b6d914ffa0-dd1a6f-7649e1)  ![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-1d573ebde3-dd1a6f-7649e1) **Nous savons que la possibilité d'utiliser un grand modèle de langage dépend en grande partie de la qualité de vos mots rapides, mais ne considérez pas les mots rapides comme simples, il ne s'agit pas seulement de quelques mots ou phrases de plus lorsque vous posez des questions. Les mots sont si simple, la raison pour laquelle on l'appelle Ingénierie (ingénierie rapide) est qu'il existe de nombreuses pratiques d'ingénierie compliquées. **Dans l'article d'aujourd'hui, nous commençons par deux cas, **le premier est un exemple de texte brut, et le second est un exemple qui nécessite du code pour être implémenté,** pour introduire quelques principes et techniques importants de l'ingénierie :* **Le premier cas est le "modèle de rédaction de style chaud" qui est très populaire dans certaines communautés d'IA. Il utilise principalement du texte brut pour écrire des modèles et des invites de règles pour l'IA. *** ** Le deuxième cas est un exemple de "robot de commande de nourriture" dans le cours d'ingénierie rapide ChatGPT avec lequel Ng Enda et OpenAI ont officiellement coopéré. *** **Enfin, résumons quelques principes et techniques de base. **Bien sûr, il n'y a pas de différence essentielle entre le texte brut du mot d'invite et le code d'écriture. Le but de l'utilisation du code est d'économiser des jetons et de rendre la sortie plus stable et précise, car le chinois prendra encore plus de jetons. pour appeler des API à grande échelle Parfois, le coût augmentera fortement. Les invites de texte brut peuvent également être très complexes.Par exemple, j'ai vu plus de 600 lignes d'invites de texte, et elles sont composées de plusieurs groupes de modules.## 1**Un modèle populaire de rédaction (texte brut)**Introduisons brièvement ce qu'est "l'ingénierie" (ingénierie rapide) ? Habituellement, cela signifie convertir les questions que vous souhaitez poser en entrée dans un format spécifique et utiliser des modèles, des règles et des algorithmes prédéfinis pour le traitement, afin que l'IA puisse mieux comprendre la tâche et donner les réponses correspondantes. Permettez à l'IA de comprendre avec précision les tâches au maximum, réduisez les malentendus et les erreurs causés par des expressions linguistiques peu claires et permettez-lui d'effectuer des tâches spécifiques avec précision et fiabilité.Passons à cet exemple de texte. Dans de nombreux scénarios nécessitant une rédaction, tels que les pages de commerce électronique, la rédaction de Xiaohongshu, les messages de forum, etc., si vous laissez directement l'IA écrire, l'effet peut ne pas être bon, ** mais à travers ces "cinq étapes", vous pouvez Faire une qualité de sortie améliorée et des résultats plus stables. ****La première étape**, "alimentez" le copywriting que vous pensez être bon pour l'IA, et pour qu'il soit clair pour l'IA d'apprendre ce copywriting, nous devons dire clairement à l'IA : "Ensuite, je vous enverrai une étude de copywriting , le but est Créer un modèle de rédaction pour les modèles populaires. Une fois que vous avez terminé l'apprentissage, il vous suffit de répondre : J'ai appris. La rédaction est la suivante : "![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-4bb91fabba-dd1a6f-7649e1) **La deuxième étape, après que l'IA ait répondu "Ai appris", nous allons commencer à laisser l'IA modéliser le style d'écriture de ce copywriting.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-10fc5a23e4-dd1a6f-7649e1) **La troisième étape,** De manière générale, l'IA ne résume pas bien pour le moment. Nous devons laisser l'IA apprendre davantage et modifier ses propres réponses. À ce stade, nous pouvons donner un cadre à l'IA. Bien entendu, cette étape peut également être directement intégrée à l'étape précédente.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-a00d670ac0-dd1a6f-7649e1) **La quatrième étape**, nous laissons l'IA attribuer des poids à chaque partie.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-f387dc1653-dd1a6f-7649e1) **Étape 5,** Nous nommons ce modèle afin que l'IA puisse l'appeler rapidement.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-edd6d52ea1-dd1a6f-7649e1) Voici quelques exemples d'applications :![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-370062da50-dd1a6f-7649e1)  ![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-0d821db3f1-dd1a6f-7649e1)  ![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-b658e3653b-dd1a6f-7649e1)  ![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-67bd32357c-dd1a6f-7649e1) Pour de nombreux champs de rédaction relativement formatés et ne nécessitant pas une grande créativité, le contenu de l'IA a dépassé la ligne de base et le reste peut être modifié manuellement.**Vous pouvez également continuer à affiner ce modèle, par exemple en demandant à l'IA d'écrire de manière plus créative ou en "alimentant" l'IA avec une copie initiale qui correspond mieux à vos besoins, et vous pouvez utiliser cette idée et ce cadre de formation pour former des personnes plus adaptées. pour votre modèle d'article. **Enfin, le lien de ce modèle de formation est le suivant, les amis intéressés peuvent essayer :Sur la base de cette idée de formation, les internautes ont également développé de nombreux scénarios intéressants, vous pouvez essayer :![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-ba14ae650c-dd1a6f-7649e1)  ![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-c677bdd328-dd1a6f-7649e1)  ![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-7fb0b3c224-dd1a6f-7649e1)## 2** Un modèle de robot de commande (implémenté par code)**Comment utiliser ChatGPT pour créer un robot de commande de repas ? Nous pouvons le faire grâce à l'ingénierie.Cet exemple de robot de commande de repas provient du cours DeepLearning.ai. Le fondateur de DeepLearning.ai, Wu Enda, s'est associé au développeur OpenAI Iza Fulford pour lancer un cours d'ingénierie pour les développeurs. Wu Enda est un professeur vedette dans le domaine de l'IA. Il est professeur invité au Département d'informatique et de génie électrique de l'Université de Stanford. Il a été directeur du Laboratoire d'intelligence artificielle de Stanford.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-a89b1b6a51-dd1a6f-7649e1) ChatGPT est une interface de dialogue de chat, à partir de laquelle nous pouvons créer un robot de chat avec des fonctions personnalisées, comme un agent de service client IA pour un restaurant, ou un commandeur IA et d'autres rôles.Mais comme il s'agit d'un scénario commercial, nous avons besoin de réponses précises et stables de ChatGPT. À l'heure actuelle, il est plus approprié d'utiliser un langage informatique que du texte brut, nous devons donc d'abord déployer le package OpenAI Python.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-d8ca7e3faf-dd1a6f-7649e1) Pour ce modèle de chatbot personnalisé, nous formons essentiellement un bot qui prend une série de messages en entrée et produit les messages générés par le modèle. Dans cet exemple, GPT-3.5 est utilisé, et 3.5 peut être plus adapté à une utilisation commerciale à ce stade, car GPT-4 est trop cher.** Le scénario d'application de ce robot de commande est une pizzeria. Les fonctions réalisées sont : d'abord accueillir les clients, puis collecter les commandes et demander s'ils doivent venir chercher ou livrer. **En cas de livraison, le bot de commande peut demander l'adresse. Enfin, le bot de commande collecte le paiement.**Dans la conversation réelle, le robot de commande générera une réponse en fonction de l'entrée de l'utilisateur et des instructions du système :***L'utilisateur dit : "Bonjour, j'aimerais commander une pizza"**Le bot de commande répondra : "Parfait, quel type de pizza souhaitez-vous commander ? Nous avons des pizzas au pepperoni, au fromage et aux aubergines, quels sont leurs prix"*Tout au long de la conversation, le robot de commande générera une réponse basée sur l'entrée de l'utilisateur et les instructions du système, afin de rendre la conversation plus naturelle et fluide, et en même temps d'éviter d'insérer des informations rapides évidentes dans la conversation.Tout d'abord, nous définissons une "fonction d'assistance" qui collecte les messages des utilisateurs pour nous éviter de les saisir manuellement. Cette fonction collectera des conseils de l'interface utilisateur et les ajoutera à une liste appelée contexte, qui est ensuite utilisée pour appeler le modèle à chaque fois, y compris les informations système et les menus.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-d7881bc1df-dd1a6f-7649e1)  ![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-e9dc10fe8f-dd1a6f-7649e1) Les commentaires ChatGPT et les commentaires des utilisateurs seront ajoutés au contexte, et ce contexte deviendra de plus en plus long. De cette façon, ChatGPT dispose de toutes les informations dont il a besoin pour décider quoi faire ensuite. Voici les mots rapides déployés par le contexte : "Vous êtes un bot de commande, un service automatisé qui collecte les commandes d'une pizzeria. Vous saluez d'abord le client, puis récupérez la commande et demandez si vous souhaitez venir chercher ou livrer." (Voir l'image ci-dessous pour plus de détails)![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-4f15ed2fb8-dd1a6f-7649e1) Si cela fonctionnait réellement, ce serait : l'utilisateur dit "Bonjour, j'aimerais commander une pizza". Ensuite, le bot de commande dit : "D'accord, quel type de pizza souhaitez-vous commander ? Nous avons des pizzas au pepperoni, au fromage et aux aubergines, combien coûtent-elles ?"Étant donné que le mot d'invite contient déjà le prix, il sera directement répertorié ici. L'utilisateur pourrait répondre : j'aime une pizza aux aubergines de taille moyenne. Ainsi, l'utilisateur et le robot de commande peuvent continuer cette conversation indéfiniment, y compris s'ils veulent livrer, s'ils ont besoin d'ingrédients supplémentaires et vérifier s'ils ont besoin d'autres choses (comme de l'eau ? Ou des chips ?)...Enfin, nous demandons au robot de commande de créer un résumé basé sur la conversation qui peut être envoyé au système de commande :![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-957b116ded-dd1a6f-7649e1)  ![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-feb6a51437-dd1a6f-7649e1) Dans le dernier lien de sortie, la sortie comprend : les catégories de produits (pizza, ingrédients, boissons, collations...), le type, la taille, le prix, si la livraison est requise et l'adresse. Puisque nous voulons que le résultat soit complètement stable et prévisible sans aucune créativité, nous allons régler la température sur 0. Au final, ces résultats peuvent être directement soumis au système de commande.Étant donné que cet article n'est pas rempli de codes, je pense que vous n'êtes pas disposé à voir des codes denses sur votre téléphone portable, nous ne mettons donc ici que les points principaux. Si vous voulez en savoir plus, vous pouvez regarder cette vidéo d'instruction détaillée :## 3 **Quelques principes et techniques clés**Enfin, résumons les deux principes clés et les limites actuelles des grands modèles de langage. Vous devez savoir où se situe la limite inférieure actuelle des capacités des grands modèles de langage, ce qui est plus utile pour trouver des scénarios d'application spécifiques.**Les deux principes sont les suivants : rédiger des instructions claires et précises et donner au modèle suffisamment de temps pour réfléchir. **![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-7274182a7c-dd1a6f-7649e1) **Principe 1 : Rédigez des instructions claires et précises. **Ce principe souligne que lors de l'utilisation de modèles de langage tels que ChatGPT, des instructions claires et spécifiques doivent être données. Clarté ne signifie pas brièveté. Des mots d'invite trop courts font souvent tomber le modèle dans des conjectures. Il existe 4 stratégies spécifiques sous ce principe :**1) Utilisez des délimiteurs pour délimiter clairement les différentes parties de l'entrée. **Les délimiteurs peuvent être des backticks, des guillemets, etc. L'idée centrale est d'identifier clairement les différentes parties de l'entrée, ce qui aide le modèle à comprendre et à traiter la sortie. Le délimiteur est de faire savoir clairement au modèle qu'il s'agit d'une partie indépendante, ce qui peut efficacement éviter "l'injection d'indices". L'injection dite d'invite fait référence à certaines instructions contradictoires qui peuvent être générées par erreur lorsque certains utilisateurs ajoutent une nouvelle entrée, ce qui entraîne des résultats incorrects.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-23d308fd3f-dd1a6f-7649e1) **2) Demander une sortie structurée : pour faciliter l'analyse de la sortie du modèle, une sortie structurée peut être demandée. **Dans le mot d'invite, vous pouvez spécifier : Générer trois titres de livres fictifs, ainsi que leurs auteurs et genres, fournis dans le format suivant : ID du livre, Titre, Auteur et Genre.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-8ec9761da9-dd1a6f-7649e1) **3) Demandez au modèle de vérifier si la condition est remplie. **Si la tâche comporte des hypothèses et que ces conditions ne sont pas nécessairement remplies, on peut dire au modèle de vérifier d'abord ces hypothèses, d'indiquer si elles ne sont pas remplies et d'empêcher la tâche de renvoyer directement pour éviter des résultats erronés inattendus.Comme dans l'exemple suivant : nous allons copier un paragraphe qui décrit comment faire du thé, puis copier l'invite, qui indique que si le texte contient une série d'instructions, réécrivez ces instructions dans le format suivant, suivi de l'étape -instructions étape par étape. Si le texte ne contient pas de série d'instructions, écrivez simplement "Aucune étape fournie".![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-66fa30128a-dd1a6f-7649e1) **4) Conseils de mini-lot : fournissez des exemples réussis d'exécution de tâches avant de demander au modèle de terminer la tâche réelle. **Cette stratégie est simple mais importante, c'est-à-dire que nous pouvons inclure un exemple correct dans le mot prompt. Par exemple, nous demandons au modèle de répondre sur un ton cohérent, la tâche d'entrée est "répondre aux questions dans un style cohérent", puis de fournir un exemple de conversation entre un enfant et un grand-père, l'enfant a dit : "Apprends-moi ce que la patience c'est", le grand-père Réponse par analogie.Maintenant, nous demandons au modèle de répondre avec un ton cohérent, lorsque la question suivante est : "apprenez-moi ce qu'est la résilience". Puisque le modèle a déjà ces quelques exemples, il répondra à la tâche suivante avec un ton similaire, il répondra : "La résilience est comme un arbre qui peut être plié par le vent mais ne se casse jamais".**Principe 2 : Donnez au modèle suffisamment de temps pour réfléchir. **Si le modèle fait une erreur de raisonnement parce qu'il est impatient de tirer une conclusion erronée, il doit essayer de reconstruire les mots de l'invite.L'idée centrale est d'exiger que le modèle effectue une série de raisonnements connexes avant de fournir la réponse finale. Il existe 2 stratégies sous ce principe :![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-5edef65f43-dd1a6f-7649e1) **1) Spécifiez les étapes pour terminer la tâche :**Indiquer explicitement les étapes nécessaires pour accomplir une tâche peut aider le modèle à mieux comprendre la tâche et à produire une sortie plus précise.**2) Demandez au modèle (avant de se précipiter vers des conclusions) de formuler sa propre solution :**Demander explicitement au modèle de raisonner sur la solution par lui-même avant de parvenir à une conclusion peut aider le modèle à accomplir la tâche avec plus de précision.**Discussion supplémentaire : comment afficher les limites du modèle ? **À l'heure actuelle, le plus gros problème avec la commercialisation de grands modèles de langage est "l'illusion". Parce que pendant son processus de formation, le grand modèle est exposé à une grande quantité de connaissances, mais il ne se souvient pas parfaitement des informations qu'il a vues, et il n'est pas clair où se situe la frontière des connaissances. Cela signifie que le grand modèle peut essayer de répondre à toutes les questions, inventant parfois des choses qui semblent plausibles mais qui ne le sont pas.Une stratégie pour réduire les hallucinations consiste à demander d'abord au grand modèle de langage de trouver toutes les parties pertinentes du texte, puis de lui demander d'utiliser ces citations pour répondre à la question et de retracer la réponse jusqu'au document source. d'hallucinations.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-d47363eefc-dd1a6f-7649e1) L'article d'aujourd'hui est plus pratique, nous expliquons quelques applications approfondies de l'Ingénierie (prompt engineering) à travers deux cas (un en texte brut et un en programmation).Les grands modèles de langage comme GPT-3.5 et GPT-4 comprennent tout, mais c'est précisément parce qu'il est trop large que si vous ne lui donnez pas d'indice, la réponse que vous obtenez est souvent une roue de voiture.L'importance de (invite) à ce moment est évidente, et ce n'est pas seulement un mot ou une simple phrase, si vous voulez réaliser des fonctions plus complexes, vous avez également besoin de mots rapides plus complexes.Il demande également à chacun de réfléchir et de proposer des gameplays plus originaux ou plus adaptés. Son "exclusivité" est également très forte. Par exemple, le précédent "Space Opera House" primé, l'auteur a affirmé qu'il avait passé plus de 80 heures et plus de 900 itérations pour arriver à ce travail, et a refusé de partager ce que Midjourney a utilisé jusqu'à présent.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-fd886cc376-dd1a6f-7649e1) ** Bien sûr, en soi, il se peut qu'il ne s'agisse que d'une demande progressive. Sam Altman a dit un jour : Après cinq ans, il ne sera peut-être plus nécessaire de demander le poste d'ingénieur, car l'IA aura la capacité d'apprendre par elle-même. Mais il est indéniable que cette "demande progressive" est une arme importante pour vraiment aider l'IA à pénétrer tous les aspects de l'entreprise. **Nous n'avons pas besoin de repartir de zéro maintenant, il existe de nombreuses bonnes communautés à la maison et à l'étranger, tout le monde échange son expérience sur l'utilisation des mots rapides et énumère même les mots rapides populaires actuels, que nous énumérerons dans l'annexe à la fin de l'article.** Du point de vue de l'entrepreneuriat / de l'investissement, tout le monde discute maintenant des opportunités dans la couche d'application. Je vais souvent sur ces sites Web de mots rapides populaires pour voir, et peut-être que je peux trouver des innovations dans les scénarios d'application de ces populaires récemment publiés inspiration de mots rapides. Peu importe combien vous avez vu, il vaut mieux essayer. **Addendum : Quelques sites de discussion rapide1. Communauté d'IA :(Un site Web de mots rapides populaire à l'étranger, qui peut être trié par popularité et couvre une gamme complète de scénarios.)![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-7705a2f2d7-dd1a6f-7649e1) 2、 Écrire sur Reddit (r/Writings)：(Le subreddit Writings sur Reddit est une communauté très active où les utilisateurs publient et répondent à diverses invites d'écriture.)![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-7aa58c594d-dd1a6f-7649e1) 3. Liste des 100 meilleurs mots rapides(Les 100 meilleurs mots d'invite ChatGPT pour alimenter votre flux de travail.)![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-222cfc520d-dd1a6f-7649e1) 4. Un site Web de mots rapides en chinois :(Il peut être trié par popularité, et les scénarios couverts sont très complets, de l'écriture, la programmation aux finances, aux soins médicaux, etc.)![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-a2ea30dbf6-dd1a6f-7649e1) 5. Un autre site Web de mots rapides en chinois : Tip Wizard(Le copywriting de Xiaohongshu se classe au premier rang et il a un affichage plus intuitif des mots rapides.)![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-2551876cea-dd1a6f-7649e1)

Comment entraîner l'IA à travailler pour vous ? Le secret du mot prompt (_)

1Un modèle populaire de rédaction (texte brut)

2 Un modèle de robot de commande (implémenté par code)

3 Quelques principes et techniques clés