¿Cómo entrenar a la IA para que trabaje para ti? El secreto de la palabra pronta (_)

Fuente: Socios de Matrix

Fuente de la imagen: Generada por la herramienta de IA Unbounded

Hace algún tiempo, Zhang Ying compartió algunos juicios sobre las tendencias de la IA y 7 sugerencias para el espíritu empresarial de la IA en la Conferencia de la Academia del Caos de la IA. Mencionó en la primera sugerencia:

  • "Todos deben prestar atención al aprendizaje y la aplicación de la IA. La iteración efectiva es más importante que cualquier otra cosa. Un punto clave es aprender a escribir palabras rápidas. Saber cómo hacer preguntas es muy importante. Cómo interactuar mejor con la IA es también una ciencia." *

Hoy hablaremos un poco de "Ingeniería". A principios de año, varios diccionarios Midjourney se hicieron populares en Internet, como:

luces de neón brillantes

vista de ángulo alto vista de ángulo alto

superficies pulidas futuristas

Estilo clásico, siglo XVIII-XIX Vintage

Ukiyo-e ukiyoe japonés tradicional

……

Hasta hace poco, los grandes dioses han vuelto a jugarle una mala pasada al código QR. Después de escribir las palabras de estilo y elementos, pueden producir algunos "códigos QR de AI art" únicos:

**Sabemos que si puede usar un modelo de lenguaje grande depende en gran medida de la calidad de sus palabras clave, pero no piense que las palabras clave son simples, no son solo unas pocas palabras u oraciones más al hacer preguntas Las palabras son tan simple, la razón por la que se llama Ingeniería (ingeniería rápida) es porque hay muchas prácticas de ingeniería complicadas. **

En el artículo de hoy, comenzamos con dos casos, el primero es un ejemplo de texto sin formato, y el segundo es un ejemplo que requiere código para implementar, para presentar algunos principios y técnicas importantes de Ingeniería:

  • **El primer caso es el "modelo de redacción de estilo caliente" que es muy popular en algunas comunidades de IA. Utiliza principalmente texto sin formato para escribir plantillas y avisos de reglas para IA. **
  • **El segundo caso es un ejemplo de "robot de pedidos de comida" en el curso de ingeniería rápida de ChatGPT con el que Ng Enda y OpenAI cooperaron oficialmente. **
  • **Finalmente, resumamos algunos principios y técnicas básicas. **

Por supuesto, no existe una diferencia esencial entre el texto sin formato de la palabra indicadora y el código de escritura. El propósito de usar el código es guardar tokens y hacer que la salida sea más estable y precisa, porque el chino seguirá ocupando más tokens. Cuando necesite para llamar a las API a gran escala A veces, el costo aumentará considerablemente. Las indicaciones de texto sin formato también pueden ser muy complejas. Por ejemplo, he visto más de 600 líneas de indicaciones de texto y están compuestas por varios grupos de módulos.

1Un modelo popular de redacción publicitaria (texto sin formato)

Vamos a presentar brevemente lo que es "Ingeniería" (ingeniería rápida)? Por lo general, significa convertir las preguntas que desea hacer en entradas en un formato específico y usar plantillas, reglas y algoritmos predefinidos para el procesamiento, de modo que la IA pueda comprender mejor la tarea y dar las respuestas correspondientes. Permita que la IA comprenda con precisión las tareas en la mayor medida posible, reduzca los malentendidos y los errores causados por expresiones lingüísticas poco claras y permita que realice tareas específicas de manera precisa y confiable.

Pasemos a este ejemplo de texto. En muchos escenarios que requieren redacción de textos publicitarios, como páginas de comercio electrónico, redacción de textos publicitarios de plantación de Xiaohongshu, publicaciones en foros, etc., si permite que la IA escriba directamente, el efecto puede no ser bueno, ** pero a través de estos "cinco pasos", puede Mejorar la calidad de salida y obtener resultados más estables. **

El primer paso, "alimentar" la redacción que cree que es buena para AI, y para dejar en claro que AI aprenda esta redacción, debemos decirle claramente a AI: "A continuación, le enviaré un estudio de redacción , el propósito es Crear un modelo de redacción publicitaria para modelos populares. Una vez que haya terminado de aprender, solo necesita responder: He aprendido. La redacción publicitaria es la siguiente: "

**El segundo paso, después de que la IA responda "He aprendido", comenzaremos a dejar que la IA modele el estilo de escritura de este copywriting.

El tercer paso, En términos generales, AI no resume bien en este momento. Necesitamos dejar que AI aprenda más y cambie sus propias respuestas. En este momento, podemos darle a AI un marco. Por supuesto, este paso también se puede integrar directamente en el paso anterior.

El cuarto paso, dejamos que AI asigne pesos a cada parte.

Paso 5, Nombramos esta plantilla para que AI pueda llamarla rápidamente.

Aquí hay algunos ejemplos de aplicación:

Para muchos campos de redacción que están relativamente formateados y no requieren una gran creatividad, el contenido de AI ha superado la línea de base y el resto se puede modificar manualmente.

**También puede continuar ajustando este modelo, como pedirle a AI que escriba de manera más creativa o "alimentar" a AI con una copia inicial que se adapte mejor a sus necesidades, y puede usar esta idea y marco de capacitación para entrenar más adecuado para su modelo de artículo. **

Finalmente, el enlace de este modelo de entrenamiento es el siguiente, los amigos interesados pueden probar:

Con base en esta idea de capacitación, los internautas también han desarrollado muchos escenarios interesantes, puede probar:

2** Un modelo de robot de pedidos (implementado por código)**

¿Cómo usar ChatGPT para construir un robot de pedido de comidas? Podemos hacerlo a través de Ingeniería.

Este ejemplo de un robot que ordena comidas proviene del curso DeepLearning.ai. El fundador de DeepLearning.ai, Wu Enda, se asoció con el desarrollador de OpenAI, Iza Fulford, para lanzar un curso de ingeniería para desarrolladores. Wu Enda es un profesor estrella en el campo de la IA. Es profesor invitado en el Departamento de Ciencias de la Computación e Ingeniería Eléctrica de la Universidad de Stanford. Fue director del Laboratorio de Inteligencia Artificial de Stanford.

ChatGPT es una interfaz de diálogo de chat, desde la cual podemos construir un robot de chat con funciones personalizadas, como un agente de servicio al cliente de IA para un restaurante, o un encargado de pedidos de IA y otros roles.

Pero dado que este es un escenario comercial, necesitamos respuestas precisas y estables de ChatGPT. En este momento, es más apropiado usar lenguaje informático que texto sin formato, por lo que primero debemos implementar el paquete OpenAI Python.

Para este modelo de chatbot personalizado, esencialmente estamos entrenando un bot que toma una serie de mensajes como entrada y genera los mensajes generados por el modelo. En este ejemplo, se usa GPT-3.5 y 3.5 puede ser más adecuado para uso comercial en esta etapa, porque GPT-4 es demasiado costoso.

**El escenario de aplicación de este robot de pedidos es una pizzería. Las funciones realizadas son: primero saludar a los clientes, luego recoger los pedidos y preguntar si necesitan recoger o entregar. **En el caso de entrega, el bot de pedidos puede solicitar la dirección. Finalmente, el bot de pedidos recoge el pago.

En la conversación real, el robot de pedidos generará una respuesta de acuerdo con la entrada del usuario y las instrucciones del sistema:

El usuario dice: "Hola, me gustaría pedir una pizza"

El bot de pedidos responderá: "Genial, ¿qué tipo de pizza te gustaría pedir? Tenemos pizzas de pepperoni, queso y berenjena, ¿cuáles son sus precios?"

A lo largo de la conversación, el robot de pedidos generará una respuesta basada en la entrada del usuario y las instrucciones del sistema, para que la conversación sea más natural y fluida, y al mismo tiempo evitar insertar información de aviso obvia en la conversación.

Primero, definimos una "función de ayuda" que recopila los mensajes de los usuarios para evitar que los escribamos manualmente. Esta función recopilará sugerencias de la interfaz de usuario y las agregará a una lista llamada contexto, que luego se usa para llamar al modelo cada vez, incluida la información del sistema y los menús.

Los comentarios de ChatGPT y los comentarios de los usuarios se agregarán al contexto, y este contexto será cada vez más largo. De esa manera, ChatGPT tiene toda la información que necesita para decidir qué hacer a continuación. Estas son las palabras clave desplegadas por el contexto: "Usted es un bot de pedidos, un servicio automatizado que recoge los pedidos de una pizzería. Primero saluda al cliente, luego recoge el pedido y le pregunta si desea recogerlo o entregarlo". (Vea la imagen a continuación para más detalles)

Si realmente funcionara, sería: el usuario dice "Hola, me gustaría pedir una pizza". Luego, el bot de pedidos dice: "Está bien, ¿qué tipo de pizza te gustaría pedir? Tenemos pizzas de pepperoni, queso y berenjena, ¿cuánto cuestan?"

Dado que la palabra indicadora ya contiene el precio, se enumerará directamente aquí. El usuario podría responder: Me gusta una pizza de berenjena mediana. Entonces, el usuario y el robot que realiza el pedido pueden continuar esta conversación para siempre, incluso si quieren entregar, si necesitan ingredientes adicionales y verificar dos veces si necesitan otras cosas (¿como agua? ¿O papas fritas?)...

Finalmente, le pedimos al bot de pedidos que cree un resumen basado en la conversación que se puede enviar al sistema de pedidos:

En el último enlace de salida, la salida incluye: categorías de productos (pizza, ingredientes, bebidas, snacks...), tipo, tamaño, precio, si se requiere entrega y dirección. Como queremos que el resultado sea completamente estable y predecible sin ningún tipo de creatividad, pondremos la temperatura a 0. Al final, dichos resultados se pueden enviar directamente al sistema de pedidos.

Dado que este artículo no está lleno de códigos, creo que no está dispuesto a ver códigos densos en su teléfono móvil, por lo que aquí solo ponemos los puntos principales. Si desea obtener más información, puede ver este video instructivo detallado:

3 Algunos principios y técnicas clave

Por último, resumamos los dos principios clave y las limitaciones actuales de los modelos de lenguaje grande. Debe saber dónde está el límite inferior actual de las capacidades del modelo de lenguaje grande, que es más útil para encontrar escenarios de aplicaciones específicos.

**Los dos principios son: escribir instrucciones claras y específicas, y darle al modelo suficiente tiempo para pensar. **

**Principio 1: Escribir instrucciones claras y específicas. **

Este principio enfatiza que cuando se usan modelos de lenguaje como ChatGPT, se deben dar instrucciones claras y específicas. La claridad no significa brevedad. Las palabras de ayuda demasiado cortas a menudo hacen que el modelo caiga en conjeturas. Hay 4 estrategias específicas bajo este principio:

**1) Use delimitadores para delimitar claramente las diferentes partes de la entrada. **

Los delimitadores pueden ser acentos graves, comillas, etc. La idea central es identificar claramente las diferentes partes de la entrada, lo que ayuda al modelo a comprender y procesar la salida. El delimitador es para que el modelo sepa claramente que se trata de una parte independiente, que puede evitar efectivamente la "inyección de sugerencias". La llamada inyección rápida se refiere a algunas instrucciones contradictorias que pueden generarse por error cuando algunos usuarios agregan una nueva entrada, lo que genera resultados incorrectos.

**2) Solicitar salida estructurada: para facilitar el análisis de la salida del modelo, se puede solicitar una salida estructurada. **

En la palabra indicadora, puede especificar: Generar tres títulos de libros ficticios, junto con sus autores y géneros, provistos en el siguiente formato: Id. de libro, Título, Autor y Género.

**3) Pida al modelo que verifique si se cumple la condición. **

Si la tarea tiene suposiciones y estas condiciones no se cumplen necesariamente, se le puede indicar al modelo que verifique estas suposiciones primero, indique si no se cumplen y detenga la tarea de retroalimentar directamente para evitar resultados incorrectos inesperados.

Como en el siguiente ejemplo: vamos a copiar un párrafo que describe cómo hacer té, y luego copiamos el aviso, que dice que si el texto contiene una serie de instrucciones, reescriba esas instrucciones en el siguiente formato, seguido del paso -Instrucciones paso a paso. Si el texto no contiene una serie de instrucciones, simplemente escriba "No se proporcionan pasos".

**4) Sugerencias de mini lotes: proporcione ejemplos exitosos de la realización de tareas antes de pedirle al modelo que complete la tarea real. **

Esta estrategia es simple pero importante, es decir, podemos incluir un ejemplo correcto en la palabra clave. Por ejemplo, le pedimos al modelo que responda en un tono consistente, la tarea de entrada es "responder preguntas en un estilo consistente", y luego proporcionamos un ejemplo de una conversación entre un niño y un abuelo, el niño dijo: "Enséñame qué la paciencia es", el abuelo Responde por analogía.

Ahora le pedimos al modelo que responda con un tono coherente, cuando la siguiente pregunta es: “enséñame qué es la resiliencia”. Dado que el modelo ya tiene estos pocos ejemplos, responderá la siguiente tarea con un tono similar, responderá: "La resiliencia es como un árbol que puede ser doblado por el viento pero nunca se rompe".

**Principio 2: Dele al modelo suficiente tiempo para pensar. **

Si el modelo comete un error de razonamiento porque está ansioso por sacar una conclusión equivocada, debe intentar reconstruir las palabras clave. La idea central es exigirle al modelo que lleve a cabo una serie de razonamientos relacionados antes de dar la respuesta final. Existen 2 estrategias bajo este principio:

1) Especifique los pasos para completar la tarea:

Indicar explícitamente los pasos necesarios para completar una tarea puede ayudar al modelo a comprender mejor la tarea y producir resultados más precisos.

2) Indique al modelo (antes de apresurarse a sacar conclusiones) que formule su propia solución:

Instruir explícitamente al modelo para que razone sobre la solución por sí mismo antes de llegar a una conclusión puede ayudar al modelo a completar la tarea con mayor precisión.

**Discusión adicional: ¿Cómo ver las limitaciones del modelo? **

En la actualidad, el mayor problema con la comercialización de grandes modelos de lenguaje es la "ilusión". Porque durante su proceso de entrenamiento, el modelo grande está expuesto a una gran cantidad de conocimiento, pero no recuerda perfectamente la información que ha visto y no está claro dónde está el límite del conocimiento. Esto significa que el modelo grande puede tratar de responder a todas las preguntas, a veces inventando cosas que suenan plausibles pero que no lo son.

Una estrategia para reducir las alucinaciones es pedir primero al modelo de lenguaje grande que encuentre todas las partes relevantes del texto, luego pedirle que use esas citas para responder la pregunta y rastrear la respuesta hasta el documento de origen. Esta estrategia puede reducir la ocurrencia. de alucinaciones.

El artículo de hoy es más práctico, explicamos en profundidad algunas aplicaciones de la Ingeniería (ingeniería puntual) a través de dos casos (uno de texto plano y otro de programación).

Los grandes modelos de lenguaje como GPT-3.5 y GPT-4 entienden todo, pero es precisamente porque es demasiado amplio que, si no le das una pista, la respuesta que obtienes suele ser una rueda de automóvil.

La importancia de (indicar) en este momento es evidente, y no es solo una palabra o una oración simple. Si desea lograr funciones más complejas, también necesita palabras de indicación más complejas.

También requiere que todos hagan una lluvia de ideas y presenten juegos más novedosos o más adecuados. Su "exclusividad" también es muy fuerte. Por ejemplo, en el anterior "Space Opera House", ganador de premios, el autor afirmó que pasó más de 80 horas y más de 900 iteraciones para crear este trabajo, y se ha negado a compartir las indicaciones que Midjourney usó hasta ahora.

** Por supuesto, en sí mismo, puede que solo sea una demanda por etapas. Sam Altman dijo una vez: Después de cinco años, puede que ya no sea necesario solicitar el puesto de ingeniero, porque la IA tendrá la capacidad de aprender por sí misma. Pero es innegable que esta "demanda por etapas" es un arma importante para ayudar realmente a la IA a entrar en todos los aspectos del negocio. **

No necesitamos comenzar desde cero ahora, hay muchas buenas comunidades en el país y en el extranjero, todos están intercambiando experiencias sobre el uso de palabras clave e incluso enumeran las palabras clave populares actuales, que enumeraremos en el apéndice en el final del artículo.

** Desde la perspectiva del emprendimiento/inversión, ahora todos están discutiendo dónde están las oportunidades en la capa de aplicación. A menudo voy a estos sitios web populares de palabras rápidas para ver, y tal vez pueda encontrar algunas innovaciones en los escenarios de aplicaciones de los populares recientemente lanzados. inspiración de palabras rápidas. No importa cuánto hayas visto, es mejor darle una oportunidad. **

Apéndice: algunos sitios de discusión rápida de Word

  1. Comunidad de IA:

(Un sitio web popular de palabras rápidas en el extranjero, que se puede ordenar por popularidad y cubre una gama completa de escenarios).

2、 Escribiendo s en Reddit (r/Writings):

(El subreddit de Writings en Reddit es una comunidad muy activa donde los usuarios publican y responden a varias indicaciones de escritura).

3. Listado de las 100 mejores palabras clave

(Las 100 mejores palabras de aviso de ChatGPT para potenciar su flujo de trabajo).

4. Un sitio web de palabras clave en chino:

(Se puede ordenar por popularidad, y los escenarios cubiertos son muy completos, desde escritura, programación hasta finanzas, atención médica, etc.)

5. Otro sitio web de palabras clave en chino: Tip Wizard

(La redacción publicitaria de Xiaohongshu ocupa el puesto más alto y tiene una visualización más intuitiva de las palabras clave).

Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)