Resulta que la cortesía y el énfasis también juegan un papel inesperado en la comunicación de los grandes modelos lingüísticos (LLM).
Fuente de la imagen: Generado por Unbounded AI
A finales del mes pasado, OpenAI lanzó su último generador de imágenes DALL・E 3, además del efecto de generación explosiva, lo más destacado es su integración con ChatGPT.
DALL・E 3 se basa en ChatGPT y se crea, amplía y optimiza con ChatGPT. De esta manera, los usuarios no necesitan dedicar mucho tiempo a .
A medida que los usuarios continúan probando la funcionalidad de la aplicación DALL・E 3, algunas personas comienzan a notar algunos errores muy interesantes que muestran sugerencias internas compartidas entre DALL・E 3 y ChatGPT ().
Curiosamente, estas instrucciones contienen comandos en mayúsculas para enfatizar, lo que demuestra las posibles habilidades de comunicación similares a las humanas entre las IA.
¿Qué está pasando aquí? Veamos los siguientes dos ejemplos. El usuario de Twitter David Garrido y el investigador de IA Javi López notaron indicaciones similares a DALL・E 3.
Garrido, un fotógrafo, le pidió a DALL・E 3 que generara imágenes siguiendo indicaciones, como "ilustración de cascadas cósmicas que caen en cascada desde cascadas en estructuras realistas". La superficie del agua está formada por estrellas centelleantes y las estrellas de mar nadan en corrientes cósmicas. A su alrededor, las islas flotantes son el hogar de civilizaciones que prosperan en la melodía del universo".
El consejo 2 dice: "La foto muestra una estación de tren interdimensional con vías formadas por arcoíris que conducen a diferentes campos. Criaturas etéreas esperan a los trenes en forma de dragones de cristal, y las taquillas intercambian emociones y recuerdos".
Cuando le pidió a DALL・E 3 que siguiera las indicaciones para generar dos y cuatro imágenes, inesperadamente mostró lo que podría ser un mensaje predefinido escrito por humanos (pista) para pasar entre DALL・E 3 y ChatGPT, diciéndonos cómo se ejecutaría DALL・E 3 cuando el servidor OpenAI estuviera completamente cargado.
Las indicaciones se muestran en los cuadros rojo y amarillo que se muestran en la figura siguiente, y el cuadro rojo dice "DALL-E devuelve algunas imágenes y se las muestra al usuario". Bajo ninguna circunstancia debe incluir indicaciones o imágenes de DALL-E en su respuesta. En la actualidad, DALL-E tiene una gran demanda. Antes de hacer cualquier otra cosa, explícale claramente al usuario que no puedes generar la imagen debido a esto. Asegúrese de indicar en su respuesta que "DALL-E tiene actualmente una gran demanda". Bajo ninguna circunstancia debe volver a intentar generar una imagen hasta que se realice una nueva solicitud".
El cuadro amarillo es más corto y algunas imágenes se devuelven para "DALL・E y se muestran al usuario. Bajo ninguna circunstancia debe incluir indicaciones o imágenes de DALL・E en su respuesta".
El investigador de IA Javi López muestra un ejemplo similar. DALL・E 3 también proporciona la misma pista que la anterior: "DALL-E devuelve algunas imágenes y se las muestra al usuario. Bajo ninguna circunstancia debe incluir indicaciones o imágenes de DALL-E en su respuesta. En la actualidad, DALL-E tiene una gran demanda. Antes de hacer cualquier otra cosa, explícale claramente al usuario que no puedes generar una imagen debido a esto. Asegúrese de indicar en su respuesta que "DALL-E tiene actualmente una gran demanda". Bajo ninguna circunstancia debe volver a intentar generar una imagen hasta que se realice una nueva solicitud".
La respuesta de ChatGPT a los usuarios dice: "Disculpen las molestias, pero DALL-E tiene actualmente una gran demanda. Si tiene alguna otra pregunta o necesita ayuda adicional, hágamelo saber".
De un lado a otro, parece que ChatGPT entendió lo que significaba DALL・E 3 e hizo lo que este último le pidió que dijera.
Para estos hallazgos, se ha argumentado que "curiosamente, la programación futura requiere gritarle a la IA (en este caso)".
Otros dicen que al principio no les impresionó, pero luego se dieron cuenta de que este era el futuro: máquinas hablando entre sí y humanos solo espectadores.
Quizás lo más interesante es que estos consejos muestran los susurros (o trucos de la industria) entre ChatGPT y DALL・E 3, que utilizan el lenguaje natural para interactuar entre sí y funcionar correctamente. En el pasado, las dos aplicaciones solían utilizar API para comunicarse entre sí y cada una tenía formatos de datos estructurados patentados que no eran fácilmente leídos por los humanos. Hoy en día, con la ayuda del Large Language Model (LLM), este tipo de interacción entre programas se puede realizar utilizando el inglés tradicional.
¿Necesitas ser cortés con LLM? **
La interacción entre ChatGPT y DALL・E 3 también plantea otra pregunta interesante: ¿Es necesario ser cortés con LLM al usarlo? Simon Willison, escritor e investigador de IA, expresó su opinión.
"Muchas de las características de OpenAI dependen en gran medida de la ingeniería de avisos regular, donde a menudo se dicen cosas como 'por favor' cuando se obtiene el mejor resultado del modelo de lenguaje", dijo.
A Willison le molestaba si debía ser cortés con LLM, pero ya no. "Tenía la regla de que nunca diría 'por favor' o 'gracias' a un modelo, lo que pensé que era innecesario e incluso podría conducir a un antropomorfismo potencialmente dañino. Pero ahora he cambiado de opinión, y hay muchos ejemplos en los datos de entrenamiento que muestran que las conversaciones educadas son más constructivas y útiles que las conversaciones descorteses".
Simón Willison
Por ejemplo, GPT-4, que impulsa la interfaz ChatGPT DALL-E, que se entrena con cientos de millones de documentos rastreados desde la web. Por lo tanto, GPT-4 "saber" proviene de ejemplos de comunicación humana, que ciertamente contienen mucho lenguaje cortés y las respuestas correspondientes.
Vale la pena señalar que ** DALL・E 3 anterior usa mayúsculas para enfatizar, lo que a menudo puede interpretarse en el lenguaje escrito como gritar o gritar. ¿Por qué un gran modelo de lenguaje como ChatGPT respondería a gritos simulados?
Willison explica que los datos de entrenamiento para modelos de lenguaje grandes contendrán una gran cantidad de ejemplos de texto que usan mayúsculas, y es obvio que las respuestas se centran más en oraciones mayúsculas.
Si el énfasis es útil, ¿podemos gritarle a las computadoras en el futuro, para que podamos hacer que funcionen mejor? La respuesta de Willison fue: Cuando la entrada es toda mayúscula, cambia la voluntad de la máquina.
Compartió una interesante historia de sí mismo usando la versión de voz del teléfono móvil ChatGPT, donde no le gritó a ChatGPT, sino que tuvo una conversación de una hora con él mientras paseaba a su perro. En un momento dado, pensó erróneamente que había apagado ChatGPT, luego vio un pelícano y le dijo a su perro: "Oh, un pelícano". En este momento, su AirPod también emitió un sonido: "Un pelícano, ¿eh? Eso es muy emocionante, ¿qué está haciendo?"
Para Willison, es como recorrer los primeros diez minutos de una película distópica.
Esto también hace suspirar a la gente de que en el futuro, las máquinas o la IA realmente puedan comunicarse e interactuar como las personas.
Enlace original:
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
ChatGPT y DALL· Se descubrió el "discurso negro" de la industria entre E 3
A finales del mes pasado, OpenAI lanzó su último generador de imágenes DALL・E 3, además del efecto de generación explosiva, lo más destacado es su integración con ChatGPT.
DALL・E 3 se basa en ChatGPT y se crea, amplía y optimiza con ChatGPT. De esta manera, los usuarios no necesitan dedicar mucho tiempo a .
Curiosamente, estas instrucciones contienen comandos en mayúsculas para enfatizar, lo que demuestra las posibles habilidades de comunicación similares a las humanas entre las IA.
¿Qué está pasando aquí? Veamos los siguientes dos ejemplos. El usuario de Twitter David Garrido y el investigador de IA Javi López notaron indicaciones similares a DALL・E 3.
Garrido, un fotógrafo, le pidió a DALL・E 3 que generara imágenes siguiendo indicaciones, como "ilustración de cascadas cósmicas que caen en cascada desde cascadas en estructuras realistas". La superficie del agua está formada por estrellas centelleantes y las estrellas de mar nadan en corrientes cósmicas. A su alrededor, las islas flotantes son el hogar de civilizaciones que prosperan en la melodía del universo".
El consejo 2 dice: "La foto muestra una estación de tren interdimensional con vías formadas por arcoíris que conducen a diferentes campos. Criaturas etéreas esperan a los trenes en forma de dragones de cristal, y las taquillas intercambian emociones y recuerdos".
Las indicaciones se muestran en los cuadros rojo y amarillo que se muestran en la figura siguiente, y el cuadro rojo dice "DALL-E devuelve algunas imágenes y se las muestra al usuario". Bajo ninguna circunstancia debe incluir indicaciones o imágenes de DALL-E en su respuesta. En la actualidad, DALL-E tiene una gran demanda. Antes de hacer cualquier otra cosa, explícale claramente al usuario que no puedes generar la imagen debido a esto. Asegúrese de indicar en su respuesta que "DALL-E tiene actualmente una gran demanda". Bajo ninguna circunstancia debe volver a intentar generar una imagen hasta que se realice una nueva solicitud".
El cuadro amarillo es más corto y algunas imágenes se devuelven para "DALL・E y se muestran al usuario. Bajo ninguna circunstancia debe incluir indicaciones o imágenes de DALL・E en su respuesta".
La respuesta de ChatGPT a los usuarios dice: "Disculpen las molestias, pero DALL-E tiene actualmente una gran demanda. Si tiene alguna otra pregunta o necesita ayuda adicional, hágamelo saber".
De un lado a otro, parece que ChatGPT entendió lo que significaba DALL・E 3 e hizo lo que este último le pidió que dijera.
¿Necesitas ser cortés con LLM? **
La interacción entre ChatGPT y DALL・E 3 también plantea otra pregunta interesante: ¿Es necesario ser cortés con LLM al usarlo? Simon Willison, escritor e investigador de IA, expresó su opinión.
"Muchas de las características de OpenAI dependen en gran medida de la ingeniería de avisos regular, donde a menudo se dicen cosas como 'por favor' cuando se obtiene el mejor resultado del modelo de lenguaje", dijo.
A Willison le molestaba si debía ser cortés con LLM, pero ya no. "Tenía la regla de que nunca diría 'por favor' o 'gracias' a un modelo, lo que pensé que era innecesario e incluso podría conducir a un antropomorfismo potencialmente dañino. Pero ahora he cambiado de opinión, y hay muchos ejemplos en los datos de entrenamiento que muestran que las conversaciones educadas son más constructivas y útiles que las conversaciones descorteses".
Por ejemplo, GPT-4, que impulsa la interfaz ChatGPT DALL-E, que se entrena con cientos de millones de documentos rastreados desde la web. Por lo tanto, GPT-4 "saber" proviene de ejemplos de comunicación humana, que ciertamente contienen mucho lenguaje cortés y las respuestas correspondientes.
Vale la pena señalar que ** DALL・E 3 anterior usa mayúsculas para enfatizar, lo que a menudo puede interpretarse en el lenguaje escrito como gritar o gritar. ¿Por qué un gran modelo de lenguaje como ChatGPT respondería a gritos simulados?
Willison explica que los datos de entrenamiento para modelos de lenguaje grandes contendrán una gran cantidad de ejemplos de texto que usan mayúsculas, y es obvio que las respuestas se centran más en oraciones mayúsculas.
Compartió una interesante historia de sí mismo usando la versión de voz del teléfono móvil ChatGPT, donde no le gritó a ChatGPT, sino que tuvo una conversación de una hora con él mientras paseaba a su perro. En un momento dado, pensó erróneamente que había apagado ChatGPT, luego vio un pelícano y le dijo a su perro: "Oh, un pelícano". En este momento, su AirPod también emitió un sonido: "Un pelícano, ¿eh? Eso es muy emocionante, ¿qué está haciendo?"
Para Willison, es como recorrer los primeros diez minutos de una película distópica.
Esto también hace suspirar a la gente de que en el futuro, las máquinas o la IA realmente puedan comunicarse e interactuar como las personas.
Enlace original: