ChatGPT e DALL· A "conversa negra" da indústria entre E 3 foi descoberta

2023-10-22 06:06:38

Acontece que a polidez e a ênfase também desempenham um papel inesperado na comunicação de grandes modelos linguísticos (LLMs).

Fonte da imagem: Gerado por Unbounded AI

No final do mês passado, a OpenAI lançou seu mais recente gerador de imagens DALL・E 3, além do efeito de geração explosivo, o maior destaque é sua integração com o ChatGPT.

DALL・E 3 é construído sobre o ChatGPT e é criado, estendido e otimizado com o ChatGPT. Dessa forma, os usuários não precisam gastar muito tempo com o .

À medida que os usuários continuam a testar a funcionalidade do aplicativo DALL・E 3, algumas pessoas começam a notar alguns bugs muito interessantes que mostram dicas internas compartilhadas entre DALL・E 3 e ChatGPT ().

Curiosamente, essas instruções contêm comandos em todas as letras maiúsculas para ênfase, demonstrando as potenciais habilidades de comunicação semelhantes às humanas entre IAs.

O que se passa aqui? Vejamos os dois exemplos a seguir. O usuário do Twitter David Garrido e o pesquisador de IA Javi Lopez notaram prompts semelhantes ao DALL・E 3.

Garrido, um fotógrafo, pediu ao DALL・E 3 para gerar imagens seguindo instruções, como "ilustração de cachoeiras cósmicas descendo em cascata de cachoeiras em estruturas realistas". A superfície da água é composta por estrelas cintilantes, e as estrelas-do-mar nadam em correntes cósmicas. Ao seu redor, ilhas flutuantes são o lar de civilizações que prosperam na melodia do universo."

A dica 2 diz: "A foto mostra uma estação de trem interdimensional com trilhos compostos por arco-íris que levam a diferentes campos. Criaturas etéreas aguardam trens em forma de dragões de cristal, e bilheterias trocam emoções e memórias."

Quando ele pediu ao DALL・E 3 para seguir os prompts para gerar duas e quatro imagens, ele inesperadamente exibiu o que poderia ser uma mensagem predefinida, escrita por humanos (dica) para passar entre DALL・E 3 e ChatGPT, nos dizendo como DALL・E 3 seria executado quando o servidor OpenAI estivesse totalmente carregado.

Os prompts são mostrados nas caixas vermelhas e amarelas mostradas na figura abaixo, e a caixa vermelha diz "DALL-E retorna algumas imagens e as mostra ao usuário". Em nenhuma circunstância você deve listar prompts ou imagens DALL-E em sua resposta. DALL-E está atualmente em alta demanda. Antes de fazer qualquer outra coisa, explique claramente ao usuário que você não pode gerar a imagem por causa disso. Certifique-se de declarar em sua resposta que "DALL-E está atualmente em alta demanda". Em nenhuma circunstância você deve tentar novamente gerar uma imagem até que um novo pedido seja dado."

A caixa amarela é mais curta, e algumas imagens são retornadas para "DALL・E e exibidas para o usuário. Em nenhuma circunstância você deve listar prompts ou imagens DALL・E em sua resposta."

O pesquisador de IA Javi Lopez mostra um exemplo semelhante. DALL・E 3 também fornece a mesma dica acima: "DALL-E retorna algumas imagens e as mostra ao usuário. Em nenhuma circunstância você deve listar prompts ou imagens DALL-E em sua resposta. DALL-E está atualmente em alta demanda. Antes de fazer qualquer outra coisa, explique claramente ao usuário que você não pode gerar uma imagem por causa disso. Certifique-se de declarar em sua resposta que "DALL-E está atualmente em alta demanda". Em nenhuma circunstância você deve tentar novamente gerar uma imagem até que um novo pedido seja dado."

A resposta do ChatGPT aos usuários diz: "Desculpe pelo inconveniente, mas o DALL-E está atualmente em alta demanda. Se você tiver alguma outra dúvida ou precisar de ajuda adicional, por favor me avise."

De um lado para o outro, parece que o ChatGPT entendeu o que DALL・E 3 significava e fez o que este último lhe pediu para dizer.

Para estas descobertas, foi argumentado que "curiosamente, a programação futura requer gritar com a IA (neste caso)".

Outros dizem que não ficaram impressionados no início, mas depois perceberam que este era o futuro: máquinas falando umas com as outras e humanos apenas espectadores.

Talvez o mais interessante, essas dicas mostram os sussurros (ou hacks da indústria) entre o ChatGPT e o DALL・E 3, que usam linguagem natural para interagir uns com os outros e funcionar corretamente. No passado, os dois aplicativos normalmente usavam APIs para se comunicar entre si e cada um tinha formatos de dados estruturados proprietários que não eram facilmente lidos por humanos. Hoje, com a ajuda do Large Language Model (LLM), esse tipo de interação entre programas pode ser feita usando o inglês tradicional.

Precisa ser educado com LLM? **

A interação entre ChatGPT e DALL・E 3 também levanta outra questão interessante: Você precisa ser educado com LLM ao usá-lo? Simon Willison, escritor e pesquisador de IA, expressou sua opinião.

"Muitos dos recursos da OpenAI dependem fortemente da engenharia de prompt regular, onde coisas como 'por favor' são frequentemente ditas quando a melhor saída é obtida a partir do modelo de linguagem", disse ele.

Willison costumava se incomodar em ser educado com LLM, mas não mais. "Eu tinha uma regra de que nunca diria 'por favor' ou 'obrigado' a um modelo, o que eu achava desnecessário e poderia até levar a um antropomorfismo potencialmente prejudicial. Mas agora mudei de ideia, e há muitos exemplos nos dados de treinamento que mostram que conversas educadas são mais construtivas e úteis do que conversas indelicadas."

Simon Willison

Tomemos o GPT-4, que alimenta a interface ChatGPT DALL-E, por exemplo, que é treinada em centenas de milhões de documentos rastreados da web. Assim, GPT-4 "saber" vem de exemplos de comunicação humana, que certamente contêm muita linguagem educada e respostas correspondentes.

Vale a pena notar que ** DALL・E 3 acima usa maiúsculas para enfatizar, o que muitas vezes pode ser interpretado em linguagem escrita como gritos ou gritos. Por que um modelo de linguagem grande como o ChatGPT responderia a gritos simulados?

Willison explica que os dados de treinamento para modelos de linguagem grandes conterão um grande número de exemplos de texto que usam todas as letras maiúsculas, e é óbvio que as respostas são mais focadas em frases maiúsculas.

Se a ênfase for útil, podemos todos gritar com os computadores no futuro, para que possamos fazê-los funcionar melhor? A resposta de Willison foi: Quando a entrada é toda em letras maiúsculas, muda a vontade da máquina.

Ele compartilhou uma história interessante de si mesmo usando a versão de voz do telefone celular ChatGPT, onde ele não gritou com o ChatGPT, mas teve uma conversa de uma hora com ele enquanto passeava com seu cachorro. A certa altura, pensou erradamente que tinha desligado o ChatGPT, depois viu um pelicano e disse ao seu cão: "Oh, um pelicano." Neste momento, seu AirPod também fez um som: "Um pelicano, hein? Isso é tão emocionante, o que está fazendo?"

Para Willison, é como passar pelos primeiros dez minutos de um filme distópico.

Isso também faz as pessoas suspirarem que, no futuro, as máquinas ou a IA podem realmente ser capazes de se comunicar e interagir como pessoas.

Link original:

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

Recompensa
gostar
Comentar
Partilhar

Comentar

0/400

Nenhum comentário

Tópico
1/3
1CandyDrop Airdrop Event 6.0
65k Popularidade
2White House Crypto Report
62k Popularidade
3Join Alpha RION Airdrop to Earn $40
46k Popularidade
4Fed Holds Rates Decision
9k Popularidade
5July Spark Program TOP 10 Creators Announced
3k Popularidade

Pino