Surpreendente! A árvore de habilidades GPT cresceu novamente, e agora você pode até fazer o jogo diretamente!?
Você sabe, a era atual não é mais a era do passado em que você pode aproveitar o mercado fazendo um pequeno jogo. O processo de desenvolvimento de jogos de hoje é super complexo.
Comecemos pela mão de obra, o pessoal de cada equipa de jogo é contado em dezenas ou até centenas. Alguém é responsável pela programação, alguém é responsável pela arte, alguém é responsável pela manutenção, e assim por diante.
Cada jogo também tem uma enorme base de código e biblioteca de materiais.
Como resultado, desenvolver um grande jogo requer muitas pessoas e muito tempo para ser concluído. E este período de tempo é muitas vezes de vários anos.
Mais intuitivamente, é dinheiro.
A equipe do jogo desenvolveu uma obra-prima que as pessoas vão se lembrar e amar, e o orçamento vai ultrapassar US $ 100 milhões.
Caso contrário, a produção de jogos é uma espécie de eletricidade gerada com amor.
Agora, as coisas mudaram!
Os pesquisadores desenvolveram um modelo chamado GameGPT, que pode integrar vários agentes de IA para automatizar alguns dos processos no desenvolvimento de jogos.
E diferentes agentes desempenham as suas próprias funções e trabalham de forma ordenada.
Existem agentes responsáveis por rever o plano de design do jogo e fazer as modificações e ajustes correspondentes; Alguns são responsáveis por traduzir tarefas em código concreto; Alguns são responsáveis por verificar o código gerado na etapa anterior e revisar os resultados em execução; Há também agentes responsáveis por verificar se todo o trabalho atende às expectativas iniciais.
Desta forma, refinando e decompondo o fluxo de trabalho, o GameGPT pode simplificar o trabalho dos agentes de IA. Este tipo de desempenho é mais eficiente e muito mais simples de alcançar do que um agente todo-poderoso fazendo tudo.
Os pesquisadores dizem que o GameGPT pode simplificar alguns dos aspetos repetitivos e rígidos do processo tradicional de desenvolvimento de jogos, como testes de código.
Um grande número de desenvolvedores pode ser libertado do complicado trabalho de inspeção e se concentrar em links de projeto mais desafiadores que não podem ser substituídos por IA.
É evidente que este documento se encontra ainda numa fase relativamente preliminar. Não existem resultados concretos ou experiências que demonstrem melhorias de desempenho.
Em outras palavras, ninguém realmente desenvolveu um jogo com o GameGPT, e o modelo ainda está na fase conceitual, e é difícil de avaliar até que haja resultados de aplicação específicos e dados quantificáveis.
No entanto, é sempre uma direção para trabalhar.
Alguns internautas disseram que as ideias das pessoas sobre LLM são um pouco tendenciosas. Agora, os pesquisadores têm uma ferramenta que resolve 100% dos problemas de PNL, enquanto as pessoas só se preocupam em automatizar certos fluxos de trabalho.
Por exemplo, imagine se o mundo do jogo reagisse às suas decisões mais normalmente do que você poderia julgar em cinco minutos como um mecanismo baseado em regras e codificado.
Imagine se um jogo pudesse improvisar missões secundárias para você com base nas decisões que você toma (como matar aleatoriamente inimigos que você vê ao longo do caminho, etc.).
Quando os desenvolvedores criam um sistema desse tipo, eles usam engenharia de dicas para guiar o LLM em vez de codificar essas coisas.
No entanto, o objetivo disso não é economizar custos, mas fazer jogos em uma fase em que não era possível fazer mais jogos antes (não é um pouco bobo).
GameGPT
Primeiro, vamos dar uma olhada na grande estrutura do modelo GameGPT - todo o processo.
Como se pode ver, o autor personifica cada agente, mostrando de forma mais vívida como eles desempenham suas respetivas funções.
No lado esquerdo do processo está o lado do usuário, que é inserido no GameGPT, e então o gerente de desenvolvimento e revisão fazem o planejamento preliminar.
Os requisitos são então enviados para engenheiros de desenvolvimento, bem como engenheiros de motores de jogos, para executar tarefas específicas e gerar código.
Por fim, verifique se há omissões, envie-as de volta para o lado esquerdo e corra novamente. Caso contrário, continue à direita e o engenheiro responsável pela inspeção realizará o teste.
**Jogo de desenvolvimento de IA? **
Na verdade, os rudimentos da história dos jogos desenvolvidos com IA podem voltar ainda mais longe.
A aplicação da IA no desenvolvimento de jogos pode ser rastreada até jogos clássicos como StarCraft e Diablo. Na época, os desenvolvedores precisavam de sistemas de IA para criar mundos e personagens virtuais interativos.
Estes sistemas tornaram-se padrão para o desenvolvimento dessas plataformas interativas.
As primeiras pesquisas relacionadas à IA no desenvolvimento de jogos enfatizaram o controle de personagens não-jogadores (NPCs), e com o desenvolvimento da tecnologia de processamento de linguagem natural (NLP), houve algum trabalho pioneiro usando técnicas de aprendizagem profunda para gerar níveis.
Uma das obras-primas é MarioGPT, que gerou com sucesso alguns dos níveis em Super Mario Bros através de um modelo GPT-2 ajustado.
LLM fez grandes avanços este ano, com bons resultados em PNL e visão computacional (CV).
Sabemos que a formação em LLM é um processo de várias etapas. A fase inicial consiste na formação destes modelos num corpus extenso, facilitando a aquisição de competências linguísticas básicas.
Isso é seguido por uma etapa mais importante, que é ajustar o modelo gerando dados de várias tarefas de PNL por meio de instruções. Este ajuste de instrução aumenta a capacidade de generalização do modelo em uma ampla gama de aplicações, permitindo que o LLM alcance um desempenho livre de erros em tarefas que não foram executadas em treinamentos anteriores.
Finalmente, a etapa Human Feedback Reinforcement Learning (RLHF) garante a integridade estrutural e a confiabilidade do modelo.
Outra ressalva aqui – o estágio RLHF permite que o modelo gere conteúdo que imite o estilo humano, aumentando sua versatilidade como agente.
Além disso, os avanços no LLM promoveram a automação de agentes no processo de desenvolvimento de software. Muitos estudos têm se concentrado na questão de como desenvolver um agente baseado em LLM que pode executar diferentes tarefas.
Por exemplo, o AutoGPT usou agentes LLM para lidar com certas tarefas de tomada de decisão no mundo real, enquanto o HuggingGPT usou um único LLM como controlador para coordenar tarefas de IA mais complexas.
Embora esses métodos dependam de um único agente LLM, todos eles adicionam um revisor (o revisor no fluxograma acima) para melhorar a decisão.
Ou tome o AutoGPT como exemplo, o modelo receberá algumas opiniões auxiliares do aluno supervisionado para melhorar seu próprio desempenho, e o HuggingGPT também pode ser conectado ao GPT-4 para fazer um revisor para avaliar a precisão da tomada de decisão.
Existem outros exemplos, como o MetaGPT, que introduz uma estrutura multiagente que pode ser usada para automatizar o desenvolvimento de vários softwares.
Voltando ao desenvolvimento de jogos que discutimos hoje, precisamos saber que, ao contrário do desenvolvimento de software geral, a indústria de desenvolvimento de jogos precisa acompanhar as tendências, então todo o processo de desenvolvimento deve ser mais preciso e conciso para alcançar a melhor eficiência.
Além disso, ajustar e usar um único LLM para servir todo o ciclo de desenvolvimento de jogos sem ilusões e alta precisão é impraticável e caro.
Portanto, a estrutura da IA de desenvolvimento de jogos requer a participação de vários revisores, o que pode efetivamente aliviar as tendências alucinatórias inerentes aos modelos de linguagem.
Os pesquisadores também descobriram que os modelos de linguagem têm outra limitação no desenvolvimento de jogos – redundância. LLM pode gerar tarefas desnecessárias, não informativas ou trechos de código quando o jogo é construído.
Para resolver eficazmente o problema da ilusão e redundância, o protagonista de hoje, GameGPT, estrategicamente adota uma variedade de abordagens para o problema, incluindo colaboração dupla, ajustes de instrução através de vocabulários internos e dissociação de código.
Vale a pena notar que a dupla colaboração envolve a interação entre LLM e pequenos modelos de deep learning, bem como a participação colaborativa entre o agente responsável pela execução e o agente revisor.
Os pesquisadores dizem que essas sinergias se mostraram eficazes para mitigar a ilusão e redundância do GameGPT.
Introdução ao método
Em seguida, os pesquisadores dissecaram a inovação do GameGPT de todo o processo.
Em primeiro lugar, durante a fase de design do jogo, depois de receber uma solicitação do usuário, as tarefas do GameGPT incluem gerar um plano de desenvolvimento para todo o jogo. Esta fase de planejamento é uma das principais etapas que afeta muito o progresso contínuo de todo o processo de desenvolvimento.
Esta fase é planeada por um gestor de desenvolvimento de jogos baseado em LLM, que elabora um plano inicial e depois o divide numa lista de tarefas.
Vale a pena notar que, devido às limitações inerentes ao LLM, este plano inicial muitas vezes apresenta alucinações, resultando em tarefas inesperadas, incluindo tarefas desinformativas ou desnecessariamente redundantes.
Para abordar essas questões, os pesquisadores propuseram quatro estratégias que poderiam mitigar esses desafios que eram ortogonais entre si e poderiam ser realizadas em camadas para melhores resultados.
Cenário um: Categorize as solicitações recebidas para identificar o tipo de jogo. Atualmente, a estrutura GameGPT suporta o desenvolvimento de cinco gêneros de jogos diferentes, a saber: ação, estratégia, RPG, simulação e aventura.
Para cada tipo, os pesquisadores fornecem modelos de planejamento padronizados que guiam os agentes do gerente de desenvolvimento de jogos através dos modelos com informações relevantes.
Ao adotar esta abordagem, a frequência de tarefas redundantes é significativamente reduzida, enquanto a probabilidade de ocorrência de alucinações.
Estratégia dois: envolve o envolvimento do agente examinador do programa, que é outro agente baseado em LLM. Este agente opera com um design cuidadoso para fornecer uma revisão abrangente do plano de missão.
Seu principal objetivo é minimizar a ocorrência de alucinações e redundância. Este programa de avaliação de agentes fornece feedback para melhorar e aumentar sua precisão, eficiência e simplicidade.
Ao mesmo tempo, as instruções geradas nesta parte podem ser usadas como novas entradas para o agente do gerente de desenvolvimento de jogos, tornando o plano de tarefas mais preciso e perfeito.
Estratégia 3: Ajuste o LLM em si do agente do gerente de desenvolvimento de jogos através de instruções especiais para planejar melhor o nível de desenvolvimento do jogo. O objetivo deste processo de ajuste fino é permitir que o modelo produza um plano que seja preciso e conciso.
Por conveniência, a equipe de pesquisa coletou e integrou um conjunto de dados interno que incluiu muitas combinações de entradas e saídas. Embora essas combinações não estejam de acordo com o formato padrão em comprimento ou estrutura, todas elas giram em torno dos requisitos do desenvolvimento de jogos.
Esta parte do mix fixo é fornecida por desenvolvedores do setor.
Ao adotar essa abordagem, os pesquisadores efetivamente preencheram a lacuna entre as habilidades gerais de linguagem do LLM e as habilidades de planejamento de desenvolvimento de jogos.
Estratégia 4: "Rede de segurança" na fase de planeamento. Durante todo o processo de planejamento, o Game Development Manager Agent sempre compartilha os resultados intermediários com o usuário na interface front-end, permitindo que o resto dos agentes saiba a todo momento qual desenvolvimento está em andamento.
Para melhorar isso, os pesquisadores integraram uma abordagem interativa que permite aos usuários revisar, corrigir e melhorar ativamente os planos com base em suas expectativas. Esta abordagem também garante a consistência entre o plano de design e as necessidades do usuário.
Com essas estratégias fora do caminho, vamos dar uma olhada nas vantagens do GameGPT.
Primeiro, o processo de classificação de tarefas neste modelo requer alta precisão na identificação de tipos de tarefas e seus parâmetros correspondentes.
Assim, para garantir a precisão nesta fase, os pesquisadores criaram um agente chamado engenheiro de desenvolvimento de jogos. O agente consiste em dois modelos que trabalham juntos para participar do processo de classificação de tarefas.
Esta abordagem colaborativa melhora a precisão e a eficácia da identificação de tarefas. Ao mesmo tempo, a fim de evitar o aparecimento de ilusões LLM e melhorar a precisão da classificação de tarefas, os pesquisadores forneceram uma lista de tipos de tarefas que podem aparecer no desenvolvimento de jogos.
Para melhor classificar isso, eles adotaram o modelo BERT.
O modelo BERT foi totalmente treinado com um conjunto de dados interno. Este conjunto de dados contém itens de dados adaptados à tarefa de desenvolvimento do jogo. A entrada é extraída de uma lista predeterminada e a saída corresponde à categoria especificada da tarefa.
A revisão dos tipos de tarefas e parâmetros é realizada nesta etapa, e um agente chamado revisor de tarefas é introduzido, que é o principal responsável pela identificação de cada categoria e se os parâmetros são razoáveis.
O processo de revisão inclui a revisão se o tipo de tarefa está dentro de um intervalo predeterminado e se é a tarefa mais adequada. Ao mesmo tempo, ele também verifica a lista de parâmetros para ver se ela está alinhada com a tarefa.
Em alguns cenários, como algumas situações baseadas em informações contextuais da tarefa, ou onde a solicitação do usuário não pode ser inferida parâmetros, o GameGPT adota uma abordagem proativa para resolvê-los.
O revisor atrai a atenção do usuário iniciando um prompt na interface front-end e solicitando informações adicionais necessárias para os parâmetros.
O benefício desta abordagem interativa é que garante a integridade dos detalhes do argumento, mesmo quando o raciocínio automático é insuficiente.
Além disso, há outro agente responsável por identificar dependências entre tarefas e construir um diagrama que encapsula essas relações. Depois que o gráfico é estabelecido, um algoritmo é usado para percorrer e filtrar o gráfico, resultando em uma ordem de execução de tarefa definida.
Este processo garante que o modelo possa ser executado de forma ordenada e sistemática de acordo com as dependências da tarefa, resultando num processo de desenvolvimento coerente e estruturado.
Outro problema é que usar LLM para gerar código longo traz maiores alucinações e o risco de redundância. Para resolver este problema, os pesquisadores introduziram um novo método para dissociar o código que aparece no design de jogos, simplificando o processo de raciocínio do LLM, mitigando assim muito as alucinações e redundância.
Essa abordagem também não é difícil de entender - os pesquisadores dividirão o script esperado em muitos trechos de código mais curtos para o LLM processar. Este método de dissociação simplifica muito o trabalho do LLM.
Existe também um método de raciocínio eficaz chamado aprendizagem contextual, que também pode mitigar eficazmente as alucinações.
Além disso, outra técnica de eliminação de alucinações aplicada no GameGPT envolve a geração de um conjunto de trechos de código K para cada tarefa.
Esses trechos de código são então testados em um ambiente virtual e apresentados ao usuário ao mesmo tempo. Tanto o processo de teste quanto o feedback do usuário são usados para identificar e eliminar trechos de código problemáticos, deixando apenas a opção mais viável para executar. Esta abordagem também ajuda a reduzir ainda mais a ocorrência de alucinações.
Além disso, os pesquisadores têm uma biblioteca interna com um grande número de trechos de código projetados para o desenvolvimento de jogos. Cada trecho de código é comentado por um rotulador, fornecendo uma descrição clara de sua finalidade pretendida.
Para resumir, a fim de tornar o código não redundante e não alucinante, os desenvolvedores fizeram dois preparativos, de antemão e no evento.
Ao mesmo tempo, a biblioteca mencionada acima também é um recurso valioso para ajustar o modelo. Revisão e melhoria de código Depois que o agente do mecanismo de jogo gera o código, o agente de revisão de código executa uma revisão completa da base de código.
O agente realiza uma avaliação completa em um esforço para identificar quaisquer casos que possam se desviar da solicitação original, ou alucinações inesperadas no código.
Após uma revisão completa, o agente pode não apenas sinalizar possíveis diferenças, mas também fornecer sugestões para melhorar o código, resultando em uma versão mais razoável.
Após o processo de revisão, o código modificado, bem como o feedback do agente, serão compartilhados com o engenheiro do mecanismo de jogo, o agente e o usuário através da interface front-end. Se o usuário considerar necessário, ele pode fornecer sugestões de modificação de código diretamente através da interface front-end.
Essas recomendações são então passadas para o agente de revisão de código, que as avalia e mescla seletivamente para gerar ainda mais uma abordagem colaborativa e iterativa para aprimorar o código.
Finalmente, uma vez que o código é gerado e tudo é feito, a responsabilidade recai sobre o agente de teste do motor de jogo, que é responsável pela execução do código gerado.
Nesta fase, o agente também segue a sequência de execução estabelecida na fase anterior.
O processo de execução específico envolve enviar o código de cada tarefa individual para o motor de jogo, executá-lo e rastreá-lo continuamente durante a execução, gerando logs.
Depois de concluir todas as tarefas especificadas na sequência de execução, o agente mescla todos os logs gerados ao longo da execução.
O resultado é um resumo conciso e abrangente que é apresentado ao usuário através de uma interface front-end.
Além disso, o agente do engenheiro de testes identifica e relata a ocorrência de qualquer retrocesso observado durante a execução. Esses backtraces servem como indicadores-chave de que a IA faz ajustes adicionais no processo de execução ou código, permitindo que todo o processo seja refinado e ajudando a produzir um produto final perfeito.
Finalmente, vejamos a fórmula da estrutura para vários agentes trabalhando ao mesmo tempo:
Primeiro, no GameGPT, cada agente tem um sistema de memória privada, e eles têm acesso a conteúdo público compartilhado para obter as informações necessárias para orientar seu processo de tomada de decisão.
Para o agente i com o passo de tempo t, este processo pode ser expresso como:
onde pθi corresponde ao LLM ou modelo de perito relacionado ao agente i, Oit representa a saída ou entrega do agente i no passo t, e Mit e Pt referem-se a todas as memórias privadas e registros públicos necessários dentro do passo de tempo t, respectivamente.
Devido às peculiaridades da indústria de desenvolvimento de jogos e às limitações do modelo de linguagem grande, a presença de vários agentes com diferentes papéis no GameGPT é crucial.
Dado que os ciclos de desenvolvimento de jogos geralmente duram meses, confiar em um único agente com memória abrangente e informações contextuais pode reduzir muito a eficiência dos modelos de linguagem, incluindo LLM.
À medida que os projetos se tornam mais complexos ao longo do tempo, essa abordagem apresenta desafios de escalabilidade. Além disso, dada a limitação no número de tags manipuladas pelo LLM, não é prático usar um agente separado com memória total em grandes projetos de desenvolvimento de jogos.
Além disso, os problemas inerentes, como alucinações e redundância, observados em LLMs destacam a importância da colaboração entre múltiplos agentes, especialmente aqueles com papéis críticos.
Esta colaboração é significativa para mitigar os desafios colocados pelas ilusões e redundância do LLM.
Como resultado, o GameGPT utiliza uma variedade de funções diferentes para facilitar sua operação, incluindo responsabilidades ao longo do ciclo de desenvolvimento do jogo.
Essas funções incluem o designer de conteúdo de jogo, gerente de desenvolvimento de jogos, auditor de programas, engenheiro de desenvolvimento de jogos, auditor de tarefas, bem como engenheiro de mecanismo de jogo, auditor de código e engenheiro de teste de mecanismo de jogo mencionados acima.
Ao longo do processo de desenvolvimento do jogo, cada personagem assume tarefas diferentes.
Recursos:
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
GameGPT entra na produção de jogos! Jogos totalmente gerados automaticamente, o tempo pode ser reduzido em cem vezes
Fonte original: Shin Ji Yuan
Surpreendente! A árvore de habilidades GPT cresceu novamente, e agora você pode até fazer o jogo diretamente!?
Você sabe, a era atual não é mais a era do passado em que você pode aproveitar o mercado fazendo um pequeno jogo. O processo de desenvolvimento de jogos de hoje é super complexo.
Comecemos pela mão de obra, o pessoal de cada equipa de jogo é contado em dezenas ou até centenas. Alguém é responsável pela programação, alguém é responsável pela arte, alguém é responsável pela manutenção, e assim por diante.
Cada jogo também tem uma enorme base de código e biblioteca de materiais.
Como resultado, desenvolver um grande jogo requer muitas pessoas e muito tempo para ser concluído. E este período de tempo é muitas vezes de vários anos.
A equipe do jogo desenvolveu uma obra-prima que as pessoas vão se lembrar e amar, e o orçamento vai ultrapassar US $ 100 milhões.
Caso contrário, a produção de jogos é uma espécie de eletricidade gerada com amor.
Agora, as coisas mudaram!
Os pesquisadores desenvolveram um modelo chamado GameGPT, que pode integrar vários agentes de IA para automatizar alguns dos processos no desenvolvimento de jogos.
E diferentes agentes desempenham as suas próprias funções e trabalham de forma ordenada.
Existem agentes responsáveis por rever o plano de design do jogo e fazer as modificações e ajustes correspondentes; Alguns são responsáveis por traduzir tarefas em código concreto; Alguns são responsáveis por verificar o código gerado na etapa anterior e revisar os resultados em execução; Há também agentes responsáveis por verificar se todo o trabalho atende às expectativas iniciais.
Os pesquisadores dizem que o GameGPT pode simplificar alguns dos aspetos repetitivos e rígidos do processo tradicional de desenvolvimento de jogos, como testes de código.
Um grande número de desenvolvedores pode ser libertado do complicado trabalho de inspeção e se concentrar em links de projeto mais desafiadores que não podem ser substituídos por IA.
É evidente que este documento se encontra ainda numa fase relativamente preliminar. Não existem resultados concretos ou experiências que demonstrem melhorias de desempenho.
Em outras palavras, ninguém realmente desenvolveu um jogo com o GameGPT, e o modelo ainda está na fase conceitual, e é difícil de avaliar até que haja resultados de aplicação específicos e dados quantificáveis.
No entanto, é sempre uma direção para trabalhar.
Alguns internautas disseram que as ideias das pessoas sobre LLM são um pouco tendenciosas. Agora, os pesquisadores têm uma ferramenta que resolve 100% dos problemas de PNL, enquanto as pessoas só se preocupam em automatizar certos fluxos de trabalho.
Por exemplo, imagine se o mundo do jogo reagisse às suas decisões mais normalmente do que você poderia julgar em cinco minutos como um mecanismo baseado em regras e codificado.
Imagine se um jogo pudesse improvisar missões secundárias para você com base nas decisões que você toma (como matar aleatoriamente inimigos que você vê ao longo do caminho, etc.).
Quando os desenvolvedores criam um sistema desse tipo, eles usam engenharia de dicas para guiar o LLM em vez de codificar essas coisas.
No entanto, o objetivo disso não é economizar custos, mas fazer jogos em uma fase em que não era possível fazer mais jogos antes (não é um pouco bobo).
GameGPT
Primeiro, vamos dar uma olhada na grande estrutura do modelo GameGPT - todo o processo.
No lado esquerdo do processo está o lado do usuário, que é inserido no GameGPT, e então o gerente de desenvolvimento e revisão fazem o planejamento preliminar.
Os requisitos são então enviados para engenheiros de desenvolvimento, bem como engenheiros de motores de jogos, para executar tarefas específicas e gerar código.
Por fim, verifique se há omissões, envie-as de volta para o lado esquerdo e corra novamente. Caso contrário, continue à direita e o engenheiro responsável pela inspeção realizará o teste.
**Jogo de desenvolvimento de IA? **
Na verdade, os rudimentos da história dos jogos desenvolvidos com IA podem voltar ainda mais longe.
A aplicação da IA no desenvolvimento de jogos pode ser rastreada até jogos clássicos como StarCraft e Diablo. Na época, os desenvolvedores precisavam de sistemas de IA para criar mundos e personagens virtuais interativos.
Estes sistemas tornaram-se padrão para o desenvolvimento dessas plataformas interativas.
As primeiras pesquisas relacionadas à IA no desenvolvimento de jogos enfatizaram o controle de personagens não-jogadores (NPCs), e com o desenvolvimento da tecnologia de processamento de linguagem natural (NLP), houve algum trabalho pioneiro usando técnicas de aprendizagem profunda para gerar níveis.
Uma das obras-primas é MarioGPT, que gerou com sucesso alguns dos níveis em Super Mario Bros através de um modelo GPT-2 ajustado.
LLM fez grandes avanços este ano, com bons resultados em PNL e visão computacional (CV).
Sabemos que a formação em LLM é um processo de várias etapas. A fase inicial consiste na formação destes modelos num corpus extenso, facilitando a aquisição de competências linguísticas básicas.
Isso é seguido por uma etapa mais importante, que é ajustar o modelo gerando dados de várias tarefas de PNL por meio de instruções. Este ajuste de instrução aumenta a capacidade de generalização do modelo em uma ampla gama de aplicações, permitindo que o LLM alcance um desempenho livre de erros em tarefas que não foram executadas em treinamentos anteriores.
Finalmente, a etapa Human Feedback Reinforcement Learning (RLHF) garante a integridade estrutural e a confiabilidade do modelo.
Além disso, os avanços no LLM promoveram a automação de agentes no processo de desenvolvimento de software. Muitos estudos têm se concentrado na questão de como desenvolver um agente baseado em LLM que pode executar diferentes tarefas.
Por exemplo, o AutoGPT usou agentes LLM para lidar com certas tarefas de tomada de decisão no mundo real, enquanto o HuggingGPT usou um único LLM como controlador para coordenar tarefas de IA mais complexas.
Embora esses métodos dependam de um único agente LLM, todos eles adicionam um revisor (o revisor no fluxograma acima) para melhorar a decisão.
Ou tome o AutoGPT como exemplo, o modelo receberá algumas opiniões auxiliares do aluno supervisionado para melhorar seu próprio desempenho, e o HuggingGPT também pode ser conectado ao GPT-4 para fazer um revisor para avaliar a precisão da tomada de decisão.
Existem outros exemplos, como o MetaGPT, que introduz uma estrutura multiagente que pode ser usada para automatizar o desenvolvimento de vários softwares.
Voltando ao desenvolvimento de jogos que discutimos hoje, precisamos saber que, ao contrário do desenvolvimento de software geral, a indústria de desenvolvimento de jogos precisa acompanhar as tendências, então todo o processo de desenvolvimento deve ser mais preciso e conciso para alcançar a melhor eficiência.
Além disso, ajustar e usar um único LLM para servir todo o ciclo de desenvolvimento de jogos sem ilusões e alta precisão é impraticável e caro.
Portanto, a estrutura da IA de desenvolvimento de jogos requer a participação de vários revisores, o que pode efetivamente aliviar as tendências alucinatórias inerentes aos modelos de linguagem.
Os pesquisadores também descobriram que os modelos de linguagem têm outra limitação no desenvolvimento de jogos – redundância. LLM pode gerar tarefas desnecessárias, não informativas ou trechos de código quando o jogo é construído.
Para resolver eficazmente o problema da ilusão e redundância, o protagonista de hoje, GameGPT, estrategicamente adota uma variedade de abordagens para o problema, incluindo colaboração dupla, ajustes de instrução através de vocabulários internos e dissociação de código.
Vale a pena notar que a dupla colaboração envolve a interação entre LLM e pequenos modelos de deep learning, bem como a participação colaborativa entre o agente responsável pela execução e o agente revisor.
Os pesquisadores dizem que essas sinergias se mostraram eficazes para mitigar a ilusão e redundância do GameGPT.
Introdução ao método
Em seguida, os pesquisadores dissecaram a inovação do GameGPT de todo o processo.
Em primeiro lugar, durante a fase de design do jogo, depois de receber uma solicitação do usuário, as tarefas do GameGPT incluem gerar um plano de desenvolvimento para todo o jogo. Esta fase de planejamento é uma das principais etapas que afeta muito o progresso contínuo de todo o processo de desenvolvimento.
Esta fase é planeada por um gestor de desenvolvimento de jogos baseado em LLM, que elabora um plano inicial e depois o divide numa lista de tarefas.
Vale a pena notar que, devido às limitações inerentes ao LLM, este plano inicial muitas vezes apresenta alucinações, resultando em tarefas inesperadas, incluindo tarefas desinformativas ou desnecessariamente redundantes.
Para abordar essas questões, os pesquisadores propuseram quatro estratégias que poderiam mitigar esses desafios que eram ortogonais entre si e poderiam ser realizadas em camadas para melhores resultados.
Cenário um: Categorize as solicitações recebidas para identificar o tipo de jogo. Atualmente, a estrutura GameGPT suporta o desenvolvimento de cinco gêneros de jogos diferentes, a saber: ação, estratégia, RPG, simulação e aventura.
Para cada tipo, os pesquisadores fornecem modelos de planejamento padronizados que guiam os agentes do gerente de desenvolvimento de jogos através dos modelos com informações relevantes.
Ao adotar esta abordagem, a frequência de tarefas redundantes é significativamente reduzida, enquanto a probabilidade de ocorrência de alucinações.
Estratégia dois: envolve o envolvimento do agente examinador do programa, que é outro agente baseado em LLM. Este agente opera com um design cuidadoso para fornecer uma revisão abrangente do plano de missão.
Seu principal objetivo é minimizar a ocorrência de alucinações e redundância. Este programa de avaliação de agentes fornece feedback para melhorar e aumentar sua precisão, eficiência e simplicidade.
Ao mesmo tempo, as instruções geradas nesta parte podem ser usadas como novas entradas para o agente do gerente de desenvolvimento de jogos, tornando o plano de tarefas mais preciso e perfeito.
Estratégia 3: Ajuste o LLM em si do agente do gerente de desenvolvimento de jogos através de instruções especiais para planejar melhor o nível de desenvolvimento do jogo. O objetivo deste processo de ajuste fino é permitir que o modelo produza um plano que seja preciso e conciso.
Por conveniência, a equipe de pesquisa coletou e integrou um conjunto de dados interno que incluiu muitas combinações de entradas e saídas. Embora essas combinações não estejam de acordo com o formato padrão em comprimento ou estrutura, todas elas giram em torno dos requisitos do desenvolvimento de jogos.
Ao adotar essa abordagem, os pesquisadores efetivamente preencheram a lacuna entre as habilidades gerais de linguagem do LLM e as habilidades de planejamento de desenvolvimento de jogos.
Estratégia 4: "Rede de segurança" na fase de planeamento. Durante todo o processo de planejamento, o Game Development Manager Agent sempre compartilha os resultados intermediários com o usuário na interface front-end, permitindo que o resto dos agentes saiba a todo momento qual desenvolvimento está em andamento.
Para melhorar isso, os pesquisadores integraram uma abordagem interativa que permite aos usuários revisar, corrigir e melhorar ativamente os planos com base em suas expectativas. Esta abordagem também garante a consistência entre o plano de design e as necessidades do usuário.
Com essas estratégias fora do caminho, vamos dar uma olhada nas vantagens do GameGPT.
Assim, para garantir a precisão nesta fase, os pesquisadores criaram um agente chamado engenheiro de desenvolvimento de jogos. O agente consiste em dois modelos que trabalham juntos para participar do processo de classificação de tarefas.
Esta abordagem colaborativa melhora a precisão e a eficácia da identificação de tarefas. Ao mesmo tempo, a fim de evitar o aparecimento de ilusões LLM e melhorar a precisão da classificação de tarefas, os pesquisadores forneceram uma lista de tipos de tarefas que podem aparecer no desenvolvimento de jogos.
Para melhor classificar isso, eles adotaram o modelo BERT.
O modelo BERT foi totalmente treinado com um conjunto de dados interno. Este conjunto de dados contém itens de dados adaptados à tarefa de desenvolvimento do jogo. A entrada é extraída de uma lista predeterminada e a saída corresponde à categoria especificada da tarefa.
A revisão dos tipos de tarefas e parâmetros é realizada nesta etapa, e um agente chamado revisor de tarefas é introduzido, que é o principal responsável pela identificação de cada categoria e se os parâmetros são razoáveis.
O processo de revisão inclui a revisão se o tipo de tarefa está dentro de um intervalo predeterminado e se é a tarefa mais adequada. Ao mesmo tempo, ele também verifica a lista de parâmetros para ver se ela está alinhada com a tarefa.
Em alguns cenários, como algumas situações baseadas em informações contextuais da tarefa, ou onde a solicitação do usuário não pode ser inferida parâmetros, o GameGPT adota uma abordagem proativa para resolvê-los.
O revisor atrai a atenção do usuário iniciando um prompt na interface front-end e solicitando informações adicionais necessárias para os parâmetros.
O benefício desta abordagem interativa é que garante a integridade dos detalhes do argumento, mesmo quando o raciocínio automático é insuficiente.
Além disso, há outro agente responsável por identificar dependências entre tarefas e construir um diagrama que encapsula essas relações. Depois que o gráfico é estabelecido, um algoritmo é usado para percorrer e filtrar o gráfico, resultando em uma ordem de execução de tarefa definida.
Este processo garante que o modelo possa ser executado de forma ordenada e sistemática de acordo com as dependências da tarefa, resultando num processo de desenvolvimento coerente e estruturado.
Outro problema é que usar LLM para gerar código longo traz maiores alucinações e o risco de redundância. Para resolver este problema, os pesquisadores introduziram um novo método para dissociar o código que aparece no design de jogos, simplificando o processo de raciocínio do LLM, mitigando assim muito as alucinações e redundância.
Essa abordagem também não é difícil de entender - os pesquisadores dividirão o script esperado em muitos trechos de código mais curtos para o LLM processar. Este método de dissociação simplifica muito o trabalho do LLM.
Existe também um método de raciocínio eficaz chamado aprendizagem contextual, que também pode mitigar eficazmente as alucinações.
Além disso, outra técnica de eliminação de alucinações aplicada no GameGPT envolve a geração de um conjunto de trechos de código K para cada tarefa.
Além disso, os pesquisadores têm uma biblioteca interna com um grande número de trechos de código projetados para o desenvolvimento de jogos. Cada trecho de código é comentado por um rotulador, fornecendo uma descrição clara de sua finalidade pretendida.
Para resumir, a fim de tornar o código não redundante e não alucinante, os desenvolvedores fizeram dois preparativos, de antemão e no evento.
Ao mesmo tempo, a biblioteca mencionada acima também é um recurso valioso para ajustar o modelo. Revisão e melhoria de código Depois que o agente do mecanismo de jogo gera o código, o agente de revisão de código executa uma revisão completa da base de código.
O agente realiza uma avaliação completa em um esforço para identificar quaisquer casos que possam se desviar da solicitação original, ou alucinações inesperadas no código.
Após uma revisão completa, o agente pode não apenas sinalizar possíveis diferenças, mas também fornecer sugestões para melhorar o código, resultando em uma versão mais razoável.
Após o processo de revisão, o código modificado, bem como o feedback do agente, serão compartilhados com o engenheiro do mecanismo de jogo, o agente e o usuário através da interface front-end. Se o usuário considerar necessário, ele pode fornecer sugestões de modificação de código diretamente através da interface front-end.
Essas recomendações são então passadas para o agente de revisão de código, que as avalia e mescla seletivamente para gerar ainda mais uma abordagem colaborativa e iterativa para aprimorar o código.
Finalmente, uma vez que o código é gerado e tudo é feito, a responsabilidade recai sobre o agente de teste do motor de jogo, que é responsável pela execução do código gerado.
Nesta fase, o agente também segue a sequência de execução estabelecida na fase anterior.
O processo de execução específico envolve enviar o código de cada tarefa individual para o motor de jogo, executá-lo e rastreá-lo continuamente durante a execução, gerando logs.
Depois de concluir todas as tarefas especificadas na sequência de execução, o agente mescla todos os logs gerados ao longo da execução.
O resultado é um resumo conciso e abrangente que é apresentado ao usuário através de uma interface front-end.
Além disso, o agente do engenheiro de testes identifica e relata a ocorrência de qualquer retrocesso observado durante a execução. Esses backtraces servem como indicadores-chave de que a IA faz ajustes adicionais no processo de execução ou código, permitindo que todo o processo seja refinado e ajudando a produzir um produto final perfeito.
Finalmente, vejamos a fórmula da estrutura para vários agentes trabalhando ao mesmo tempo:
Primeiro, no GameGPT, cada agente tem um sistema de memória privada, e eles têm acesso a conteúdo público compartilhado para obter as informações necessárias para orientar seu processo de tomada de decisão.
Para o agente i com o passo de tempo t, este processo pode ser expresso como:
Devido às peculiaridades da indústria de desenvolvimento de jogos e às limitações do modelo de linguagem grande, a presença de vários agentes com diferentes papéis no GameGPT é crucial.
Dado que os ciclos de desenvolvimento de jogos geralmente duram meses, confiar em um único agente com memória abrangente e informações contextuais pode reduzir muito a eficiência dos modelos de linguagem, incluindo LLM.
À medida que os projetos se tornam mais complexos ao longo do tempo, essa abordagem apresenta desafios de escalabilidade. Além disso, dada a limitação no número de tags manipuladas pelo LLM, não é prático usar um agente separado com memória total em grandes projetos de desenvolvimento de jogos.
Além disso, os problemas inerentes, como alucinações e redundância, observados em LLMs destacam a importância da colaboração entre múltiplos agentes, especialmente aqueles com papéis críticos.
Esta colaboração é significativa para mitigar os desafios colocados pelas ilusões e redundância do LLM.
Como resultado, o GameGPT utiliza uma variedade de funções diferentes para facilitar sua operação, incluindo responsabilidades ao longo do ciclo de desenvolvimento do jogo.
Essas funções incluem o designer de conteúdo de jogo, gerente de desenvolvimento de jogos, auditor de programas, engenheiro de desenvolvimento de jogos, auditor de tarefas, bem como engenheiro de mecanismo de jogo, auditor de código e engenheiro de teste de mecanismo de jogo mencionados acima.
Ao longo do processo de desenvolvimento do jogo, cada personagem assume tarefas diferentes.
Recursos: