1.AI Agent é uma ferramenta baseada no modelo geral de grande porte do LLM, para desenvolvedores e usuários criarem diretamente aplicativos que podem interagir de forma independente.
2.AI O principal padrão do futuro da pista pode ser: "modelo grande geral + aplicação pendente"; O nicho ecológico do AI Agent é o middleware que conecta o modelo grande geral e o Dapp, então o AI Agent tem um fosso baixo, e é necessário construir efeitos de rede e melhorar a aderência do usuário para melhorar a competitividade a longo prazo.
3. Este artigo analisa o desenvolvimento de "modelos grandes gerais, agentes de aplicativos pendentes e aplicativos de IA generativa" na trilha de jogos Web3. Entre eles, combinado com a tecnologia de IA generativa, tem grande potencial para acertar o jogo no curto prazo.
01 Resumo Técnico
Na explosiva tecnologia AGI (Inteligência Geral Artificial) de inteligência artificial deste ano, o Large Language Model (LLM) é o protagonista absoluto. Os principais tecnólogos da OpenAI, Andrej Karpathy e Lilian Weng, também disseram que os agentes de IA baseados em LLM são a próxima direção de desenvolvimento importante no campo da AGI, e muitas equipes também estão desenvolvendo sistemas de agentes de IA orientados por LLM (AI-Agents). Em termos simples, um AI Agent é um programa de computador que usa grandes quantidades de dados e algoritmos complexos para simular o pensamento humano e o processo de tomada de decisão, a fim de executar várias tarefas e interações, como direção autônoma, reconhecimento de fala e estratégia de jogo. A imagem de Abacus.ai introduz claramente o princípio básico do AI Agent, e as etapas são as seguintes:
Perceção e recolha de dados: Entrada de dados, ou AI Agent através de sistemas de perceção (sensores, câmaras, microfones, etc.) para obter informações e dados, tais como estado do jogo, imagens, som, etc. **
Representação do Estado: Os dados precisam ser processados e representados de uma forma que o Agente possa entender, como sendo convertidos em vetores ou tensores, para que possam ser facilmente inseridos em uma rede neural. **
Modelos de redes neurais: Os modelos de redes neurais profundas são comumente usados para a tomada de decisões e aprendizagem, como redes neurais convolucionais (CNNs) para processamento de imagens, redes neurais recorrentes (RNNs) para processamento de dados de sequência, ou modelos mais avançados, como mecanismos de auto-atenção (Transformers). **
Aprendizagem por reforço: Os agentes aprendem as melhores estratégias de ação através da interação com o ambiente. Além disso, os princípios operacionais do agente incluem estratégia de networking, rede de valor, treinamento e otimização, e exploração e utilização. Por exemplo, no cenário de jogo, a rede de estratégia pode inserir o estado do jogo e, em seguida, produzir a distribuição de probabilidade de ação; A rede de valores é capaz de estimar o valor do estado; Os agentes podem reforçar continuamente os algoritmos de aprendizagem, interagindo com o ambiente para otimizar políticas e redes de valor e produzir melhores resultados. **
Em resumo, os AI-Agents são entidades inteligentes que entendem, decidem e agem, e podem desempenhar um papel importante em uma variedade de campos, incluindo jogos. "LLM Powered Autonomous Agents" da técnica central da OpenAI Lilian Weng fornece uma introdução muito abrangente aos princípios dos AI-Agents, incluindo um experimento muito interessante: Agentes Generativos.
Generative Agents (GA) é inspirado nos jogos The Sims, que usa a tecnologia LLM para gerar 25 personagens virtuais, cada um controlado por um agente movido a LLM, vivendo e interagindo em um ambiente sandbox. O GA é inteligentemente projetado para combinar LLM com recursos de memória, planejamento e reflexão, o que permite que os programas de agentes tomem decisões com base na experiência anterior e interajam com outros agentes.
O artigo detalha como o Agente treina e otimiza continuamente os caminhos de decisão com base em redes de políticas, redes de valor e interações com o ambiente.
O princípio é o seguinte: onde Memory Stream (Memory Stram) é um módulo de memória de longo prazo que registra todas as experiências de interação do agente. O modelo Retrieve fornece Memórias Recuperadas com base na relevância, frescura e importância para ajudar o agente a tomar uma decisão. O mecanismo de reflexão resume eventos passados e orienta as ações futuras do agente. Planear e Refletir trabalham em conjunto para ajudar os agentes a traduzir a reflexão e a informação ambiental em atos acionáveis.
Este interessante experimento nos mostra as capacidades dos agentes de IA, como gerar novos comportamentos sociais, disseminação de informações, memória relacional (como dois personagens virtuais continuando a discutir um tópico) e coordenação de atividades sociais (como realizar uma festa e convidar outros personagens virtuais), e assim por diante. Em suma, AI-Agent é uma ferramenta muito interessante, e sua aplicação em jogos vale a pena explorar em profundidade.
02 Tendências tecnológicas
2.1 AI Acompanhe Tendências
Lao Bai, sócio de pesquisa de investimentos da ABCDE, resumiu certa vez o julgamento da comunidade de capital de risco do Vale do Silício sobre o próximo desenvolvimento da IA:
**Nenhum modelo vertical, apenas modelo grande + aplicação vertical; **
Os dados em dispositivos de borda, como telefones celulares, podem ser uma barreira, e a IA baseada em dispositivos de borda também pode ser uma oportunidade; **
O comprimento do contexto pode causar mudanças qualitativas no futuro (bancos de dados vetoriais são agora usados como memória de IA, mas o comprimento do contexto ainda não é suficiente). **
**Ou seja, do ponto de vista da lei geral de desenvolvimento da indústria, porque o modo de modelo de modelo geral de grande escala é muito pesado e tem forte universalidade, não há necessidade de construir rodas constantemente no campo de modelos gerais de grande escala, mas deve se concentrar mais na aplicação de modelos gerais de grande escala para o campo de pendentes. **
Ao mesmo tempo, dispositivos de borda referem-se a dispositivos finais que geralmente não dependem de centros de computação em nuvem ou servidores remotos, mas conduzem o processamento de dados e a tomada de decisões localmente. Devido à diversidade de dispositivos de borda, como implantar agentes de IA para executar em dispositivos e obter dados de dispositivos corretamente é um desafio, mas também é uma nova oportunidade.
Finalmente, a questão do Contexto também atraiu muita atenção. Simplificando, o contexto no contexto LLM pode ser entendido como a quantidade de informação, e a extensão do contexto pode ser entendida como quantas dimensões os dados têm. Suponha que você tenha um modelo de big data de um site de comércio eletrônico que é usado para prever a probabilidade de um usuário comprar um determinado produto. Nesse caso, o contexto pode incluir informações como o histórico de navegação do usuário, histórico de compras, histórico de pesquisa, atributos do usuário e assim por diante. O comprimento do contexto refere-se à dimensão da sobreposição de informações de recursos, como o histórico de compras de produtos concorrentes de usuários do sexo masculino de 30 anos em Xangai, a frequência de compras recentes e o histórico de navegação recente. O aumento da extensão do contexto pode ajudar o modelo a compreender de forma mais abrangente os fatores que influenciam a decisão de compra do usuário.
O consenso atual é que, embora o uso atual de bancos de dados vetoriais como memória da IA torne o comprimento do contexto insuficiente, o comprimento do contexto mudará qualitativamente no futuro, e o modelo pós-LLM pode buscar métodos mais avançados para processar e entender informações de contexto mais longas e complexas. Outros cenários de aplicação além da imaginação surgiram.
2.2 Tendências do AI Agent
A Folius Ventures resumiu o modelo de aplicação do AI Agent na trilha do jogo, como mostrado abaixo:
A Figura 1 é o modelo LLM, que é o principal responsável por converter a intenção do usuário da entrada tradicional de teclado/clique para entrada em linguagem natural, reduzindo a barreira de entrada para os usuários.
A Figura 2 é um Dapp front-end integrado com um AI Agent que fornece aos usuários serviços funcionais enquanto coleta hábitos e dados do usuário do terminal.
Os 3 na figura são vários agentes de IA, que podem existir diretamente na forma de funções no aplicativo, bots, etc.
Em geral, como uma ferramenta baseada em código, o AI Agent pode atuar como o programa subjacente para Dapps estender a funcionalidade do aplicativo e como um catalisador de crescimento para a plataforma, ou seja, middleware que conecta grandes modelos e aplicativos verticais.
Em termos de cenários de usuário, o Dapp mais provável para integrar o AI Agent provavelmente estará aberto o suficiente para aplicativos sociais, chatbots e jogos; Ou transformar o portal de tráfego Web2 existente numa entrada AI+web3 mais simples e acessível através do AI Agent; Ou seja, a indústria tem discutido para baixar o limiar de utilizadores Web3.
Com base na lei de desenvolvimento da indústria, a camada de middleware na qual o AI Agent está localizado muitas vezes se torna uma pista altamente competitiva com quase nenhum fosso. Portanto, além de melhorar continuamente a experiência para atender às necessidades do B2C, os agentes de IA podem melhorar seus fossos criando efeitos de rede ou criando aderência do usuário.
03 Mapa da Faixa
Houve várias tentativas diferentes de aplicações de IA em jogos Web3, que podem ser agrupadas nas seguintes categorias:
Modelos gerais: Alguns projetos se concentram na construção de modelos gerais de IA, encontrando arquiteturas de redes neurais adequadas e modelos gerais para as necessidades dos projetos Web3. **
Aplicativos verticais: Os aplicativos pendentes são projetados para resolver problemas específicos em jogos ou fornecer serviços específicos, geralmente na forma de agentes, bots e botKits. **
**Aplicação de IA Generativa: A aplicação mais direta correspondente ao modelo grande é a geração de conteúdo, e a pista de jogo em si é a indústria de conteúdo, então a aplicação de IA Generativa no campo do jogo é muito digna de atenção. Desde a geração automática de elementos, personagens, missões ou enredos no mundo virtual, até à geração automática de estratégias de jogo, decisões e até à evolução automática da ecologia do jogo, tornou-se possível, tornando o jogo mais diversificado e profundo. **
4.AI jogos: Atualmente, já existem muitos jogos que integram a tecnologia de IA e têm diferentes cenários de aplicação, que serão ilustrados abaixo. **
3.1 Modelo Grande Universal
Atualmente, a Web3 já possui modelos de simulação para design de modelos econômicos e desenvolvimento ecológico econômico, como o modelo de token quantitativo QTM. O Dr. Achim Struve da Outlier Venture mencionou algumas ideias para o design de modelos econômicos em sua palestra na ETHCC. Por exemplo, considerando a robustez do sistema econômico, a equipe do projeto pode criar um gêmeo digital Digital Twin através do modelo LLM para simular todo o ecossistema 1:1.
O QTM (Quantized Token Model) na figura abaixo é um modelo de inferência orientado por IA. O QTM usa um tempo de simulação fixo de 10 anos, com cada passo de tempo medindo um mês. No início de cada etapa temporal, os tokens são emitidos para o ecossistema, então há módulos de incentivo, módulos de aquisição de tokens, módulos de airdrop, etc. no modelo. Esses tokens serão então descartados em vários metabuckets, a partir dos quais ocorrerá uma redistribuição de utilidade generalizada mais granular. Em seguida, defina pagamentos de recompensas, etc. a partir dessas ferramentas utilitárias. Além disso, como os negócios off-chain, isso também leva em conta a situação geral de financiamento do negócio, como a possibilidade de destruição ou recompra, e também pode medir a adoção do usuário ou definir a adoção do usuário.
Claro, a qualidade de saída do modelo depende da qualidade da entrada, por isso, antes de usar QTM, é necessário fazer pesquisa de mercado suficiente para obter informações de entrada mais precisas. No entanto, o modelo QTM já é uma aplicação muito prática do modelo orientado por IA no modelo econômico Web3, e existem muitas partes de projeto baseadas no modelo QTM para fazer aplicações 2C/2B com menor dificuldade de operação, reduzindo o limiar para as partes do projeto usarem.
3.2 Agente de Aplicação Pendente
As aplicações pendentes existem principalmente na forma de agentes, que podem ser Bots, BotKits, assistentes virtuais, sistemas inteligentes de apoio à decisão, várias ferramentas automatizadas de processamento de dados, e assim por diante. De um modo geral, o AI Agent toma o modelo geral da OpenAI como base, combina outras tecnologias de código aberto ou auto-desenvolvidas, como text-to-speech (TTS), etc., e adiciona dados específicos para o FineTune (uma técnica de treinamento no campo do aprendizado de máquina e deep learning, o principal objetivo é otimizar ainda mais um modelo que foi pré-treinado em dados em larga escala) para criar um Agente de IA que tenha um desempenho melhor do que o ChatGPT em um campo específico.
Atualmente, a aplicação mais madura da pista de jogo Web3 é o NFT Agent. O consenso na pista de jogos é que os NFTs devem ser uma parte importante dos jogos Web3.
Com o desenvolvimento da tecnologia de gerenciamento de metadados no ecossistema Ethereum, surgiram NFTs dinâmicos programáveis. Para os criadores de NFTs, eles podem tornar a funcionalidade NFT mais flexível. Para os usuários, pode haver mais interação entre usuários e NFTs, e os dados de interação gerados se tornaram uma fonte de informação. O AI Agent pode otimizar o processo de interação e expandir os cenários de aplicação de dados de interação, injetando mais inovação e valor no ecossistema NFT.
Caso 1: Por exemplo, a estrutura de desenvolvimento da Gelato permite que os desenvolvedores personalizem a lógica para atualizar metadados NFT com base em eventos off-chain ou intervalos de tempo específicos. Os nós Gelato acionarão alterações de metadados quando certas condições forem atendidas, permitindo atualizações automáticas de NFTs on-chain. Por exemplo, essa tecnologia pode ser usada para buscar dados de partidas em tempo real de APIs esportivas e atualizar automaticamente as características de habilidade do NFT sob certas condições, como quando um atleta vence uma partida.
Caso 2: Paima também fornece um agente de aplicação para NFT dinâmico. O protocolo de compressão NFT da Paima cunha um conjunto de NFTs mínimos em L1 e depois os evolui com base no estado do jogo em L2, proporcionando aos jogadores uma experiência de jogo mais profunda e interativa. Por exemplo, os NFTs podem mudar de acordo com fatores como os pontos de experiência do personagem, conclusão da missão, equipamento e assim por diante.
Caso 3: Mudulas Labs é um projeto ZKML muito conhecido, que também tem um layout na pista NFT. Mudulas lançou a série NFT zkMon, que permite que o NFT seja gerado através de IA e publicado na cadeia, enquanto gera um zkp, através do qual os usuários podem verificar se seu NFT é gerado a partir do modelo de IA correspondente. Para obter informações mais abrangentes, consulte: Capítulo 7.2: Os 1º NFTs zkGAN do mundo.
3.3 Aplicações de IA generativa
Como mencionado anteriormente, como o jogo em si é uma indústria de conteúdo, o AI-Agent pode gerar uma grande quantidade de conteúdo em um curto espaço de tempo e a baixo custo, incluindo a criação de personagens de jogo incertos e dinâmicos e assim por diante. Assim, a IA generativa é perfeita para aplicações de jogos. Atualmente, a aplicação da IA Generativa no campo dos jogos pode ser resumida nos seguintes tipos principais:
**Classe de personagem de jogo gerada por IA: como jogar contra IA, ou IA é responsável por simular e controlar NPCs no jogo, ou até mesmo usar diretamente IA para gerar personagens. **
**Classe de conteúdo de jogo gerado por IA: Vários conteúdos gerados diretamente pela IA, como missões, histórias, adereços, mapas, etc. **
**Classe de cena de jogo gerada por IA: suporta automaticamente o uso, otimização ou expansão do terreno, paisagem e atmosfera do mundo do jogo com IA. **
3.3.1 Funções geradas por IA
Caso 1: MyShell
MyShell é uma plataforma de criação de bots que permite aos usuários criar seus próprios bots para conversar, praticar a fala, jogar e até mesmo procurar aconselhamento de acordo com suas necessidades. Enquanto isso, o Myshell usa a tecnologia text-to-speech (TTS), que cria automaticamente um bot que imita a voz de qualquer pessoa em apenas alguns segundos. Além disso, o MyShell usa Auto, que permite aos usuários instruir modelos LLM apenas descrevendo suas ideias, estabelecendo a base para modelos privados de grandes linguagens (LLM).
Os usuários do Myshell dizem que seu recurso de bate-papo por voz é muito suave, mais rápido do que o bate-papo por voz do GPT e o Live2D.
Caso 2: AI Arena**
AI Arena é um jogo de batalha de IA onde os usuários podem usar o modelo LLM para treinar continuamente seus próprios Elfos de Batalha (NFTs) e, em seguida, enviar os Feiticeiros de Batalha treinados para as batalhas de campo de batalha PvP/PvE. O modo de batalha é semelhante ao Nintendo Star Smash Bros., mas com treinamento de IA adicionando mais diversão competitiva.
A Paradigm liderou o investimento na AI Arena, que agora começou na fase beta aberta, onde os jogadores podem entrar no jogo gratuitamente ou comprar NFTs para aumentar a intensidade do treinamento.
Estudo de Caso 3: Leela vs o Mundo**
Leela vs the World é um jogo de xadrez desenvolvido pela Mudulas Labs. No jogo, os dois lados do jogo são IA e pessoas, e a situação do jogo de xadrez é colocada no contrato. Os jogadores operam (interagem com contratos) através das suas carteiras. A IA lê a nova situação do jogo de xadrez, faz um julgamento e gera zkp para todo o processo de cálculo, ambos concluídos na Nuvem AWS, e o zkp é verificado pelo contrato na cadeia e, após a verificação bem-sucedida, o contrato de xadrez é chamado para "jogar xadrez".
3.3.2 Conteúdo de jogo gerado por IA
Caso 1: AI Town
AI Town é uma colaboração entre a a16z e sua empresa de portfólio, Convex Dev, inspirada no artigo Generative Agent da Universidade de Stanford. AI Town é uma cidade virtual onde cada IA dentro da cidade pode construir sua própria história com base em interações e experiências.
Isso usa pilhas de tecnologia, como a estrutura sem servidor de back-end Convex, armazenamento vetorial Pinecone, autenticação de Clerk, geração de texto em linguagem natural OpenAI e implantação do Fly. Além disso, o AI Town é todo de código aberto e permite que os desenvolvedores do jogo personalizem vários componentes, incluindo dados de recursos, tabelas de sprite, ambiente visual do Tilemap, prompts de geração de texto, regras e lógica do jogo e muito mais. Além dos jogadores regulares que podem experimentar AI Town, os desenvolvedores também podem usar o código-fonte para desenvolver uma variedade de recursos dentro e até mesmo fora do jogo, e essa flexibilidade torna AI Town adequado para uma variedade de diferentes tipos de aplicativos.
Portanto, AI Town em si é um jogo de conteúdo gerado por IA, mas também é uma ecologia de desenvolvimento e até mesmo uma ferramenta de desenvolvimento.
Caso 2: Paulo
Paul é um gerador de histórias de IA especializado em fornecer um caminho de solução para jogos de cadeia completa para gerar histórias de IA e ir diretamente para a cadeia. A lógica de implementação é inserir um grande número de regras anteriores para LLM, e então o jogador pode gerar automaticamente conteúdo secundário com base nas regras.
Existe atualmente um protocolo de jogo Straylight publicado usando Paul Seidler, Straylight é um jogo NFT multiplayer, a jogabilidade principal é a versão de jogo de cadeia completa de "Minecraft", os jogadores podem automaticamente Mint NFT, e então construir seu próprio mundo de acordo com as regras básicas de entrada de modelo.
3.3.3 Cenas de jogo geradas por IA
Caso 1: Pahdo Labs
Pahdo Labs é um estúdio de desenvolvimento de jogos atualmente trabalhando em Halcyon Zero, um anime, fantasia, RPG e plataforma de criação de jogos online construído no motor Godot. O jogo se passa em um mundo de fantasia etéreo centrado em torno de uma cidade movimentada que serve como um centro social.
O que torna este jogo muito especial é que os jogadores podem usar as ferramentas de criação de IA fornecidas pelo jogo para criar rapidamente mais fundos de efeitos 3D e trazer seus personagens favoritos para o jogo, que realmente fornece ferramentas e cenas de jogo para o popular jogo UGC.
Caso 2: Kaedim
A Kaedim desenvolveu uma ferramenta de geração de modelos 3D baseada em IA generativa para o Game Studio, que pode ajudar rapidamente o Game Studio a gerar cenas/ativos 3D no jogo que atendam às suas necessidades. O produto geral da Kaedim ainda está em desenvolvimento e deve estar disponível para o Game Studio em 2024.
A lógica central dos produtos Kaedim é exatamente a mesma do AI-Agent, usando um modelo grande geral como base, e então os artistas dentro da equipe continuarão a inserir bons dados e, em seguida, feedback a saída do Agente, treinar continuamente o Modelo através de aprendizado de máquina e, finalmente, deixar o AI-Agent produzir cenas 3D que atendam aos requisitos.
04 Resumo
Neste artigo, fizemos uma análise detalhada e um resumo da aplicação da IA no campo dos jogos. Em geral, haverá projetos de unicórnio estrela no futuro de modelos gerais e a aplicação de IA generativa em jogos. Embora o fosso de aplicações pendentes seja baixo, a vantagem do pioneiro é forte, e se a vantagem do pioneiro puder ser confiada para criar efeitos de rede e melhorar a aderência do usuário, o espaço de imaginação é enorme. Além disso, a IA generativa é naturalmente adequada para a indústria de conteúdo de jogos, e já existem muitas equipes tentando a aplicação de GA em jogos, e este ciclo é muito provável que pareça um jogo popular usando GA.
Além de algumas das direções mencionadas no artigo, existem outros ângulos de exploração no futuro. Como o quê:
(1) Data track + application layer: A trilha de dados de IA deu origem a alguns projetos unicórnios avaliados em bilhões de dólares, e a vinculação de dados + camada de aplicação também está cheia de imaginação.
(2) Integração com a Socialfi: como proporcionar formas inovadoras de interação social; Use o AI Agent para otimizar a autenticação de identidade da comunidade e a governança da comunidade; Ou recomendações personalizadas mais inteligentes, etc.
(3) Com a automação e maturidade dos agentes, os principais participantes do Mundo Autônomo serão pessoas ou bots? É possível que o mundo autônomo na cadeia possa ser como o Uniswap, onde 80% + das DAUs são bots? Se assim for, então os agentes de governança combinados com os conceitos de governança da Web3 também merecem ser explorados.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
AI Agents redefine o caminho para a inovação em jogos Web3
Principais informações
1.AI Agent é uma ferramenta baseada no modelo geral de grande porte do LLM, para desenvolvedores e usuários criarem diretamente aplicativos que podem interagir de forma independente. 2.AI O principal padrão do futuro da pista pode ser: "modelo grande geral + aplicação pendente"; O nicho ecológico do AI Agent é o middleware que conecta o modelo grande geral e o Dapp, então o AI Agent tem um fosso baixo, e é necessário construir efeitos de rede e melhorar a aderência do usuário para melhorar a competitividade a longo prazo. 3. Este artigo analisa o desenvolvimento de "modelos grandes gerais, agentes de aplicativos pendentes e aplicativos de IA generativa" na trilha de jogos Web3. Entre eles, combinado com a tecnologia de IA generativa, tem grande potencial para acertar o jogo no curto prazo.
01 Resumo Técnico
Na explosiva tecnologia AGI (Inteligência Geral Artificial) de inteligência artificial deste ano, o Large Language Model (LLM) é o protagonista absoluto. Os principais tecnólogos da OpenAI, Andrej Karpathy e Lilian Weng, também disseram que os agentes de IA baseados em LLM são a próxima direção de desenvolvimento importante no campo da AGI, e muitas equipes também estão desenvolvendo sistemas de agentes de IA orientados por LLM (AI-Agents). Em termos simples, um AI Agent é um programa de computador que usa grandes quantidades de dados e algoritmos complexos para simular o pensamento humano e o processo de tomada de decisão, a fim de executar várias tarefas e interações, como direção autônoma, reconhecimento de fala e estratégia de jogo. A imagem de Abacus.ai introduz claramente o princípio básico do AI Agent, e as etapas são as seguintes:
Em resumo, os AI-Agents são entidades inteligentes que entendem, decidem e agem, e podem desempenhar um papel importante em uma variedade de campos, incluindo jogos. "LLM Powered Autonomous Agents" da técnica central da OpenAI Lilian Weng fornece uma introdução muito abrangente aos princípios dos AI-Agents, incluindo um experimento muito interessante: Agentes Generativos.
Generative Agents (GA) é inspirado nos jogos The Sims, que usa a tecnologia LLM para gerar 25 personagens virtuais, cada um controlado por um agente movido a LLM, vivendo e interagindo em um ambiente sandbox. O GA é inteligentemente projetado para combinar LLM com recursos de memória, planejamento e reflexão, o que permite que os programas de agentes tomem decisões com base na experiência anterior e interajam com outros agentes.
O artigo detalha como o Agente treina e otimiza continuamente os caminhos de decisão com base em redes de políticas, redes de valor e interações com o ambiente.
O princípio é o seguinte: onde Memory Stream (Memory Stram) é um módulo de memória de longo prazo que registra todas as experiências de interação do agente. O modelo Retrieve fornece Memórias Recuperadas com base na relevância, frescura e importância para ajudar o agente a tomar uma decisão. O mecanismo de reflexão resume eventos passados e orienta as ações futuras do agente. Planear e Refletir trabalham em conjunto para ajudar os agentes a traduzir a reflexão e a informação ambiental em atos acionáveis.
Este interessante experimento nos mostra as capacidades dos agentes de IA, como gerar novos comportamentos sociais, disseminação de informações, memória relacional (como dois personagens virtuais continuando a discutir um tópico) e coordenação de atividades sociais (como realizar uma festa e convidar outros personagens virtuais), e assim por diante. Em suma, AI-Agent é uma ferramenta muito interessante, e sua aplicação em jogos vale a pena explorar em profundidade.
02 Tendências tecnológicas
2.1 AI Acompanhe Tendências
Lao Bai, sócio de pesquisa de investimentos da ABCDE, resumiu certa vez o julgamento da comunidade de capital de risco do Vale do Silício sobre o próximo desenvolvimento da IA:
**Ou seja, do ponto de vista da lei geral de desenvolvimento da indústria, porque o modo de modelo de modelo geral de grande escala é muito pesado e tem forte universalidade, não há necessidade de construir rodas constantemente no campo de modelos gerais de grande escala, mas deve se concentrar mais na aplicação de modelos gerais de grande escala para o campo de pendentes. **
Ao mesmo tempo, dispositivos de borda referem-se a dispositivos finais que geralmente não dependem de centros de computação em nuvem ou servidores remotos, mas conduzem o processamento de dados e a tomada de decisões localmente. Devido à diversidade de dispositivos de borda, como implantar agentes de IA para executar em dispositivos e obter dados de dispositivos corretamente é um desafio, mas também é uma nova oportunidade.
Finalmente, a questão do Contexto também atraiu muita atenção. Simplificando, o contexto no contexto LLM pode ser entendido como a quantidade de informação, e a extensão do contexto pode ser entendida como quantas dimensões os dados têm. Suponha que você tenha um modelo de big data de um site de comércio eletrônico que é usado para prever a probabilidade de um usuário comprar um determinado produto. Nesse caso, o contexto pode incluir informações como o histórico de navegação do usuário, histórico de compras, histórico de pesquisa, atributos do usuário e assim por diante. O comprimento do contexto refere-se à dimensão da sobreposição de informações de recursos, como o histórico de compras de produtos concorrentes de usuários do sexo masculino de 30 anos em Xangai, a frequência de compras recentes e o histórico de navegação recente. O aumento da extensão do contexto pode ajudar o modelo a compreender de forma mais abrangente os fatores que influenciam a decisão de compra do usuário.
O consenso atual é que, embora o uso atual de bancos de dados vetoriais como memória da IA torne o comprimento do contexto insuficiente, o comprimento do contexto mudará qualitativamente no futuro, e o modelo pós-LLM pode buscar métodos mais avançados para processar e entender informações de contexto mais longas e complexas. Outros cenários de aplicação além da imaginação surgiram.
2.2 Tendências do AI Agent
A Folius Ventures resumiu o modelo de aplicação do AI Agent na trilha do jogo, como mostrado abaixo:
A Figura 1 é o modelo LLM, que é o principal responsável por converter a intenção do usuário da entrada tradicional de teclado/clique para entrada em linguagem natural, reduzindo a barreira de entrada para os usuários.
A Figura 2 é um Dapp front-end integrado com um AI Agent que fornece aos usuários serviços funcionais enquanto coleta hábitos e dados do usuário do terminal.
Os 3 na figura são vários agentes de IA, que podem existir diretamente na forma de funções no aplicativo, bots, etc.
Em geral, como uma ferramenta baseada em código, o AI Agent pode atuar como o programa subjacente para Dapps estender a funcionalidade do aplicativo e como um catalisador de crescimento para a plataforma, ou seja, middleware que conecta grandes modelos e aplicativos verticais.
Em termos de cenários de usuário, o Dapp mais provável para integrar o AI Agent provavelmente estará aberto o suficiente para aplicativos sociais, chatbots e jogos; Ou transformar o portal de tráfego Web2 existente numa entrada AI+web3 mais simples e acessível através do AI Agent; Ou seja, a indústria tem discutido para baixar o limiar de utilizadores Web3.
Com base na lei de desenvolvimento da indústria, a camada de middleware na qual o AI Agent está localizado muitas vezes se torna uma pista altamente competitiva com quase nenhum fosso. Portanto, além de melhorar continuamente a experiência para atender às necessidades do B2C, os agentes de IA podem melhorar seus fossos criando efeitos de rede ou criando aderência do usuário.
03 Mapa da Faixa
Houve várias tentativas diferentes de aplicações de IA em jogos Web3, que podem ser agrupadas nas seguintes categorias:
3.1 Modelo Grande Universal
Atualmente, a Web3 já possui modelos de simulação para design de modelos econômicos e desenvolvimento ecológico econômico, como o modelo de token quantitativo QTM. O Dr. Achim Struve da Outlier Venture mencionou algumas ideias para o design de modelos econômicos em sua palestra na ETHCC. Por exemplo, considerando a robustez do sistema econômico, a equipe do projeto pode criar um gêmeo digital Digital Twin através do modelo LLM para simular todo o ecossistema 1:1.
O QTM (Quantized Token Model) na figura abaixo é um modelo de inferência orientado por IA. O QTM usa um tempo de simulação fixo de 10 anos, com cada passo de tempo medindo um mês. No início de cada etapa temporal, os tokens são emitidos para o ecossistema, então há módulos de incentivo, módulos de aquisição de tokens, módulos de airdrop, etc. no modelo. Esses tokens serão então descartados em vários metabuckets, a partir dos quais ocorrerá uma redistribuição de utilidade generalizada mais granular. Em seguida, defina pagamentos de recompensas, etc. a partir dessas ferramentas utilitárias. Além disso, como os negócios off-chain, isso também leva em conta a situação geral de financiamento do negócio, como a possibilidade de destruição ou recompra, e também pode medir a adoção do usuário ou definir a adoção do usuário.
Claro, a qualidade de saída do modelo depende da qualidade da entrada, por isso, antes de usar QTM, é necessário fazer pesquisa de mercado suficiente para obter informações de entrada mais precisas. No entanto, o modelo QTM já é uma aplicação muito prática do modelo orientado por IA no modelo econômico Web3, e existem muitas partes de projeto baseadas no modelo QTM para fazer aplicações 2C/2B com menor dificuldade de operação, reduzindo o limiar para as partes do projeto usarem.
3.2 Agente de Aplicação Pendente
As aplicações pendentes existem principalmente na forma de agentes, que podem ser Bots, BotKits, assistentes virtuais, sistemas inteligentes de apoio à decisão, várias ferramentas automatizadas de processamento de dados, e assim por diante. De um modo geral, o AI Agent toma o modelo geral da OpenAI como base, combina outras tecnologias de código aberto ou auto-desenvolvidas, como text-to-speech (TTS), etc., e adiciona dados específicos para o FineTune (uma técnica de treinamento no campo do aprendizado de máquina e deep learning, o principal objetivo é otimizar ainda mais um modelo que foi pré-treinado em dados em larga escala) para criar um Agente de IA que tenha um desempenho melhor do que o ChatGPT em um campo específico.
Atualmente, a aplicação mais madura da pista de jogo Web3 é o NFT Agent. O consenso na pista de jogos é que os NFTs devem ser uma parte importante dos jogos Web3.
Com o desenvolvimento da tecnologia de gerenciamento de metadados no ecossistema Ethereum, surgiram NFTs dinâmicos programáveis. Para os criadores de NFTs, eles podem tornar a funcionalidade NFT mais flexível. Para os usuários, pode haver mais interação entre usuários e NFTs, e os dados de interação gerados se tornaram uma fonte de informação. O AI Agent pode otimizar o processo de interação e expandir os cenários de aplicação de dados de interação, injetando mais inovação e valor no ecossistema NFT.
Caso 1: Por exemplo, a estrutura de desenvolvimento da Gelato permite que os desenvolvedores personalizem a lógica para atualizar metadados NFT com base em eventos off-chain ou intervalos de tempo específicos. Os nós Gelato acionarão alterações de metadados quando certas condições forem atendidas, permitindo atualizações automáticas de NFTs on-chain. Por exemplo, essa tecnologia pode ser usada para buscar dados de partidas em tempo real de APIs esportivas e atualizar automaticamente as características de habilidade do NFT sob certas condições, como quando um atleta vence uma partida.
Caso 2: Paima também fornece um agente de aplicação para NFT dinâmico. O protocolo de compressão NFT da Paima cunha um conjunto de NFTs mínimos em L1 e depois os evolui com base no estado do jogo em L2, proporcionando aos jogadores uma experiência de jogo mais profunda e interativa. Por exemplo, os NFTs podem mudar de acordo com fatores como os pontos de experiência do personagem, conclusão da missão, equipamento e assim por diante.
Caso 3: Mudulas Labs é um projeto ZKML muito conhecido, que também tem um layout na pista NFT. Mudulas lançou a série NFT zkMon, que permite que o NFT seja gerado através de IA e publicado na cadeia, enquanto gera um zkp, através do qual os usuários podem verificar se seu NFT é gerado a partir do modelo de IA correspondente. Para obter informações mais abrangentes, consulte: Capítulo 7.2: Os 1º NFTs zkGAN do mundo.
3.3 Aplicações de IA generativa
Como mencionado anteriormente, como o jogo em si é uma indústria de conteúdo, o AI-Agent pode gerar uma grande quantidade de conteúdo em um curto espaço de tempo e a baixo custo, incluindo a criação de personagens de jogo incertos e dinâmicos e assim por diante. Assim, a IA generativa é perfeita para aplicações de jogos. Atualmente, a aplicação da IA Generativa no campo dos jogos pode ser resumida nos seguintes tipos principais:
3.3.1 Funções geradas por IA
Caso 1: MyShell
MyShell é uma plataforma de criação de bots que permite aos usuários criar seus próprios bots para conversar, praticar a fala, jogar e até mesmo procurar aconselhamento de acordo com suas necessidades. Enquanto isso, o Myshell usa a tecnologia text-to-speech (TTS), que cria automaticamente um bot que imita a voz de qualquer pessoa em apenas alguns segundos. Além disso, o MyShell usa Auto, que permite aos usuários instruir modelos LLM apenas descrevendo suas ideias, estabelecendo a base para modelos privados de grandes linguagens (LLM).
Os usuários do Myshell dizem que seu recurso de bate-papo por voz é muito suave, mais rápido do que o bate-papo por voz do GPT e o Live2D.
Caso 2: AI Arena**
AI Arena é um jogo de batalha de IA onde os usuários podem usar o modelo LLM para treinar continuamente seus próprios Elfos de Batalha (NFTs) e, em seguida, enviar os Feiticeiros de Batalha treinados para as batalhas de campo de batalha PvP/PvE. O modo de batalha é semelhante ao Nintendo Star Smash Bros., mas com treinamento de IA adicionando mais diversão competitiva.
A Paradigm liderou o investimento na AI Arena, que agora começou na fase beta aberta, onde os jogadores podem entrar no jogo gratuitamente ou comprar NFTs para aumentar a intensidade do treinamento.
Estudo de Caso 3: Leela vs o Mundo**
Leela vs the World é um jogo de xadrez desenvolvido pela Mudulas Labs. No jogo, os dois lados do jogo são IA e pessoas, e a situação do jogo de xadrez é colocada no contrato. Os jogadores operam (interagem com contratos) através das suas carteiras. A IA lê a nova situação do jogo de xadrez, faz um julgamento e gera zkp para todo o processo de cálculo, ambos concluídos na Nuvem AWS, e o zkp é verificado pelo contrato na cadeia e, após a verificação bem-sucedida, o contrato de xadrez é chamado para "jogar xadrez".
3.3.2 Conteúdo de jogo gerado por IA
Caso 1: AI Town
AI Town é uma colaboração entre a a16z e sua empresa de portfólio, Convex Dev, inspirada no artigo Generative Agent da Universidade de Stanford. AI Town é uma cidade virtual onde cada IA dentro da cidade pode construir sua própria história com base em interações e experiências.
Isso usa pilhas de tecnologia, como a estrutura sem servidor de back-end Convex, armazenamento vetorial Pinecone, autenticação de Clerk, geração de texto em linguagem natural OpenAI e implantação do Fly. Além disso, o AI Town é todo de código aberto e permite que os desenvolvedores do jogo personalizem vários componentes, incluindo dados de recursos, tabelas de sprite, ambiente visual do Tilemap, prompts de geração de texto, regras e lógica do jogo e muito mais. Além dos jogadores regulares que podem experimentar AI Town, os desenvolvedores também podem usar o código-fonte para desenvolver uma variedade de recursos dentro e até mesmo fora do jogo, e essa flexibilidade torna AI Town adequado para uma variedade de diferentes tipos de aplicativos.
Portanto, AI Town em si é um jogo de conteúdo gerado por IA, mas também é uma ecologia de desenvolvimento e até mesmo uma ferramenta de desenvolvimento.
Caso 2: Paulo
Paul é um gerador de histórias de IA especializado em fornecer um caminho de solução para jogos de cadeia completa para gerar histórias de IA e ir diretamente para a cadeia. A lógica de implementação é inserir um grande número de regras anteriores para LLM, e então o jogador pode gerar automaticamente conteúdo secundário com base nas regras.
Existe atualmente um protocolo de jogo Straylight publicado usando Paul Seidler, Straylight é um jogo NFT multiplayer, a jogabilidade principal é a versão de jogo de cadeia completa de "Minecraft", os jogadores podem automaticamente Mint NFT, e então construir seu próprio mundo de acordo com as regras básicas de entrada de modelo.
3.3.3 Cenas de jogo geradas por IA
Caso 1: Pahdo Labs
Pahdo Labs é um estúdio de desenvolvimento de jogos atualmente trabalhando em Halcyon Zero, um anime, fantasia, RPG e plataforma de criação de jogos online construído no motor Godot. O jogo se passa em um mundo de fantasia etéreo centrado em torno de uma cidade movimentada que serve como um centro social.
O que torna este jogo muito especial é que os jogadores podem usar as ferramentas de criação de IA fornecidas pelo jogo para criar rapidamente mais fundos de efeitos 3D e trazer seus personagens favoritos para o jogo, que realmente fornece ferramentas e cenas de jogo para o popular jogo UGC.
Caso 2: Kaedim
A Kaedim desenvolveu uma ferramenta de geração de modelos 3D baseada em IA generativa para o Game Studio, que pode ajudar rapidamente o Game Studio a gerar cenas/ativos 3D no jogo que atendam às suas necessidades. O produto geral da Kaedim ainda está em desenvolvimento e deve estar disponível para o Game Studio em 2024.
A lógica central dos produtos Kaedim é exatamente a mesma do AI-Agent, usando um modelo grande geral como base, e então os artistas dentro da equipe continuarão a inserir bons dados e, em seguida, feedback a saída do Agente, treinar continuamente o Modelo através de aprendizado de máquina e, finalmente, deixar o AI-Agent produzir cenas 3D que atendam aos requisitos.
04 Resumo
Neste artigo, fizemos uma análise detalhada e um resumo da aplicação da IA no campo dos jogos. Em geral, haverá projetos de unicórnio estrela no futuro de modelos gerais e a aplicação de IA generativa em jogos. Embora o fosso de aplicações pendentes seja baixo, a vantagem do pioneiro é forte, e se a vantagem do pioneiro puder ser confiada para criar efeitos de rede e melhorar a aderência do usuário, o espaço de imaginação é enorme. Além disso, a IA generativa é naturalmente adequada para a indústria de conteúdo de jogos, e já existem muitas equipes tentando a aplicação de GA em jogos, e este ciclo é muito provável que pareça um jogo popular usando GA.
Além de algumas das direções mencionadas no artigo, existem outros ângulos de exploração no futuro. Como o quê:
(1) Data track + application layer: A trilha de dados de IA deu origem a alguns projetos unicórnios avaliados em bilhões de dólares, e a vinculação de dados + camada de aplicação também está cheia de imaginação.
(2) Integração com a Socialfi: como proporcionar formas inovadoras de interação social; Use o AI Agent para otimizar a autenticação de identidade da comunidade e a governança da comunidade; Ou recomendações personalizadas mais inteligentes, etc.
(3) Com a automação e maturidade dos agentes, os principais participantes do Mundo Autônomo serão pessoas ou bots? É possível que o mundo autônomo na cadeia possa ser como o Uniswap, onde 80% + das DAUs são bots? Se assim for, então os agentes de governança combinados com os conceitos de governança da Web3 também merecem ser explorados.