GameGPT entre dans la production de jeux ! Jeux entièrement générés automatiquement, le temps peut être réduit au centuple

2023-10-27 02:58:38

Source originale : Shin Ji Yuan

Source de l’image : Généré par Unbounded AI

Stupéfiant! L’arbre de compétences GPT s’est à nouveau agrandi, et maintenant vous pouvez même jouer directement !?

Vous savez, l’ère actuelle n’est plus l’ère du passé où vous pouviez vous emparer du marché en faisant un petit jeu. Le processus de développement de jeux d’aujourd’hui est très complexe.

Commençons par la main-d’œuvre, le personnel de chaque équipe de jeu se compte en dizaines, voire en centaines. Quelqu’un est responsable de la programmation, quelqu’un est responsable de l’art, quelqu’un est responsable de l’entretien, et ainsi de suite.

Chaque jeu dispose également d’une énorme base de code et d’une bibliothèque de matériaux.

Par conséquent, le développement d’un grand jeu nécessite beaucoup de personnes et beaucoup de temps. Et cette période est souvent de plusieurs années.

Plus intuitivement, c’est de l’argent.

L’équipe du jeu a développé un chef-d’œuvre dont les gens se souviendront et qu’ils aimeront, et le budget dépassera les 100 millions de dollars.

Sinon, la production de jeux est une sorte d’électricité générée par l’amour.

Aujourd’hui, les choses ont changé !

Les chercheurs ont développé un modèle appelé GameGPT, qui peut intégrer plusieurs agents d’IA pour automatiser certains des processus de développement de jeux.

Et différents agents accomplissent leurs propres tâches et travaillent de manière ordonnée.

Il y a des agents chargés d’examiner le plan de conception du jeu et d’apporter les modifications et ajustements correspondants ; Certains sont chargés de traduire les tâches en code concret ; Certains sont chargés de vérifier le code généré à l’étape précédente et d’examiner les résultats en cours d’exécution ; Il y a aussi des agents chargés de vérifier que tous les travaux répondent aux attentes initiales.

De cette façon, en affinant et en décomposant le flux de travail, GameGPT peut simplifier le travail des agents d’IA. Ce type de performance est plus efficace et beaucoup plus simple à réaliser qu’un agent tout-puissant qui fait tout.

Les chercheurs affirment que GameGPT peut simplifier certains des aspects répétitifs et rigides du processus de développement de jeux traditionnel, tels que les tests de code.

Un grand nombre de développeurs peuvent être libérés du travail d’inspection compliqué et se concentrer sur des liens de conception plus difficiles qui ne peuvent pas être remplacés par l’IA.

Bien entendu, cet article n’en est encore qu’à un stade relativement préliminaire. Il n’y a pas de résultats concrets ou d’expériences pour démontrer des améliorations de performance.

En d’autres termes, personne n’a réellement développé de jeu avec GameGPT, et le modèle est encore au stade conceptuel, et il est difficile à évaluer tant qu’il n’y a pas de résultats d’application spécifiques et de données quantifiables.

Cependant, il s’agit toujours d’une direction sur laquelle travailler.

Certains internautes ont déclaré que les idées des gens sur le LLM sont quelque peu biaisées. Maintenant, les chercheurs ont un outil qui résout 100% des problèmes de NLP, alors que les gens ne se soucient que d’automatiser certains flux de travail.

Par exemple, imaginez que le monde du jeu réagisse à vos décisions plus normalement que vous ne pourriez en juger en cinq minutes en tant que moteur codé en dur et basé sur des règles.

Imaginez si un jeu pouvait improviser des quêtes secondaires pour vous en fonction des décisions que vous prenez (comme massacrer au hasard les ennemis que vous voyez en cours de route, etc.).

Lorsque les développeurs créent un tel système, ils utilisent l’ingénierie des indices pour guider le LLM au lieu de coder ces choses.

Cependant, le but n’est pas de réduire les coûts, mais de faire des jeux à un stade où il n’était pas possible de faire plus de jeux auparavant (n’est-ce pas un peu une bouchée).

GameGPT

Tout d’abord, jetons un coup d’œil au cadre général du modèle GameGPT - l’ensemble du processus.

Comme vous pouvez le voir, l’auteur personnifie chaque agent, montrant de manière plus vivante comment ils s’acquittent de leurs fonctions respectives.

À l’extrême gauche du processus se trouve le côté utilisateur, qui est entré dans GameGPT, puis le responsable du développement et l’examen font une planification préliminaire.

Les exigences sont ensuite envoyées aux ingénieurs de développement, ainsi qu’aux ingénieurs du moteur de jeu, pour effectuer des tâches spécifiques et générer du code.

Enfin, vérifiez s’il y a des omissions, renvoyez-les sur le côté gauche et relancez-les. Si ce n’est pas le cas, continuez vers la droite et l’ingénieur en charge de l’inspection effectuera le test.

**Jeu de développement d’IA ?? **

En fait, les rudiments de l’histoire des jeux développés par l’IA remontent peut-être encore plus loin.

L’application de l’IA dans le développement de jeux remonte à des jeux classiques tels que StarCraft et Diablo. À l’époque, les développeurs avaient besoin de systèmes d’IA pour créer des mondes virtuels et des personnages interactifs.

Ces systèmes sont devenus la norme pour le développement de telles plates-formes interactives.

Les premières recherches liées à l’IA dans le développement de jeux ont mis l’accent sur le contrôle des personnages non-joueurs (PNJ), et avec le développement de la technologie de traitement du langage naturel (NLP), il y a eu des travaux pionniers utilisant des techniques d’apprentissage profond pour générer des niveaux.

L’un des chefs-d’œuvre est MarioGPT, qui a généré avec succès certains des niveaux de Super Mario Bros. grâce à un modèle GPT-2 affiné.

LLM a fait de grands progrès cette année, avec de bons résultats à la fois en NLP et en vision par ordinateur (CV).

Nous savons que la formation LLM est un processus en plusieurs étapes. La phase initiale consiste à former ces modèles dans un corpus étendu, facilitant l’acquisition des compétences linguistiques de base.

Ceci est suivi d’une étape plus importante, qui consiste à affiner le modèle en générant des données à partir de diverses tâches NLP via des instructions. Cet ajustement d’instruction améliore la capacité de généralisation du modèle dans un large éventail d’applications, ce qui permet à LLM d’obtenir des performances sans erreur dans des tâches qui n’ont pas été effectuées lors de l’entraînement précédent.

Enfin, l’étape de Human Feedback Reinforcement Learning (RLHF) garantit l’intégrité structurelle et la fiabilité du modèle.

Autre mise en garde ici : la scène RLHF permet au modèle de générer du contenu qui imite le style humain, améliorant ainsi sa polyvalence en tant qu’agent.

De plus, les progrès du LLM ont favorisé l’automatisation des agents dans le processus de développement logiciel. De nombreuses études se sont penchées sur la question de savoir comment développer un agent basé sur le LLM capable d’effectuer différentes tâches.

Par exemple, AutoGPT a utilisé des agents LLM pour gérer certaines tâches de prise de décision dans le monde réel, tandis que HuggingGPT a utilisé un seul LLM comme contrôleur pour coordonner des tâches d’IA plus complexes.

Bien que ces méthodes reposent sur un seul agent LLM, elles ajoutent toutes un réviseur (le réviseur dans l’organigramme ci-dessus) pour améliorer la décision.

Ou prenez AutoGPT comme exemple, le modèle obtiendra des opinions auxiliaires de l’apprenant supervisé pour améliorer ses propres performances, et HuggingGPT peut également être connecté à GPT-4 pour faire un réviseur pour évaluer la précision de la prise de décision.

Il existe d’autres exemples, tels que MetaGPT, qui introduit un cadre multi-agents qui peut être utilisé pour automatiser le développement de divers logiciels.

Pour en revenir au développement de jeux dont nous avons discuté aujourd’hui, nous devons savoir que, contrairement au développement de logiciels en général, l’industrie du développement de jeux doit suivre les tendances, de sorte que l’ensemble du processus de développement doit être plus précis et concis pour atteindre la meilleure efficacité.

De plus, il est peu pratique et coûteux de peaufiner et d’utiliser un seul LLM pour servir l’ensemble du cycle de développement du développement de jeux sans illusions et sans grande précision.

Par conséquent, le cadre de l’IA de développement de jeux nécessite la participation de plusieurs examinateurs, ce qui peut atténuer efficacement les tendances hallucinatoires inhérentes aux modèles de langage.

Les chercheurs ont également découvert que les modèles de langage ont une autre limite dans le développement de jeux : la redondance. LLM peut générer des tâches inutiles et non informatives ou des extraits de code lors de la création du jeu.

Pour résoudre efficacement le problème de l’illusion et de la redondance, le protagoniste d’aujourd’hui, GameGPT, adopte stratégiquement une variété d’approches du problème, notamment la double collaboration, le réglage des instructions par le biais de vocabulaires internes et le découplage du code.

Il convient de noter que la double collaboration implique l’interaction entre le LLM et les petits modèles d’apprentissage profond, ainsi que la participation collaborative entre l’agent responsable de l’exécution et l’agent réviseur.

Les chercheurs affirment que ces synergies se sont avérées efficaces pour atténuer l’illusion et la redondance de GameGPT.

Introduction à la méthode

Ensuite, les chercheurs ont disséqué l’innovation de GameGPT de l’ensemble du processus.

Tout d’abord, pendant la phase de conception du jeu, après avoir reçu une demande de l’utilisateur, les tâches de GameGPT incluent la génération d’un plan de développement pour l’ensemble du jeu. Cette phase de planification est l’une des étapes clés qui affecte grandement le déroulement sans faille de l’ensemble du processus de développement.

Cette phase est planifiée par un responsable du développement de jeux basé à LLM qui élabore un plan initial, puis le décompose en une liste de tâches.

Il convient de noter qu’en raison des limites inhérentes au LLM, ce plan initial présente souvent des hallucinations, entraînant des tâches inattendues, y compris des tâches non informatives ou inutilement redondantes.

Pour résoudre ces problèmes, les chercheurs ont proposé quatre stratégies qui pourraient atténuer ces défis qui étaient orthogonaux les uns aux autres et pouvaient être exécutées en couches pour de meilleurs résultats.

Premier scénario : Catégoriser les demandes entrantes afin d’identifier le type de jeu. Actuellement, le framework GameGPT prend en charge le développement de cinq genres de jeux différents, à savoir : l’action, la stratégie, le jeu de rôle, la simulation et l’aventure.

Pour chaque type, les chercheurs fournissent des modèles de planification standardisés qui guident les agents du responsable du développement de jeux à travers les modèles avec des informations pertinentes.

En adoptant cette approche, la fréquence des tâches redondantes est considérablement réduite, tandis que la probabilité d’hallucinations se produit.

Deuxième stratégie : implique la participation de l’agent examinateur de programme, qui est un autre agent de maîtrise en droit. Cet agent fonctionne avec une conception soignée pour fournir un examen complet du plan de mission.

Son objectif principal est de minimiser l’apparition d’hallucinations et la redondance. Ce programme d’évaluation des agents fournit un retour d’information pour améliorer et augmenter sa précision, son efficacité et sa simplicité.

Dans le même temps, les instructions générées dans cette partie peuvent être utilisées comme nouvelle entrée pour l’agent du responsable du développement du jeu, ce qui rend le plan de tâches plus précis et parfait.

Stratégie 3 : Ajustez le LLM lui-même de l’agent du responsable du développement du jeu à l’aide d’instructions spéciales pour mieux planifier au niveau du développement du jeu. Le but de ce processus de mise au point est de permettre au modèle de produire un plan à la fois précis et concis.

Pour plus de commodité, l’équipe de recherche a recueilli et intégré un ensemble de données interne qui comprenait de nombreuses combinaisons d’entrées et de sorties. Bien que ces combinaisons ne soient pas conformes au format standard en termes de longueur ou de structure, elles tournent toutes autour des exigences du développement de jeux.

Cette partie du mix fixe est fournie par les développeurs de l’industrie.

En adoptant cette approche, les chercheurs ont efficacement comblé le fossé entre les compétences linguistiques générales de LLM et les compétences en planification du développement de jeux.

Stratégie 4 : « Filet de sécurité » au stade de la planification. Tout au long du processus de planification, l’agent responsable du développement du jeu partage toujours les résultats intermédiaires avec l’utilisateur sur l’interface frontale, ce qui permet aux autres agents de savoir à tout moment quel développement est en cours.

Pour améliorer cela, les chercheurs ont intégré une approche interactive qui permet aux utilisateurs d’examiner, de corriger et d’améliorer activement les plans en fonction de leurs attentes. Cette approche garantit également une cohérence entre le plan de conception et les besoins de l’utilisateur.

Une fois ces stratégies à l’écart, jetons un coup d’œil aux avantages de GameGPT.

Tout d’abord, le processus de classification des tâches dans ce modèle nécessite une grande précision dans l’identification des types de tâches et de leurs paramètres correspondants.

Ainsi, pour garantir la précision à ce stade, les chercheurs ont créé un agent appelé ingénieur en développement de jeux. L’agent se compose de deux modèles qui fonctionnent ensemble pour participer au processus de classification des tâches.

Cette approche collaborative améliore la précision et l’efficacité de l’identification des tâches. Dans le même temps, afin d’éviter l’apparition d’illusions LLM et d’améliorer la précision de la classification des tâches, les chercheurs ont fourni une liste de types de tâches qui peuvent apparaître dans le développement de jeux.

Pour mieux classer cela, ils ont adopté le modèle BERT.

Le modèle BERT a été entièrement entraîné à l’aide d’un jeu de données interne. Ce jeu de données contient des éléments de données adaptés à la tâche de développement du jeu. L’entrée est tirée d’une liste prédéterminée et la sortie correspond à la catégorie spécifiée de la tâche.

L’examen des types de tâches et des paramètres est effectué à ce stade, et un agent appelé réviseur de tâches est introduit, qui est principalement responsable de l’identification de chaque catégorie et de la question de savoir si les paramètres sont raisonnables.

Le processus d’examen consiste à vérifier si le type de tâche se situe dans une plage prédéterminée et s’il s’agit de la tâche la plus appropriée. Dans le même temps, il vérifie également la liste des paramètres pour voir si elle s’aligne sur la tâche.

Dans certains scénarios, tels que certaines situations basées sur des informations contextuelles sur la tâche, ou lorsque la demande de l’utilisateur ne peut pas être déduite de paramètres, GameGPT adopte une approche proactive pour les résoudre.

Reviewer attire l’attention de l’utilisateur en lançant une invite sur l’interface frontale et en demandant des informations supplémentaires requises pour les paramètres.

L’avantage de cette approche interactive est qu’elle garantit l’intégrité des détails de l’argumentation même lorsque le raisonnement automatique est insuffisant.

En outre, il existe un autre agent chargé d’identifier les dépendances entre les tâches et de construire un diagramme qui encapsule ces relations. Une fois le graphe établi, un algorithme est utilisé pour parcourir et filtrer le graphique, ce qui permet d’obtenir un ordre d’exécution de tâche défini.

Ce processus garantit que le modèle peut être exécuté de manière ordonnée et systématique en fonction des dépendances de la tâche, ce qui se traduit par un processus de développement cohérent et structuré.

Un autre problème est que l’utilisation de LLM pour générer du code long entraîne de plus grandes hallucinations et un risque de redondance. Pour résoudre ce problème, les chercheurs ont introduit une nouvelle méthode pour découpler le code qui apparaît dans la conception de jeux, simplifiant ainsi le processus de raisonnement du LLM, atténuant ainsi considérablement les hallucinations et la redondance.

Cette approche n’est pas non plus difficile à comprendre - les chercheurs diviseront le script attendu en de nombreux extraits de code plus courts que LLM devra traiter. Cette méthode de découplage simplifie grandement le travail du LLM.

Il existe également une méthode de raisonnement efficace appelée apprentissage contextuel, qui peut également atténuer efficacement les hallucinations.

De plus, une autre technique d’élimination des hallucinations appliquée dans GameGPT consiste à générer un ensemble d’extraits de code K pour chaque tâche.

Ces extraits de code sont ensuite testés dans un environnement virtuel et présentés à l’utilisateur en même temps. Le processus de test et les commentaires des utilisateurs sont utilisés pour identifier et éliminer les extraits de code problématiques, ne laissant que l’option la plus viable à exécuter. Cette approche contribue également à réduire davantage l’apparition d’hallucinations.

De plus, les chercheurs disposent d’une bibliothèque interne avec un grand nombre d’extraits de code conçus pour le développement de jeux. Chaque extrait de code est commenté par un étiqueteur, qui fournit une description claire de l’usage auquel il est destiné.

Pour résumer, afin de rendre le code non redondant et non hallucinant, les développeurs ont fait deux préparations, en amont et en l’occurrence.

Dans le même temps, la bibliothèque mentionnée ci-dessus est également une ressource précieuse pour affiner le modèle. Révision et amélioration du code Une fois que l’agent du moteur de jeu a généré le code, l’agent de révision du code effectue un examen approfondi de la base de code.

L’agent procède à une évaluation approfondie dans le but d’identifier les cas qui pourraient s’écarter de la demande d’origine ou les hallucinations inattendues dans le code.

Après un examen approfondi, l’agent peut non seulement signaler les différences potentielles, mais également fournir des suggestions pour améliorer le code, ce qui permet d’obtenir une version plus raisonnable.

Après le processus de révision, le code modifié, ainsi que les commentaires de l’agent, seront partagés avec l’ingénieur du moteur de jeu, l’agent et l’utilisateur via l’interface frontale. Si l’utilisateur le juge nécessaire, il peut fournir des suggestions de modification de code directement via l’interface front-end.

Ces recommandations sont ensuite transmises à l’agent de revue de code, qui les évalue et les fusionne de manière sélective afin de générer une approche collaborative et itérative de l’amélioration du code.

Enfin, une fois que le code est généré et que tout est fait, la responsabilité incombe à l’agent de test du moteur de jeu, qui est responsable de l’exécution du code généré.

À ce stade, l’agent suit également la séquence d’exécution établie dans la phase précédente.

Le processus d’exécution spécifique consiste à envoyer le code de chaque tâche individuelle au moteur de jeu, à l’exécuter et à le suivre en continu pendant l’exécution, en générant des journaux.

Après avoir terminé toutes les tâches spécifiées dans la séquence d’exécution, l’agent fusionne tous les journaux générés tout au long de l’exécution.

Le résultat est un résumé concis et complet qui est présenté à l’utilisateur via une interface frontale.

De plus, l’agent de l’ingénieur d’essai identifie et signale l’occurrence de tout retour en arrière observé pendant l’exécution. Ces traces servent d’indicateurs clés indiquant que l’IA apporte d’autres ajustements au processus d’exécution ou au code, ce qui permet d’affiner l’ensemble du processus et de produire un produit final parfait.

Enfin, examinons la formule de l’infrastructure pour plusieurs agents travaillant en même temps :

Tout d’abord, dans GameGPT, chaque agent dispose d’un système de mémoire privé et a accès au contenu public partagé pour obtenir les informations nécessaires pour guider son processus de prise de décision.

Pour l’agent i avec pas de temps t, ce processus peut être exprimé comme suit :

où pθi correspond au LLM ou au modèle expert lié à l’agent i, Oit représente la sortie ou le livrable de l’agent i à l’intervalle de temps t, et Mit et Pt font référence à toutes les mémoires privées et à tous les enregistrements publics nécessaires dans l’intervalle de temps t, respectivement.

En raison des particularités de l’industrie du développement de jeux et des limites du grand modèle de langage, la présence de plusieurs agents ayant des rôles différents dans GameGPT est cruciale.

Étant donné que les cycles de développement de jeux durent souvent des mois, le fait de s’appuyer sur un seul agent disposant d’une mémoire complète et d’informations contextuelles peut réduire considérablement l’efficacité des modèles de langage, y compris le LLM.

À mesure que les projets deviennent plus complexes au fil du temps, cette approche présente des défis d’évolutivité. De plus, étant donné la limitation du nombre de balises gérées par LLM, il n’est pas pratique d’utiliser un agent séparé avec une mémoire complète dans les grands projets de développement de jeux.

De plus, les problèmes inhérents tels que les hallucinations et la redondance observés dans les LLM soulignent l’importance de la collaboration entre plusieurs agents, en particulier ceux qui jouent un rôle critique.

Cette collaboration est importante pour atténuer les défis posés par les illusions et la redondance du LLM.

En conséquence, GameGPT utilise une gamme de rôles différents pour faciliter son fonctionnement, y compris des responsabilités tout au long du cycle de développement du jeu.

Ces rôles incluent le concepteur de contenu de jeu, le responsable du développement de jeux, l’auditeur de programme, l’ingénieur de développement de jeux, l’auditeur de tâches, ainsi que l’ingénieur du moteur de jeu, l’auditeur de code et l’ingénieur de test du moteur de jeu mentionnés ci-dessus.

Tout au long du processus de développement du jeu, chaque personnage assume des tâches différentes.

Ressources:

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

1 J'aime

Récompense
1
Commentaire
Partager

Commentaire

0/400

Aucun commentaire

Rubrique
1/3
1Show My Alpha Points
10k Popularité
2Crypto Market Rebound
164k Popularité
3SEC Crypto Project
18k Popularité
4CandyDrop Airdrop Event 6.0
98k Popularité
5White House Crypto Report
82k Popularité

Épingler