En avril, peu de temps après que Baidu ait publié Wen Xin Yi Yan, de nombreuses personnes déploraient encore à quel point les images générées par Wen Xin Yi Yan étaient heureuses. Encore plus de gens étaient devenus fous de diverses formations telles que ChatGPT et Midjourney. réfléchit à l'opportunité de présenter les agents IA à des milliards de personnes dans le monde « d'une manière utile et significative ».
En mai, lorsque OpenAI a finalisé une nouvelle ronde de financement de 300 millions de dollars, le fondateur Sam Altman a déclaré en privé à certains développeurs qu'il espérait faire de ChatGPT un assistant de travail personnel. chatbots pour créer des agents IA autonomes, les fonctions associées sont susceptibles d'être déployées dans l'assistant ChatGPT.
Lors d'une réunion de tout le personnel en juin, Zuckerberg a annoncé une série de technologies à différents stades de développement, dont l'une amènerait des agents IA dotés de personnalités et de capacités différentes pour fournir une assistance ou un divertissement aux utilisateurs.
En juillet dernier, Meta a publié le projet AI Agent MetaGPT, qui est un framework d'agent automatique axé sur le développement de logiciels basé sur GPT-4.
En Chine, bien qu'AutoGPT soit devenu populaire dès avril dans les pays étrangers, en raison du manque de compréhension de la plupart des gens à propos de l'agent IA qui se cache derrière, la réponse initiale n'a pas été très enthousiaste.
Ce n'est qu'avec le billet de blog sur AI Agent de Lilian Weng, responsable de la recherche sur l'intelligence artificielle appliquée chez OpenAI, début juillet, que le cercle de l'IA a explosé, que les médias, les cercles universitaires et de recherche et les domaines d'investissement ont vraiment commencé à discuter. Agent IA avec enthousiasme.
En conséquence, le pays a véritablement entamé une recrudescence de l'exploration et de la recherche sur les agents IA, et certains fabricants ont commencé à reconstruire l'architecture des produits et les modèles commerciaux sur la base du modèle de l'agent IA.
À mesure que les principes, les modèles et les méthodes de construction d’AI Agent deviennent de plus en plus clairs, de nombreux entrepreneurs coincés dans la technologie, les modèles, l’écologie et même les politiques voient un avenir radieux.
AI Agent permet non seulement à chacun de voir la direction du grand modèle de langage (LLM, Large Language Model), il permet également à davantage d'entrepreneurs de susciter davantage l'espoir de l'entrepreneuriat LLM, et permet également à la majorité des entreprises de voir la tendance future de l'efficacité. application du LLM.
Concernant l'entrepreneuriat AI Agent, le co-fondateur d'OpenAI, Andrej Karpathy, estime que les gens ordinaires, les entrepreneurs et les geeks ont plus d'avantages qu'OpenAI dans la création d'agents, et que tout le monde est dans un état de concurrence égale.
Du côté des grandes entreprises, face à la possibilité que de grandes entreprises technologiques et des startups saisissent l'opportunité d'Agent, Bill Gates a également déclaré qu'il serait déçu si Microsoft n'intervenait pas.
Avec la forte promotion des géants de la technologie, l'adoption rapide des entrepreneurs et l'introduction active des grandes entreprises, AI Agent est devenu très populaire. Et contrairement à la situation précédente où LLM manquait de mise en œuvre, cette fois AI Agent n'est plus seulement une idée papier : de nombreuses entreprises ont déjà lancé des projets Agent et des produits associés.
Les initiés du secteur ont révélé qu'au moins 100+ projets travaillent sur la commercialisation d'agents d'IA et que près de 100 000 développeurs créent des agents autonomes. Parmi ces agents IA, il existe des projets d'agent étrangers principalement basés sur le framework d'agent GPT et open source, ainsi que des produits d'agent nationaux basés sur de grands modèles nationaux (grands modèles dans les domaines d'auto-recherche) + une architecture open source.
Cela dit, quelles entreprises ont lancé les produits Agent ? Quelle est la forme actuelle des produits AI Agent ? Cet article recense 60 agents IA à travers le monde pour permettre à chacun de mieux comprendre les agents IA.
**PS : **Comme de nombreux projets d'agent sont examinés dans cet article, le nombre de mots a atteint 1 W+. Il est recommandé de le collecter d'abord, puis de le lire.
Commencez avec AI Agent
Bien que LLM dispose de suffisamment d’intelligence, si vous souhaitez qu’il donne des réponses précises, il doit être saisi avec suffisamment de précision. Si un maître et une personne ordinaire utilisent le même grand modèle pour poser des questions, les réponses qu'ils obtiendront seront très différentes : le premier peut utiliser diverses techniques pour obtenir les résultats souhaités, tandis que le second ne peut que se tourner vers le LLM et soupirer.
Si vous voulez bien utiliser le LLM, vous devez d’abord apprendre à l’utiliser. Cette demande a engendré un vaste marché de formation. Le projet prompt, tout en augmentant la difficulté d'utilisation de LLM, réduit également l'expérience utilisateur. LLM, qui aurait dû démontrer pleinement les avantages du langage naturel, est devenu moins convivial pour les utilisateurs ordinaires en raison de sa complexité.
De cette façon, le projet prompt est devenu une grande montagne entre les gens ordinaires et les grands modèles.
Comment mieux résoudre ce problème ? La réponse est AI Agent (appelé agent AI en Chine).
AI Agent est une entité intelligente capable de percevoir l'environnement, de prendre des décisions et d'effectuer des actions. Différent de l’IA traditionnelle, AI Agent a la capacité d’atteindre progressivement un objectif donné en pensant de manière indépendante et en appelant des outils.
Après l'arrivée de LLM, AI Agent a été défini comme un agent piloté par LLM pour réaliser un traitement automatisé de problèmes généraux.
Nous savons que LLM est principalement efficace dans le traitement et la génération de texte. Ils peuvent répondre aux questions, rédiger des articles, générer du contenu créatif, aider à la programmation, etc. Mais LLM reste un outil passif qui ne produit une sortie que lorsque vous lui donnez une entrée.
Les agents IA offrent un plus large éventail de capacités, notamment en termes d'interaction avec l'environnement, de prise de décision proactive et d'exécution de diverses tâches. On peut dire que l'agent IA est la clé pour véritablement libérer le potentiel du LLM. Il peut fournir de puissantes capacités d'action au cœur du LLM.
La principale différence entre AI Agent et les grands modèles est que l'interaction entre les grands modèles et les humains est basée sur la mise en œuvre. Le fait que l'utilisateur soit clair et sans ambiguïté affectera l'effet de la réponse du grand modèle. Il n'y a pas de réponse précise et efficace, pas même le ChatGPT le plus performant.
Le travail de l'agent AI n'a besoin que d'un objectif, et il peut penser de manière indépendante et agir en fonction de l'objectif. Il décomposera chaque étape de planification en détail en fonction de la tâche donnée, en s'appuyant sur les commentaires du monde extérieur et la réflexion indépendante pour créer pour lui-même pour atteindre l'objectif.
Par exemple, si vous demandez à ChatGPT d'acheter une tasse de café, les commentaires donnés par ChatGPT sont généralement similaires à « Vous ne pouvez pas acheter de café, c'est juste un assistant textuel d'IA. »
Mais vous devez demander à l'outil AI Agent basé sur ChatGPT d'acheter une tasse de café. Il vous expliquera d'abord comment acheter une tasse de café pour vous et planifiera plusieurs étapes telles que passer une commande et payer en votre nom. via une application, puis suivez ces étapes pour appeler l'application afin de sélectionner des plats à emporter. Appelez ensuite le programme de paiement pour passer une commande et payer. Le processus ne nécessite pas que les humains spécifient chaque étape de l'opération.
Bien que les outils et les agents d’IA soient des logiciels conçus pour automatiser des tâches, des caractéristiques clés spécifiques distinguent les agents d’IA des logiciels d’IA plus complexes.
Lorsqu'un outil d'IA présente les caractéristiques suivantes, il peut être considéré comme un agent d'IA :
**Autonomie : **Les agents virtuels IA sont capables d'effectuer des tâches de manière indépendante sans intervention ni intervention humaine.
**Perception : **Les fonctions d'agent perçoivent et interprètent leur environnement grâce à divers capteurs (tels que des caméras ou des microphones).
**Réactivité : **Les agents d'IA peuvent évaluer l'environnement et réagir en conséquence pour atteindre leurs objectifs.
**Raisonnement et prise de décision : **Les agents IA sont des outils intelligents capables d'analyser les données et de prendre des décisions pour atteindre les objectifs. Ils utilisent des techniques de raisonnement et des algorithmes pour traiter les informations et prendre les mesures appropriées.
Apprentissage : Ils peuvent apprendre et améliorer leurs performances grâce à des éléments et des techniques d'apprentissage automatique, approfondi et par renforcement.
**Communication : **Les agents d'IA peuvent communiquer avec d'autres agents ou humains en utilisant différentes méthodes, telles que la compréhension et la réponse au langage naturel, la reconnaissance de la parole et l'échange de messages par texte.
Orientés vers des objectifs : Ils visent à atteindre des objectifs spécifiques, qui peuvent être prédéfinis ou appris grâce à l'interaction avec l'environnement.
**En termes de catégories, les agents d'IA peuvent actuellement être divisés en agents autonomes (Autonomous Agents) et agents génératifs (Generative Agents). **
Les agents autonomes tels qu'Auto-GPT peuvent effectuer automatiquement des tâches et obtenir les résultats attendus en fonction des besoins des utilisateurs grâce au langage naturel. Dans ce modèle de coopération, l’agent autonome sert principalement les humains et s’apparente davantage à un outil efficace.
Les agents générateurs, comme la ville de Westworld créée conjointement par des chercheurs de Stanford et de Google ou les robots humanoïdes de « Westworld », vivent dans le même environnement, ont leurs propres souvenirs et objectifs, et interagissent non seulement avec les humains, mais aussi avec chacun. autre.Autres interactions du robot.
Concernant les agents IA, le document de synthèse de 86 pages sur les agents basés sur LLM récemment lancé par l'équipe de traitement du langage naturel de l'Université de Fudan (FudanNLP) résume de manière exhaustive l'état actuel des agents intelligents basés sur des modèles de langage à grande échelle, notamment : l'arrière-plan, la composition, et l'application de la scène des agents basée sur le LLM et de la société d'agence très discutée.
Cela dit, de nombreux amis n’ont peut-être toujours pas une idée intuitive des agents IA. Ne vous inquiétez pas, nous utiliserons ci-dessous un cas comparatif pour approfondir votre compréhension.
Les agents intelligents de l'IA pénètrent dans divers domaines
AiAgent.app est une application Web qui permet aux utilisateurs de créer des agents IA personnalisés pour effectuer des tâches spécifiques et atteindre des objectifs.
Ci-dessous, Wang Jiwei Channel examinera les avantages des agents IA à travers l'expérience comparative de l'utilisation d'agents IA et de l'utilisation directe du LLM.
Par exemple, si vous souhaitez connaître l'actualité et les tendances de l'industrie de l'IA au cours du mois dernier, saisissez dans Claude : un résumé des dernières actualités et tendances de l'industrie de l'IA au cours du mois dernier.
Le résultat obtenu est le suivant :
Comme vous pouvez le constater, Claude n’a répertorié que quelques résumés d’informations liées à l’IA.
Entrez ce paragraphe dans AiAgent.app, il décomposera d'abord vos besoins en dix tâches, puis interagira avec l'utilisateur via des invites pour terminer chaque tâche et affichera les résultats pour chaque tâche. De toute évidence, le contenu sur l'industrie récente de l'IA obtenu dans AiAgent.app est plus complet que celui obtenu en utilisant directement d'autres LLM.
Est-il possible d’obtenir ce contenu directement à partir de grands modèles ? Théoriquement, il peut être complété en saisissant davantage, mais il doit être saisi au moins dix fois, et l'exactitude de la saisie ne peut pas être garantie, et parfois vous ne savez même pas quelles informations vous souhaitez obtenir.
Dans AiAgent.app, vous n'avez besoin de saisir qu'une seule phrase, et il analysera vos besoins possibles et listera des objectifs de contenu relativement complets, vous guidant pour accomplir ce que vous voulez, et l'efficacité augmentera plusieurs fois.
En comparant les deux, il est clair qu’AI Agent est supérieur en termes de richesse et d’efficacité d’acquisition de contenu. Ce type d'agent de contenu informationnel est d'une grande valeur pour les praticiens des médias, les analystes industriels et d'autres professions, et peut réduire considérablement le temps d'obtention des données de recherche.
Il existe désormais de tels agents ciblant des groupes d'utilisateurs et des scénarios d'application plus précis. Par exemple, GPT Researcher lancé par l'Université de Columbia est un agent pour les chercheurs basé sur ChatGPT, qui peut créer divers rapports de recherche permettant aux utilisateurs de promouvoir la recherche.
Ce cas ne concerne que l'acquisition de contenu. En fait, des agents pour plusieurs scénarios d'application ont émergé, qui suffisent à mobiliser davantage d'applications logicielles et même de périphériques matériels pour accomplir diverses tâches.
Par exemple, certaines personnes ont utilisé AutoGPT pour commander des repas, réserver des billets, prendre des taxis et faire du shopping ; les 25 agents IA de la ville de Westworld à Stanford marchent, sortent ensemble, discutent, boivent du café et partagent chaque jour l'actualité du jour ; Google Deepmind a a lancé l'utilisation d'agents robotiques pour les bras robotiques afin d'effectuer automatiquement diverses tâches ; Amazon a également lancé Amazon Bedrock Agents pour décomposer automatiquement les tâches de développement d'applications d'IA d'entreprise ; IBM Watson Health a aidé les médecins à diagnostiquer, traiter et surveiller les patients dans de nombreux hôpitaux.
Bien qu'Ai Agent ne soit plus populaire depuis longtemps, il a été soutenu par de nombreuses entreprises dans de nombreux domaines dès son apparition. Les capacités multimodèles des grands modèles de langage, associées à la plus grande puissance de calcul actuelle, ont permis aux agents, proposés il y a de nombreuses années, de gagner rapidement en valeur et d'être mis en œuvre dans davantage de domaines avec des taux de pénétration élevés.
Avec l'émergence d'agents d'IA open source tels que MetaGPT, de plus en plus de fournisseurs de technologie et d'équipes entrepreneuriales ont introduit des agents, et de plus en plus d'organisations ont reconnu et accepté les agents. Cela deviendra inévitablement rapidement le modèle principal de mise en œuvre du LLM dans divers domaines, aidant des milliers de personnes. des industries à changer de business.Bonne application LLM.
Inventaire de 60 agents IA dans le monde
AiAgent.app mentionné dans le cas ci-dessus est l'un des produits représentatifs d'AI Agent qui a pris de l'ampleur ces derniers mois. Plusieurs agents au pays et à l'étranger, y compris cet agent IA, peuvent être vus dans la liste d'inventaire du projet ci-dessous.
Afin de permettre à tout le monde de mieux comprendre les agents d'IA qui ont été lancés jusqu'à présent, Wang Jiwei Channel (id : jiwei1122) divise ces agents d'IA en rapports médiatiques, lancés au niveau national, basés sur l'industrie, à l'étranger et en projets GitHub. seront progressivement récompensés dans le futur.La bibliothèque du projet classe ces Agents en différentes catégories.
Les agents AI examinés dans cet article incluent à la fois des frameworks et des outils AI Agents et des produits AGENT basés sur certains frameworks open source. Dans le même temps, la plupart des projets et produits sont des agents autonomes.
Étant donné que certains fabricants sont relativement discrets et ne font pas de publicité au monde extérieur, les agents IA répertoriés dans cet article ne sont pas complets, c'est pourquoi on l'appelle également la liste incomplète des AGENTS IA. Davantage de fabricants et d'entrepreneurs sont invités à contacter la chaîne de Wang Jiwei après avoir lu cet article, et nous pouvons tous contribuer à la prospérité et au développement de l'écosystème AI AGENT.
Agent IA rapporté par les médias
1、Auto-GPT
Auto GPT est un projet open source gratuit sur Github qui combine les technologies GPT-4 et GPT-3.5 pour créer des projets complets via des API.
Contrairement à ChatGPT, les utilisateurs n'ont pas besoin de poser constamment des questions à l'IA pour obtenir les réponses correspondantes. Dans AutoGPT, il leur suffit de lui fournir un nom d'IA, une description et cinq objectifs, puis AutoGPT peut terminer le projet par lui-même. . Il peut lire et écrire des fichiers, naviguer sur le Web, consulter les résultats de ses propres invites et les combiner avec ledit historique des invites.
Auto-GPT est l’un des premiers exemples de GPT-4 fonctionnant de manière totalement autonome, repoussant les limites de ce que l’intelligence artificielle peut faire.
2、AgentGPT
AgentGPT vous permet de configurer et de déployer des agents IA autonomes. Nommez simplement votre IA personnalisée et dites-lui de commencer n'importe quel objectif imaginable, et elle essaiera de l'atteindre en réfléchissant à une tâche à accomplir, en exécutant la tâche et en apprenant des résultats.
3、Bébé AGI
Il s'agit d'un système de gestion de tâches basé sur l'IA. Le système utilise OpenAI et l'API Pinecone pour créer, prioriser et exécuter des tâches. Créez des tâches en analysant les résultats des tâches précédentes et les objectifs prédéfinis, et utilisez le traitement du langage naturel (NLP) et Chroma d'OpenAI pour stocker et récupérer les résultats des tâches dans leur contexte.
L'attrait de Baby AGI réside dans sa capacité à résoudre des tâches de manière autonome et à maintenir des objectifs prédéfinis basés sur les résultats des tâches précédentes, ainsi qu'à hiérarchiser efficacement les tâches.
4、Jarvis (HuggingGPT)
Un système de collaboration unique développé par Microsoft qui peut utiliser plusieurs modèles d'IA pour effectuer une tâche donnée, avec ChatGPT agissant comme contrôleur de tâches. Le projet, connu sous le nom de JARVIS sur GitHub, est désormais disponible pour essai sur Huggingface (d'où HuggingGPT), un agent qui fonctionne extrêmement bien avec le texte, les images, l'audio et même la vidéo.
La façon dont cela fonctionne est similaire à la façon dont OpenAI démontre les capacités multimodales de GPT 4 à travers du texte et des images, mais JARVIS va encore plus loin et intègre divers LLM open source pour les images, les vidéos, l'audio, etc., et peut également se connecter à Internet et accéder aux fichiers. Par exemple, vous pouvez saisir l'URL d'un site Web et poser des questions à ce sujet.
5、Aiagent.app
Ai Agent est une application Web qui permet aux utilisateurs de créer des agents IA personnalisés pour effectuer des tâches spécifiques et atteindre des objectifs. Les agents IA fonctionnent en décomposant les objectifs en tâches plus petites et en les accomplissant une par une. Les avantages incluent la possibilité d’exécuter plusieurs agents d’IA simultanément et la démocratisation de l’accès à une technologie de pointe.
AI Agent propose également des fonctionnalités telles que des blocs de code en ligne avec coloration syntaxique et une collaboration transparente avec des plates-formes tierces. L'outil est gratuit et offre un moyen simplifié de créer des agents d'IA sans nécessiter de connaissances techniques supplémentaires.
6、CamelAGI
Camel AGI est un outil d'IA générative qui permet aux utilisateurs de résoudre des tâches données en jouant un rôle d'agents d'IA autonomes. Bien entendu, les utilisateurs doivent activer Java pour utiliser cet outil. Camel AGI permet aux utilisateurs d'effectuer des tâches à l'aide d'agents IA et offre la possibilité de se connecter avec Google ou de lancer l'outil sur Github.
7. Simulation "Westworld" Ville de Westworld
Pour ce projet, des chercheurs de l'Université de Stanford et de Google ont créé un environnement sandbox interactif contenant 25 agents d'IA génératifs capables de simuler le comportement humain. Ils se promenaient dans le parc, buvaient du café dans les cafés et partageaient des nouvelles avec des collègues, faisant preuve d'un comportement social étonnamment bon.
Par exemple, à partir d'un concept spécifié par l'utilisateur selon lequel un agent souhaite organiser une fête pour la Saint-Valentin, l'agent répartit automatiquement les invitations aux fêtes sur les deux prochains jours, se fait de nouveaux amis, se demande mutuellement d'aller à des rendez-vous et à des fêtes et coordonne les événements. au bon moment. Il est temps de se présenter ensemble aux fêtes.
8、Ingénieur GPT
GPT-Engineer est un outil d'IA open source qui permet aux utilisateurs de spécifier ce qu'ils souhaitent construire, puis d'avoir une conversation de clarification avec l'IA pour générer la base de code requise. L'outil est conçu pour offrir une expérience utilisateur simple et flexible, permettant aux utilisateurs d'adapter et d'étendre ses fonctionnalités en fonction de leurs besoins.
L'outil comprend des fonctions telles que la spécification de l'identité de l'agent IA, le stockage de l'historique des communications avec GPT4 et la réexécution des journaux de messages. Les contributions au projet sont les bienvenues et les personnes intéressées peuvent se référer à la feuille de route, aux projets et aux problèmes disponibles sur le référentiel GitHub. GPT-Engineer vise à être une plate-forme ouverte permettant aux développeurs d'explorer et de créer leur boîte à outils de génération de code.
9、MétaGPT
MetaGPT, lancé par Meta Corporation, est un framework multi-agents qui utilise une entrée sur une seule ligne pour générer des API, des user stories, des structures de données, des analyses concurrentielles, etc. Ce cadre peut servir de chefs de produit, d'ingénieurs logiciels et d'architectes. Le framework peut agir comme un éditeur de logiciels à part entière, orchestrant les SOP avec une seule ligne de code.
MetaGPT est intégré à la conception des processus SOP humains. Par conséquent, les agents basés sur LLM génèrent des documents et des conceptions de haute qualité, diversifiés et structurés. MetaGPT est conçu pour faciliter la conception de solutions pour des tâches complexes et fournir des capacités de résolution de problèmes presque comparables à l'intelligence humaine.
10、Agents du substrat rocheux d'Amazon
Les agents Amazon Bedrock publiés par Amazon permettent aux développeurs de créer rapidement des agents entièrement gérés. En exécutant des appels d'API vers les systèmes d'entreprise, les agents Amazon Bedrock accélèrent la publication d'applications d'IA générative qui gèrent et exécutent des activités.
Les agents Amazon Bedrock simplifient l'ingénierie et l'orchestration rapides des tâches de demande des utilisateurs. Une fois configurés, ces agents peuvent créer de manière autonome des invites et les améliorer en toute sécurité avec des données spécifiques à l'entreprise pour fournir des réponses en langage naturel aux utilisateurs. Ces agents avancés ont la capacité de déduire les actions nécessaires pour traiter automatiquement les demandes des utilisateurs.
11、nvidia Voyager
Voyager, lancé conjointement par NVIDIA, le California Institute of Technology et d'autres, utilise GPT-4 pour guider l'apprentissage des agents Minecraft à travers le monde des pixels. Il convient de noter que Voyager s'appuie sur la génération de code plutôt que sur l'apprentissage par renforcement.
Voyager est le premier agent d'apprentissage tout au long de la vie à jouer à Minecraft. Contrairement aux autres agents Minecraft qui utilisent des techniques classiques d'apprentissage par renforcement, Voyager utilise GPT-4 pour s'améliorer continuellement, en écrivant, en améliorant et en transférant du code stocké dans une bibliothèque de compétences externe.
Cela se traduit par de petits programmes qui aident à la navigation, à ouvrir des portes, à extraire des ressources, à fabriquer des pioches ou à combattre des zombies. GPT-4 ouvre un nouveau paradigme dans lequel la « formation » est l'exécution de code et les « modèles de formation » sont la base de code de compétences que Voyager assemble de manière itérative.
12、RoboAgent
L'équipe de recherche commune de Meta et de la CMU a mis deux ans pour développer avec succès l'agent robot universel RoboAgent. RoboAgent a acquis 12 compétences complexes différentes grâce à une formation avec seulement 7 500 trajectoires, notamment cuisiner, ramasser des objets, servir du thé, nettoyer la cuisine et d'autres tâches, et peut être généralisée et appliquée dans 100 scénarios inconnus.
RoboAgent reste concentré sur sa tâche, quelle que soit l'ampleur des interférences qu'il rencontre. L'objectif de cette recherche est d'établir un paradigme d'apprentissage robot efficace qui répond aux défis de la diversité des ensembles de données et des scènes. Les chercheurs ont proposé l’architecture MT-ACT (Multi-Task Action Blocking Transformer) pour gérer les ensembles de données de robots multimodaux et multitâches grâce à une amélioration sémantique et une représentation efficace des politiques.
13、Inflection AI Pi
Le cerveau central du produit personnel AI Agent Pi lancé par Inflection AI est le grand modèle Inflection-1 développé par la société, et ses performances sont comparables à GPT-3.5. Contrairement aux chatbots généralistes populaires, Pi ne peut que mener des conversations amicales, offrir des conseils concis ou même simplement écouter.
Ses principales caractéristiques sont la compassion, l'humilité, la curiosité, l'humour et l'innovation, ainsi qu'une bonne intelligence émotionnelle. Il peut fournir des connaissances et une camaraderie illimitées en fonction des intérêts et des besoins uniques des utilisateurs. Depuis qu'Inflection a développé Pi, il a été déterminé que Pi servirait d'intelligence personnelle (Personal Intelligence), et pas seulement d'outil pour aider les gens dans leur travail.
14、HyperÉcriture
Hyperwrite est un outil d'agent d'écriture IA qui aide les rédacteurs créatifs de tout niveau à écrire plus rapidement et avec plus de confiance. Il comprend des fonctionnalités telles que l'écriture automatique et la saisie anticipée pour générer des paragraphes originaux et proposer des idées pour surmonter le blocage de l'écrivain.
L'outil est disponible sous forme d'extension Chrome gratuite et peut être utilisé sur n'importe quel site Web sans interrompre le flux de travail. Il est utilisé et approuvé par les professionnels, les étudiants et les créateurs du monde entier pour augmenter leur productivité.
15、Chercheur GPT
GPT Researcher est un agent autonome basé sur l'IA utilisé pour effectuer des recherches en ligne complètes sur diverses tâches. Inspiré d'AutoGPT et de l'invite « Planifier et résoudre », l'outil vise à améliorer les problèmes de vitesse et de déterminisme rencontrés dans les modèles de langage actuels, « en offrant des performances plus stables et des vitesses plus élevées en travaillant avec des agents parallèles plutôt qu'en fonctionnant de manière synchrone ».
Selon l'équipe, les chercheurs de GPT facilitent la recherche en générant des questions de recherche pertinentes, en regroupant les données de plus de 20 sources Web et en exploitant GPT3.5-turbo-16 et GPT-4 pour créer des rapports de recherche complets.
AI Agent lancé en Chine
Après une exploration et une expérimentation continues, des produits nationaux liés aux agents d'IA ont également commencé à émerger. Voici cinq produits.
1. Alibaba Cloud ModelScopeGPT
La communauté Alibaba Cloud Mota a lancé le premier outil d'appel de modèles à grande échelle en Chine, ModelScopeGPT. Grâce à cet outil, les utilisateurs peuvent appeler d'autres modèles d'intelligence artificielle de la communauté Mota en envoyant des instructions en un seul clic, réalisant ainsi de grandes et petites applications. pour accomplir des tâches complexes.
ModelScopeGPT est basé sur le cadre de développement open source de grand modèle de langage (LLM) AI Agent (agent) ModelScope-Agent. Il s'agit d'un cadre d'agent général et personnalisable pour des applications pratiques. Il est basé sur des modèles de langage étendus (LLM) open source comme noyau et comprend des modules tels que le contrôle de la mémoire et l'utilisation des outils.
Le LLM open source est principalement responsable de la planification des tâches, de l'ordonnancement et de la génération de réponses ; le module de contrôle de la mémoire comprend principalement la récupération des connaissances et la gestion (mot d'invite) ; le module d'utilisation des outils comprend une bibliothèque d'outils, la récupération d'outils et la personnalisation des outils.
2. Agent TARS-RPA vraiment intelligent
TARS-RPA-Agent, lancé par Real Intelligence dans le domaine de l'hyper-automatisation, est un agent hyper-automatique basé sur le moteur bimode « TARS+ISSUT (Intelligent Screen Semantic Understanding) », doté d'un « cerveau » et d'un « yeux, mains et pieds". Il s'agit d'un nouveau produit modèle RPA qui peut démonter de manière autonome des tâches, percevoir l'environnement actuel, exécuter et fournir des commentaires, et mémoriser l'expérience historique.
TARS-RPA-Agent adopte un cadre technique basé sur le grand modèle TARS et la compréhension sémantique de l'écran intelligent ISSUT. Le cadre technique est divisé en deux couches : la couche inférieure est la série TARS de grands modèles comprenant des modèles de base généraux et des modèles de base de diverses industries verticales, ainsi qu'une technologie de compréhension sémantique d'écran intelligent ; la couche supérieure est le modèle ultra-large qui s'appuie sur ces deux technologies clés pour réaliser des mises à niveau et des transformations complètes.Produits d'automatisation.
Le LLM principal de TARS-RPA-Agent est le grand modèle vertical "TARS" auto-développé par Real Intelligence, basé sur une base de grand modèle générale. Le grand modèle TARS a d'excellentes fonctions courantes telles que la génération de texte, la compréhension du langage, les questions et réponses de connaissances, et le raisonnement logique.
3. Agent intelligent OmBot ohm
Lors de la Conférence mondiale sur l'intelligence artificielle de 2023, Lianhui Technology a lancé OmBot, un agent autonome (Auto AI Agent) basé sur les capacités de grands modèles, et a lancé le premier lot d'applications pour les exigences typiques des scènes.
L'agent autonome Lianhui contient les quatre capacités principales que sont la cognition, la mémoire, la pensée et l'action. En tant qu'agent automatique et autonome, il fonctionne en boucle sous la forme la plus simple. À chaque itération, ils génèrent des instructions et des opérations autodirigées. Par conséquent, il ne repose pas sur des humains pour guider les commandes et est hautement évolutif.
4. Technologie Lanma Demandez à XBot
La plate-forme d'agent "Ask XBot" construite par Lanma Technology est divisée en deux couches : la première couche est l'autonomisation des experts. Les experts définissent les flux de travail et les enseignent aux machines par glisser-déposer, glisser et dialoguer, aidant ainsi les employés de première ligne à construire Méthodologie pour un travail plus efficace ; le deuxième niveau est pour les employés d'utiliser l'Agent. Les employés de première ligne peuvent communiquer avec l'Agent via un langage naturel et émettre des instructions, permettant à l'Agent d'aider à l'analyse des données, à la récupération d'informations et à d'autres tâches.
L'entreprise prévoit de faire en sorte que les clients Ask puissent être servis plus efficacement et plus intelligemment sur la plate-forme.
5、ChatDev
ChatDev, lancé par une équipe de recherche conjointe de l'Université Tsinghua, de l'Université des postes et télécommunications de Pékin et de l'Université Brown, est un agent générateur. Il s'agit d'un cadre de développement logiciel de bout en bout basé sur le chat qui exploite les grands modèles de langage (LLM) pour faciliter une communication et une collaboration efficaces entre plusieurs acteurs (version "gpt3.5-turbo-16k" de ChatGPT) dans le processus de développement logiciel. .
L'objectif principal de ChatDev est le développement de jeux via le chat. Les utilisateurs n'ont qu'à proposer des idées, et l'ensemble du processus, de la conception aux tests, est réalisé par l'IA, et l'ensemble du processus ne prend que sept minutes.
Produits AI Agent pour différents domaines
Avant l’apparition du LLM, certaines entreprises étudiaient déjà la combinaison de l’IA traditionnelle et de l’Agent. Par conséquent, la mise en œuvre d’AI Agentmt dans divers domaines est beaucoup plus rapide que prévu.
Vous trouverez ci-dessous des applications d'agent représentatives dans plusieurs domaines industriels.
Dans le domaine médical, les agents peuvent aider à diagnostiquer, traiter et surveiller les patients. IBM Watson Health est un agent d'IA qui analyse les données médicales pour identifier les problèmes de santé potentiels et recommander des options de traitement.
Dans le domaine financier, les agents peuvent analyser les données financières, détecter les fraudes et faire des recommandations d'investissement. Charles Schwab utilise un agent d'intelligence artificielle appelé Intelligent Portfolio pour créer et gérer des portefeuilles d'investissement en fonction des objectifs d'investissement des clients.
Dans les scénarios de vente au détail, les agents peuvent fournir des recommandations personnalisées, améliorer la gestion de la chaîne d'approvisionnement et améliorer l'expérience client. Alexa d'Amazon est un agent IA qui peut recommander des produits, passer des commandes et suivre les expéditions.
Dans le domaine de la fabrication, Agent peut optimiser les processus de production, prévoir les besoins de maintenance et améliorer la qualité des produits. General Electric utilise un agent d'IA appelé Predix pour surveiller les machines en temps réel afin de prédire et de prévenir les pannes d'équipement.
Dans le domaine des transports, les agents IA autonomes peuvent aider à la planification des itinéraires, à la gestion du trafic et à la sécurité des véhicules. Le Autopilot de Tesla aide les véhicules autonomes et aide les conducteurs à se garer, à changer de voie et à conduire en toute sécurité.
Dans le secteur de l'éducation, Agnet peut offrir une expérience d'apprentissage personnalisée, automatiser les tâches administratives et analyser les performances des étudiants. L'agent IA de Pearson Aida peut fournir des commentaires aux étudiants et suggérer des parcours d'apprentissage personnalisés.
En agriculture, les agents d’IA peuvent optimiser la production agricole, surveiller la qualité des sols et prédire les conditions météorologiques. John Deere utilise un agent d'IA appelé See&Spray pour détecter et localiser les mauvaises herbes sans affecter les cultures.
D'autres produits AGENT ont été lancés à l'étranger
1、Cognosys
Cognosys est un agent d'IA basé sur le Web conçu pour révolutionner la productivité et simplifier les tâches complexes, en utilisant la technologie d'IA la plus avancée pour améliorer votre vie quotidienne.
2、Doanythingmachine
Gérez facilement vos tâches avec une machine à tout faire où l'agent IA personnel de l'utilisateur priorisera et terminera vos tâches pour vous.
3、alphakit
Une plateforme intuitive pour créer et gérer des équipes d'agents IA autonomes axés sur des objectifs, le tout depuis votre téléphone Créez et gérez des équipes d'agents IA autoGPT. Définissez simplement vos objectifs et Alphakit s'occupe du reste.
4、GPTConsole
GPTConsole est une interface de ligne de commande (CLI) révolutionnaire conçue pour offrir aux développeurs les avantages de l'intelligence artificielle. Il va au-delà des fonctionnalités traditionnelles des terminaux pour permettre aux utilisateurs d'effectuer des tâches complexes à l'aide d'invites.
5、Finitions
Convertissez votre base de connaissances en chat IA en 2 minutes en fournissant un lien vers la base de connaissances. Fini fournit aux utilisateurs un agent IA infatigable prêt à répondre immédiatement aux questions des clients 24h/24 et 7j/7.
6、Sort
Spell est un agent d'IA autonome basé sur GPT4 qui peut être appliqué à un travail quotidien efficace. Spell possède également des fonctionnalités indispensables pour vous aider à travailler plus intelligemment et à apprendre à exploiter la puissance de l'IA générative pour générer un ou plusieurs agents autonomes innovants qui s'efforceront de résoudre vos problèmes.
7、Aomni
Aomni est un agent d'IA de recherche d'informations qui peut trouver, extraire et traiter pour vous toutes les données sur Internet, améliorant ainsi votre travail de recherche. Aomni peut utiliser une variété d'outils pour planifier intelligemment vos requêtes pour obtenir les résultats finaux, y compris un navigateur Web complet qui lui permet d'accéder à n'importe quelle information sur Internet sans avoir besoin d'une API.
Le planificateur de requêtes d'Aomni est basé sur l'architecture AutoGPT de pointe actuelle, planifiant et mettant à jour intelligemment chaque requête pour garantir l'exactitude et la diversité des sources.
8、Fine-Tuner.ai
Avec Fine-Tuner.ai, les utilisateurs peuvent créer des agents d'IA complexes et sur mesure sans compétences techniques ni codage, en saisissant simplement vos données et vos idées. Plus d'une douzaine d'agents d'IA professionnels peuvent créer des questions-réponses précises, une recherche de documents, une automatisation des processus, etc. pour les utilisateurs grâce à des données en temps réel téléchargées telles que PDF, CV, PPT et URL.
9、SuperAGI
Un framework d'IA autonome open source qui vous permet de développer et de déployer rapidement et de manière fiable des agents autonomes utiles, ainsi qu'une infrastructure pour créer, gérer et exécuter des agents autonomes.
10、Jaune.ai
Yellow.ai est la principale plateforme d'IA conversationnelle d'entreprise qui alimente les agents d'IA dynamiques dans l'entreprise, conçue pour offrir des interactions de type humain via sa plateforme no-code/low-code afin d'augmenter la satisfaction des clients et d'accroître l'engagement des employés.
11、Mode divin
Permet aux utilisateurs d'exécuter AutoGPT dans le navigateur. Godmode permet aux utilisateurs de déployer plusieurs agents IA en même temps pour effectuer des tâches à l'aide de l'IA, et les utilisateurs peuvent également utiliser leurs propres clés API OpenAI.
12、E42
E42 est une plateforme d'automatisation des processus cognitifs qui permet aux entreprises de créer des agents cognitifs multifonctionnels pour automatiser divers processus entre fonctions. La plateforme cognitive et sans code s’intègre parfaitement à la technologie et aux processus existants des utilisateurs pour libérer la plus grande valeur dans tous les départements. Les utilisateurs peuvent utiliser E42 pour créer leurs propres agents IA, tels que des analystes IA et des recruteurs IA dans des secteurs verticaux.
13、Remerciant
Les agents IA de Thankful sont formés et adaptés pour travailler au sein de votre service d'assistance existant, résolvant facilement les demandes de clients à volume élevé par e-mail, chat, SMS et canaux intégrés à l'application. Avec la capacité de comprendre, de connecter, de résoudre, de personnaliser et d’informer, les agents ThankfulAI offrent des expériences de service de type humain avec une vitesse comparable à celle d’une machine et une expertise intrinsèquement évolutive.
14、Aktify
Utilisez les agents d'IA virtuels d'Aktify pour cloner votre équipe commerciale sans augmenter les effectifs. Aktify gérera un nombre illimité de prospects qui ne répondent pas à grande échelle et amènera systématiquement les clients prêts à parler à la porte de votre équipe commerciale. C'est plus qu'un simple chatbot SMS.
15、TeamSmart AI
Augmentez votre productivité avec un accès en un clic à TeamSmart AI. Regroupez du contenu, générez du code, rédigez des tweets et bien plus encore directement dans votre navigateur. ChatGPT s'ouvre instantanément d'un simple clic sur l'icône ou d'un raccourci clavier, offrant un accès instantané à une bibliothèque de conseils de qualité sans vous connecter.
16、Réflexion sur GPT
BrainstormGPT intègre plusieurs agents, LLM et recherche automatique pour simplifier la conversion de sujet en rapport de réunion. Les sujets personnalisés, les rôles définis par l'utilisateur, les discussions autonomes des agents et les rapports générés dans un délai de 20 minutes équivalent approximativement à 300 recherches, 10 heures de discussions et 100 000 analyses de texte.
17、AgentRunner.Ai
AgentRunner.ai est un outil de création d'agents d'IA autonomes qui exploite la puissance de GPT-4 pour créer et former des agents entièrement autonomes. Permet aux utilisateurs de définir des objectifs pour leurs agents et de les laisser décider comment atteindre ces objectifs sans aucune connaissance technique ni compétence en programmation.
L'outil offre des fonctionnalités telles que la création d'agents autonomes dotés de personnalités uniques, l'exécution de l'agent pour effectuer des tâches ou acquérir de nouvelles compétences, décider de ce que l'agent peut faire et l'intégration avec des comptes OpenAI ou Google Cloud.
18、Reste
Gista aide les entreprises à interagir avec les visiteurs de leur site Web et à les convertir en prospects 24h/24 et 7j/7, et ses principales fonctionnalités incluent la création d'agents de conversion IA et d'agents commerciaux IA. Grâce à Gista, les entreprises peuvent facilement convertir les visiteurs de leur site Web en prospects et créer des listes de diffusion.
19、Agent4
L'une des fonctionnalités clés d'Agent4 est la possibilité de créer des agents virtuels basés sur l'IA, capables de répondre aux questions, d'aider à planifier des réunions, d'écouter des messages vocaux et de fournir des résumés.
Vous pouvez facilement créer des interactions personnalisées pour les agents, leur permettant de répondre aux questions et de gérer diverses tâches avec la voix de votre marque. Vous pouvez également choisir la manière dont les agents répondent aux appels en temps réel et décider si et quand vous devez parler à quelqu'un.
20、Cometcore IA
Cometcore AI est une plate-forme innovante qui fournit un ensemble polyvalent d'outils basés sur l'IA pour améliorer la productivité et la communication. Avec Cometcore, vous pouvez créer, coder et automatiser des agents mignons.
21、assistant personnel
Un agent IA conçu pour tout gérer, de la réservation de vols à la réalisation de recherches approfondies et tout le reste.
Projet AI Agent sur Github
1、OpenAGI
OpenAGI est une plateforme de recherche AGI open source spécialement conçue pour fournir des tâches complexes en plusieurs étapes, accompagnées d'ensembles de données spécifiques à la tâche, de mesures d'évaluation et d'une variété de modèles évolutifs. OpenAGI formule des tâches complexes sous forme de requêtes en langage naturel en entrée de LLM. Le LLM sélectionne, synthétise et exécute ensuite les modèles fournis par OpenAGI pour résoudre la tâche.
Le projet a également proposé un mécanisme d'apprentissage par renforcement par retour de tâches (RLTF), qui utilise les résultats de la résolution de tâches comme retour d'information pour améliorer les capacités de résolution de tâches de LLM. LLM est chargé de synthétiser divers modèles externes pour résoudre des tâches complexes, tandis que RLTF fournit des commentaires pour améliorer ses capacités de résolution de tâches, fournissant ainsi une boucle de rétroaction pour une IA qui s'auto-améliore. Le paradigme du LLM exploitant divers modèles experts pour résoudre des tâches complexes est une approche prometteuse de l’AGI.
2、Agent-LLM
Agent-LLM est une plate-forme d'automatisation de l'IA conçue pour optimiser la gestion efficace des instructions d'IA auprès de plusieurs fournisseurs.
L'agent est équipé d'une mémoire adaptative et cette solution polyvalente offre un système de plug-in puissant qui prend en charge une variété de commandes, y compris la navigation Web. Avec la prise en charge croissante de nombreux fournisseurs et modèles d'IA, Agent-LLM continue d'évoluer pour améliorer une variété d'applications.
3、AutoGPT-Next-Web
Cet agent peut déployer l'interface utilisateur Web AutoGPT-Next-Web bien conçue sur Vercel en un seul clic et déployer gratuitement votre application Web privée AutoGPT-Next-Web en un seul clic. Basé sur AutoGPT-Next-Web, les utilisateurs peuvent utiliser Vercel pour déployer gratuitement en un clic et créer un site Web AutoGPT personnel en 1 minute.
4、MiniGPT-4
Cet agent peut utiliser de grands modèles de langage avancés pour améliorer la compréhension du langage visuel.
5、Mini-AGI
Mini-AGI est le plus petit agent autonome à usage général basé sur GPT3.5/4. Il combine des invites puissantes, un ensemble minimal d'outils et une mémoire à court terme (enchaînement de pensées), avec une augmentation des données via le stockage vectoriel qui sera bientôt ajouté, pour analyser les cours des actions, effectuer des tests de cybersécurité, créer des œuvres d'art et commander des pizzas.
6、Adolescent-AGI
Inspiré de plusieurs projets liés à l'Auto-GPT (principalement BabyAGI) et de l'article "Generative Agents: Interactive Simulation of Human Behaviour", ce projet Python utilise OpenAI et Pinecone pour fournir de la mémoire à un agent IA et lui permettre de "réfléchir" avant d'agir. (sortie de texte).
7、FastGPT
FastGPT est un système de questions et réponses de base de connaissances basé sur le grand modèle de langage LLM, offrant un traitement de données prêt à l'emploi, des appels de modèles et d'autres fonctionnalités. Dans le même temps, le flux de travail peut être orchestré via la visualisation Flow pour réaliser des scénarios de questions et réponses complexes.
8、DémoGPT
Avec DemoGPT, vous pouvez créer rapidement une démo en utilisant uniquement des phrases simples.
9、AGILocal
Exécutez localement des projets AGI basés sur LLMDA, ChatGLM et d'autres modèles.
10. ai-town (catégorie de jeu)
La ville IA open source de la célèbre institution d'investissement a16z est un kit de démarrage déployable sous licence MIT pour créer et personnaliser votre propre version d'une ville IA. Il s'agit d'une ville virtuelle où les personnages de l'IA vivent, discutent et socialisent.
11, gptrpg (catégorie de jeu)
gptrpg Ce référentiel contient deux éléments : un simple environnement de type RPG pour un agent IA compatible LLM et un simple agent IA qui se connecte à l'API OpenAI pour exister dans cet environnement.
12. SFighterAI (catégorie de jeu)
Le projet est un agent d'IA formé à l'aide d'un apprentissage par renforcement profond pour vaincre le boss final du jeu Street Fighter II: Special Champion Edition. L'agent IA prend des décisions basées uniquement sur les valeurs des pixels RVB de l'écran de jeu. Dans l'état de sauvegarde fourni, l'agent atteint un taux de victoire de 100 % au premier tour du niveau final.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
60 agents IA auxquels vous devez vous référer lors du démarrage d'une grande entreprise de modèles linguistiques
Source : Médias TMTpost
En avril, peu de temps après que Baidu ait publié Wen Xin Yi Yan, de nombreuses personnes déploraient encore à quel point les images générées par Wen Xin Yi Yan étaient heureuses. Encore plus de gens étaient devenus fous de diverses formations telles que ChatGPT et Midjourney. réfléchit à l'opportunité de présenter les agents IA à des milliards de personnes dans le monde « d'une manière utile et significative ».
En mai, lorsque OpenAI a finalisé une nouvelle ronde de financement de 300 millions de dollars, le fondateur Sam Altman a déclaré en privé à certains développeurs qu'il espérait faire de ChatGPT un assistant de travail personnel. chatbots pour créer des agents IA autonomes, les fonctions associées sont susceptibles d'être déployées dans l'assistant ChatGPT.
Lors d'une réunion de tout le personnel en juin, Zuckerberg a annoncé une série de technologies à différents stades de développement, dont l'une amènerait des agents IA dotés de personnalités et de capacités différentes pour fournir une assistance ou un divertissement aux utilisateurs.
En juillet dernier, Meta a publié le projet AI Agent MetaGPT, qui est un framework d'agent automatique axé sur le développement de logiciels basé sur GPT-4.
En Chine, bien qu'AutoGPT soit devenu populaire dès avril dans les pays étrangers, en raison du manque de compréhension de la plupart des gens à propos de l'agent IA qui se cache derrière, la réponse initiale n'a pas été très enthousiaste.
Ce n'est qu'avec le billet de blog sur AI Agent de Lilian Weng, responsable de la recherche sur l'intelligence artificielle appliquée chez OpenAI, début juillet, que le cercle de l'IA a explosé, que les médias, les cercles universitaires et de recherche et les domaines d'investissement ont vraiment commencé à discuter. Agent IA avec enthousiasme.
En conséquence, le pays a véritablement entamé une recrudescence de l'exploration et de la recherche sur les agents IA, et certains fabricants ont commencé à reconstruire l'architecture des produits et les modèles commerciaux sur la base du modèle de l'agent IA.
À mesure que les principes, les modèles et les méthodes de construction d’AI Agent deviennent de plus en plus clairs, de nombreux entrepreneurs coincés dans la technologie, les modèles, l’écologie et même les politiques voient un avenir radieux.
AI Agent permet non seulement à chacun de voir la direction du grand modèle de langage (LLM, Large Language Model), il permet également à davantage d'entrepreneurs de susciter davantage l'espoir de l'entrepreneuriat LLM, et permet également à la majorité des entreprises de voir la tendance future de l'efficacité. application du LLM.
Concernant l'entrepreneuriat AI Agent, le co-fondateur d'OpenAI, Andrej Karpathy, estime que les gens ordinaires, les entrepreneurs et les geeks ont plus d'avantages qu'OpenAI dans la création d'agents, et que tout le monde est dans un état de concurrence égale.
Du côté des grandes entreprises, face à la possibilité que de grandes entreprises technologiques et des startups saisissent l'opportunité d'Agent, Bill Gates a également déclaré qu'il serait déçu si Microsoft n'intervenait pas.
Avec la forte promotion des géants de la technologie, l'adoption rapide des entrepreneurs et l'introduction active des grandes entreprises, AI Agent est devenu très populaire. Et contrairement à la situation précédente où LLM manquait de mise en œuvre, cette fois AI Agent n'est plus seulement une idée papier : de nombreuses entreprises ont déjà lancé des projets Agent et des produits associés.
Les initiés du secteur ont révélé qu'au moins 100+ projets travaillent sur la commercialisation d'agents d'IA et que près de 100 000 développeurs créent des agents autonomes. Parmi ces agents IA, il existe des projets d'agent étrangers principalement basés sur le framework d'agent GPT et open source, ainsi que des produits d'agent nationaux basés sur de grands modèles nationaux (grands modèles dans les domaines d'auto-recherche) + une architecture open source.
Cela dit, quelles entreprises ont lancé les produits Agent ? Quelle est la forme actuelle des produits AI Agent ? Cet article recense 60 agents IA à travers le monde pour permettre à chacun de mieux comprendre les agents IA.
**PS : **Comme de nombreux projets d'agent sont examinés dans cet article, le nombre de mots a atteint 1 W+. Il est recommandé de le collecter d'abord, puis de le lire.
Commencez avec AI Agent
Bien que LLM dispose de suffisamment d’intelligence, si vous souhaitez qu’il donne des réponses précises, il doit être saisi avec suffisamment de précision. Si un maître et une personne ordinaire utilisent le même grand modèle pour poser des questions, les réponses qu'ils obtiendront seront très différentes : le premier peut utiliser diverses techniques pour obtenir les résultats souhaités, tandis que le second ne peut que se tourner vers le LLM et soupirer.
Si vous voulez bien utiliser le LLM, vous devez d’abord apprendre à l’utiliser. Cette demande a engendré un vaste marché de formation. Le projet prompt, tout en augmentant la difficulté d'utilisation de LLM, réduit également l'expérience utilisateur. LLM, qui aurait dû démontrer pleinement les avantages du langage naturel, est devenu moins convivial pour les utilisateurs ordinaires en raison de sa complexité.
De cette façon, le projet prompt est devenu une grande montagne entre les gens ordinaires et les grands modèles.
Comment mieux résoudre ce problème ? La réponse est AI Agent (appelé agent AI en Chine).
AI Agent est une entité intelligente capable de percevoir l'environnement, de prendre des décisions et d'effectuer des actions. Différent de l’IA traditionnelle, AI Agent a la capacité d’atteindre progressivement un objectif donné en pensant de manière indépendante et en appelant des outils.
Après l'arrivée de LLM, AI Agent a été défini comme un agent piloté par LLM pour réaliser un traitement automatisé de problèmes généraux.
Nous savons que LLM est principalement efficace dans le traitement et la génération de texte. Ils peuvent répondre aux questions, rédiger des articles, générer du contenu créatif, aider à la programmation, etc. Mais LLM reste un outil passif qui ne produit une sortie que lorsque vous lui donnez une entrée.
Les agents IA offrent un plus large éventail de capacités, notamment en termes d'interaction avec l'environnement, de prise de décision proactive et d'exécution de diverses tâches. On peut dire que l'agent IA est la clé pour véritablement libérer le potentiel du LLM. Il peut fournir de puissantes capacités d'action au cœur du LLM.
La principale différence entre AI Agent et les grands modèles est que l'interaction entre les grands modèles et les humains est basée sur la mise en œuvre. Le fait que l'utilisateur soit clair et sans ambiguïté affectera l'effet de la réponse du grand modèle. Il n'y a pas de réponse précise et efficace, pas même le ChatGPT le plus performant.
Le travail de l'agent AI n'a besoin que d'un objectif, et il peut penser de manière indépendante et agir en fonction de l'objectif. Il décomposera chaque étape de planification en détail en fonction de la tâche donnée, en s'appuyant sur les commentaires du monde extérieur et la réflexion indépendante pour créer pour lui-même pour atteindre l'objectif.
Par exemple, si vous demandez à ChatGPT d'acheter une tasse de café, les commentaires donnés par ChatGPT sont généralement similaires à « Vous ne pouvez pas acheter de café, c'est juste un assistant textuel d'IA. »
Mais vous devez demander à l'outil AI Agent basé sur ChatGPT d'acheter une tasse de café. Il vous expliquera d'abord comment acheter une tasse de café pour vous et planifiera plusieurs étapes telles que passer une commande et payer en votre nom. via une application, puis suivez ces étapes pour appeler l'application afin de sélectionner des plats à emporter. Appelez ensuite le programme de paiement pour passer une commande et payer. Le processus ne nécessite pas que les humains spécifient chaque étape de l'opération.
Bien que les outils et les agents d’IA soient des logiciels conçus pour automatiser des tâches, des caractéristiques clés spécifiques distinguent les agents d’IA des logiciels d’IA plus complexes.
Lorsqu'un outil d'IA présente les caractéristiques suivantes, il peut être considéré comme un agent d'IA :
**Autonomie : **Les agents virtuels IA sont capables d'effectuer des tâches de manière indépendante sans intervention ni intervention humaine.
**Perception : **Les fonctions d'agent perçoivent et interprètent leur environnement grâce à divers capteurs (tels que des caméras ou des microphones).
**Réactivité : **Les agents d'IA peuvent évaluer l'environnement et réagir en conséquence pour atteindre leurs objectifs.
**Raisonnement et prise de décision : **Les agents IA sont des outils intelligents capables d'analyser les données et de prendre des décisions pour atteindre les objectifs. Ils utilisent des techniques de raisonnement et des algorithmes pour traiter les informations et prendre les mesures appropriées.
Apprentissage : Ils peuvent apprendre et améliorer leurs performances grâce à des éléments et des techniques d'apprentissage automatique, approfondi et par renforcement.
**Communication : **Les agents d'IA peuvent communiquer avec d'autres agents ou humains en utilisant différentes méthodes, telles que la compréhension et la réponse au langage naturel, la reconnaissance de la parole et l'échange de messages par texte.
Orientés vers des objectifs : Ils visent à atteindre des objectifs spécifiques, qui peuvent être prédéfinis ou appris grâce à l'interaction avec l'environnement.
**En termes de catégories, les agents d'IA peuvent actuellement être divisés en agents autonomes (Autonomous Agents) et agents génératifs (Generative Agents). **
Les agents autonomes tels qu'Auto-GPT peuvent effectuer automatiquement des tâches et obtenir les résultats attendus en fonction des besoins des utilisateurs grâce au langage naturel. Dans ce modèle de coopération, l’agent autonome sert principalement les humains et s’apparente davantage à un outil efficace.
Les agents générateurs, comme la ville de Westworld créée conjointement par des chercheurs de Stanford et de Google ou les robots humanoïdes de « Westworld », vivent dans le même environnement, ont leurs propres souvenirs et objectifs, et interagissent non seulement avec les humains, mais aussi avec chacun. autre.Autres interactions du robot.
Concernant les agents IA, le document de synthèse de 86 pages sur les agents basés sur LLM récemment lancé par l'équipe de traitement du langage naturel de l'Université de Fudan (FudanNLP) résume de manière exhaustive l'état actuel des agents intelligents basés sur des modèles de langage à grande échelle, notamment : l'arrière-plan, la composition, et l'application de la scène des agents basée sur le LLM et de la société d'agence très discutée.
Cela dit, de nombreux amis n’ont peut-être toujours pas une idée intuitive des agents IA. Ne vous inquiétez pas, nous utiliserons ci-dessous un cas comparatif pour approfondir votre compréhension.
Les agents intelligents de l'IA pénètrent dans divers domaines
AiAgent.app est une application Web qui permet aux utilisateurs de créer des agents IA personnalisés pour effectuer des tâches spécifiques et atteindre des objectifs.
Ci-dessous, Wang Jiwei Channel examinera les avantages des agents IA à travers l'expérience comparative de l'utilisation d'agents IA et de l'utilisation directe du LLM.
Par exemple, si vous souhaitez connaître l'actualité et les tendances de l'industrie de l'IA au cours du mois dernier, saisissez dans Claude : un résumé des dernières actualités et tendances de l'industrie de l'IA au cours du mois dernier.
Le résultat obtenu est le suivant :
Comme vous pouvez le constater, Claude n’a répertorié que quelques résumés d’informations liées à l’IA.
Entrez ce paragraphe dans AiAgent.app, il décomposera d'abord vos besoins en dix tâches, puis interagira avec l'utilisateur via des invites pour terminer chaque tâche et affichera les résultats pour chaque tâche. De toute évidence, le contenu sur l'industrie récente de l'IA obtenu dans AiAgent.app est plus complet que celui obtenu en utilisant directement d'autres LLM.
Est-il possible d’obtenir ce contenu directement à partir de grands modèles ? Théoriquement, il peut être complété en saisissant davantage, mais il doit être saisi au moins dix fois, et l'exactitude de la saisie ne peut pas être garantie, et parfois vous ne savez même pas quelles informations vous souhaitez obtenir.
Dans AiAgent.app, vous n'avez besoin de saisir qu'une seule phrase, et il analysera vos besoins possibles et listera des objectifs de contenu relativement complets, vous guidant pour accomplir ce que vous voulez, et l'efficacité augmentera plusieurs fois.
En comparant les deux, il est clair qu’AI Agent est supérieur en termes de richesse et d’efficacité d’acquisition de contenu. Ce type d'agent de contenu informationnel est d'une grande valeur pour les praticiens des médias, les analystes industriels et d'autres professions, et peut réduire considérablement le temps d'obtention des données de recherche.
Il existe désormais de tels agents ciblant des groupes d'utilisateurs et des scénarios d'application plus précis. Par exemple, GPT Researcher lancé par l'Université de Columbia est un agent pour les chercheurs basé sur ChatGPT, qui peut créer divers rapports de recherche permettant aux utilisateurs de promouvoir la recherche.
Ce cas ne concerne que l'acquisition de contenu. En fait, des agents pour plusieurs scénarios d'application ont émergé, qui suffisent à mobiliser davantage d'applications logicielles et même de périphériques matériels pour accomplir diverses tâches.
Par exemple, certaines personnes ont utilisé AutoGPT pour commander des repas, réserver des billets, prendre des taxis et faire du shopping ; les 25 agents IA de la ville de Westworld à Stanford marchent, sortent ensemble, discutent, boivent du café et partagent chaque jour l'actualité du jour ; Google Deepmind a a lancé l'utilisation d'agents robotiques pour les bras robotiques afin d'effectuer automatiquement diverses tâches ; Amazon a également lancé Amazon Bedrock Agents pour décomposer automatiquement les tâches de développement d'applications d'IA d'entreprise ; IBM Watson Health a aidé les médecins à diagnostiquer, traiter et surveiller les patients dans de nombreux hôpitaux.
Bien qu'Ai Agent ne soit plus populaire depuis longtemps, il a été soutenu par de nombreuses entreprises dans de nombreux domaines dès son apparition. Les capacités multimodèles des grands modèles de langage, associées à la plus grande puissance de calcul actuelle, ont permis aux agents, proposés il y a de nombreuses années, de gagner rapidement en valeur et d'être mis en œuvre dans davantage de domaines avec des taux de pénétration élevés.
Avec l'émergence d'agents d'IA open source tels que MetaGPT, de plus en plus de fournisseurs de technologie et d'équipes entrepreneuriales ont introduit des agents, et de plus en plus d'organisations ont reconnu et accepté les agents. Cela deviendra inévitablement rapidement le modèle principal de mise en œuvre du LLM dans divers domaines, aidant des milliers de personnes. des industries à changer de business.Bonne application LLM.
Inventaire de 60 agents IA dans le monde
AiAgent.app mentionné dans le cas ci-dessus est l'un des produits représentatifs d'AI Agent qui a pris de l'ampleur ces derniers mois. Plusieurs agents au pays et à l'étranger, y compris cet agent IA, peuvent être vus dans la liste d'inventaire du projet ci-dessous.
Afin de permettre à tout le monde de mieux comprendre les agents d'IA qui ont été lancés jusqu'à présent, Wang Jiwei Channel (id : jiwei1122) divise ces agents d'IA en rapports médiatiques, lancés au niveau national, basés sur l'industrie, à l'étranger et en projets GitHub. seront progressivement récompensés dans le futur.La bibliothèque du projet classe ces Agents en différentes catégories.
Les agents AI examinés dans cet article incluent à la fois des frameworks et des outils AI Agents et des produits AGENT basés sur certains frameworks open source. Dans le même temps, la plupart des projets et produits sont des agents autonomes.
Étant donné que certains fabricants sont relativement discrets et ne font pas de publicité au monde extérieur, les agents IA répertoriés dans cet article ne sont pas complets, c'est pourquoi on l'appelle également la liste incomplète des AGENTS IA. Davantage de fabricants et d'entrepreneurs sont invités à contacter la chaîne de Wang Jiwei après avoir lu cet article, et nous pouvons tous contribuer à la prospérité et au développement de l'écosystème AI AGENT.
Agent IA rapporté par les médias
1、Auto-GPT
Auto GPT est un projet open source gratuit sur Github qui combine les technologies GPT-4 et GPT-3.5 pour créer des projets complets via des API.
Contrairement à ChatGPT, les utilisateurs n'ont pas besoin de poser constamment des questions à l'IA pour obtenir les réponses correspondantes. Dans AutoGPT, il leur suffit de lui fournir un nom d'IA, une description et cinq objectifs, puis AutoGPT peut terminer le projet par lui-même. . Il peut lire et écrire des fichiers, naviguer sur le Web, consulter les résultats de ses propres invites et les combiner avec ledit historique des invites.
Auto-GPT est l’un des premiers exemples de GPT-4 fonctionnant de manière totalement autonome, repoussant les limites de ce que l’intelligence artificielle peut faire.
2、AgentGPT
AgentGPT vous permet de configurer et de déployer des agents IA autonomes. Nommez simplement votre IA personnalisée et dites-lui de commencer n'importe quel objectif imaginable, et elle essaiera de l'atteindre en réfléchissant à une tâche à accomplir, en exécutant la tâche et en apprenant des résultats.
3、Bébé AGI
Il s'agit d'un système de gestion de tâches basé sur l'IA. Le système utilise OpenAI et l'API Pinecone pour créer, prioriser et exécuter des tâches. Créez des tâches en analysant les résultats des tâches précédentes et les objectifs prédéfinis, et utilisez le traitement du langage naturel (NLP) et Chroma d'OpenAI pour stocker et récupérer les résultats des tâches dans leur contexte.
L'attrait de Baby AGI réside dans sa capacité à résoudre des tâches de manière autonome et à maintenir des objectifs prédéfinis basés sur les résultats des tâches précédentes, ainsi qu'à hiérarchiser efficacement les tâches.
4、Jarvis (HuggingGPT)
Un système de collaboration unique développé par Microsoft qui peut utiliser plusieurs modèles d'IA pour effectuer une tâche donnée, avec ChatGPT agissant comme contrôleur de tâches. Le projet, connu sous le nom de JARVIS sur GitHub, est désormais disponible pour essai sur Huggingface (d'où HuggingGPT), un agent qui fonctionne extrêmement bien avec le texte, les images, l'audio et même la vidéo.
La façon dont cela fonctionne est similaire à la façon dont OpenAI démontre les capacités multimodales de GPT 4 à travers du texte et des images, mais JARVIS va encore plus loin et intègre divers LLM open source pour les images, les vidéos, l'audio, etc., et peut également se connecter à Internet et accéder aux fichiers. Par exemple, vous pouvez saisir l'URL d'un site Web et poser des questions à ce sujet.
5、Aiagent.app
Ai Agent est une application Web qui permet aux utilisateurs de créer des agents IA personnalisés pour effectuer des tâches spécifiques et atteindre des objectifs. Les agents IA fonctionnent en décomposant les objectifs en tâches plus petites et en les accomplissant une par une. Les avantages incluent la possibilité d’exécuter plusieurs agents d’IA simultanément et la démocratisation de l’accès à une technologie de pointe.
AI Agent propose également des fonctionnalités telles que des blocs de code en ligne avec coloration syntaxique et une collaboration transparente avec des plates-formes tierces. L'outil est gratuit et offre un moyen simplifié de créer des agents d'IA sans nécessiter de connaissances techniques supplémentaires.
6、CamelAGI
Camel AGI est un outil d'IA générative qui permet aux utilisateurs de résoudre des tâches données en jouant un rôle d'agents d'IA autonomes. Bien entendu, les utilisateurs doivent activer Java pour utiliser cet outil. Camel AGI permet aux utilisateurs d'effectuer des tâches à l'aide d'agents IA et offre la possibilité de se connecter avec Google ou de lancer l'outil sur Github.
7. Simulation "Westworld" Ville de Westworld
Pour ce projet, des chercheurs de l'Université de Stanford et de Google ont créé un environnement sandbox interactif contenant 25 agents d'IA génératifs capables de simuler le comportement humain. Ils se promenaient dans le parc, buvaient du café dans les cafés et partageaient des nouvelles avec des collègues, faisant preuve d'un comportement social étonnamment bon.
Par exemple, à partir d'un concept spécifié par l'utilisateur selon lequel un agent souhaite organiser une fête pour la Saint-Valentin, l'agent répartit automatiquement les invitations aux fêtes sur les deux prochains jours, se fait de nouveaux amis, se demande mutuellement d'aller à des rendez-vous et à des fêtes et coordonne les événements. au bon moment. Il est temps de se présenter ensemble aux fêtes.
8、Ingénieur GPT
GPT-Engineer est un outil d'IA open source qui permet aux utilisateurs de spécifier ce qu'ils souhaitent construire, puis d'avoir une conversation de clarification avec l'IA pour générer la base de code requise. L'outil est conçu pour offrir une expérience utilisateur simple et flexible, permettant aux utilisateurs d'adapter et d'étendre ses fonctionnalités en fonction de leurs besoins.
L'outil comprend des fonctions telles que la spécification de l'identité de l'agent IA, le stockage de l'historique des communications avec GPT4 et la réexécution des journaux de messages. Les contributions au projet sont les bienvenues et les personnes intéressées peuvent se référer à la feuille de route, aux projets et aux problèmes disponibles sur le référentiel GitHub. GPT-Engineer vise à être une plate-forme ouverte permettant aux développeurs d'explorer et de créer leur boîte à outils de génération de code.
9、MétaGPT
MetaGPT, lancé par Meta Corporation, est un framework multi-agents qui utilise une entrée sur une seule ligne pour générer des API, des user stories, des structures de données, des analyses concurrentielles, etc. Ce cadre peut servir de chefs de produit, d'ingénieurs logiciels et d'architectes. Le framework peut agir comme un éditeur de logiciels à part entière, orchestrant les SOP avec une seule ligne de code.
MetaGPT est intégré à la conception des processus SOP humains. Par conséquent, les agents basés sur LLM génèrent des documents et des conceptions de haute qualité, diversifiés et structurés. MetaGPT est conçu pour faciliter la conception de solutions pour des tâches complexes et fournir des capacités de résolution de problèmes presque comparables à l'intelligence humaine.
10、Agents du substrat rocheux d'Amazon
Les agents Amazon Bedrock publiés par Amazon permettent aux développeurs de créer rapidement des agents entièrement gérés. En exécutant des appels d'API vers les systèmes d'entreprise, les agents Amazon Bedrock accélèrent la publication d'applications d'IA générative qui gèrent et exécutent des activités.
Les agents Amazon Bedrock simplifient l'ingénierie et l'orchestration rapides des tâches de demande des utilisateurs. Une fois configurés, ces agents peuvent créer de manière autonome des invites et les améliorer en toute sécurité avec des données spécifiques à l'entreprise pour fournir des réponses en langage naturel aux utilisateurs. Ces agents avancés ont la capacité de déduire les actions nécessaires pour traiter automatiquement les demandes des utilisateurs.
11、nvidia Voyager
Voyager, lancé conjointement par NVIDIA, le California Institute of Technology et d'autres, utilise GPT-4 pour guider l'apprentissage des agents Minecraft à travers le monde des pixels. Il convient de noter que Voyager s'appuie sur la génération de code plutôt que sur l'apprentissage par renforcement.
Voyager est le premier agent d'apprentissage tout au long de la vie à jouer à Minecraft. Contrairement aux autres agents Minecraft qui utilisent des techniques classiques d'apprentissage par renforcement, Voyager utilise GPT-4 pour s'améliorer continuellement, en écrivant, en améliorant et en transférant du code stocké dans une bibliothèque de compétences externe.
Cela se traduit par de petits programmes qui aident à la navigation, à ouvrir des portes, à extraire des ressources, à fabriquer des pioches ou à combattre des zombies. GPT-4 ouvre un nouveau paradigme dans lequel la « formation » est l'exécution de code et les « modèles de formation » sont la base de code de compétences que Voyager assemble de manière itérative.
12、RoboAgent
L'équipe de recherche commune de Meta et de la CMU a mis deux ans pour développer avec succès l'agent robot universel RoboAgent. RoboAgent a acquis 12 compétences complexes différentes grâce à une formation avec seulement 7 500 trajectoires, notamment cuisiner, ramasser des objets, servir du thé, nettoyer la cuisine et d'autres tâches, et peut être généralisée et appliquée dans 100 scénarios inconnus.
RoboAgent reste concentré sur sa tâche, quelle que soit l'ampleur des interférences qu'il rencontre. L'objectif de cette recherche est d'établir un paradigme d'apprentissage robot efficace qui répond aux défis de la diversité des ensembles de données et des scènes. Les chercheurs ont proposé l’architecture MT-ACT (Multi-Task Action Blocking Transformer) pour gérer les ensembles de données de robots multimodaux et multitâches grâce à une amélioration sémantique et une représentation efficace des politiques.
13、Inflection AI Pi
Le cerveau central du produit personnel AI Agent Pi lancé par Inflection AI est le grand modèle Inflection-1 développé par la société, et ses performances sont comparables à GPT-3.5. Contrairement aux chatbots généralistes populaires, Pi ne peut que mener des conversations amicales, offrir des conseils concis ou même simplement écouter.
Ses principales caractéristiques sont la compassion, l'humilité, la curiosité, l'humour et l'innovation, ainsi qu'une bonne intelligence émotionnelle. Il peut fournir des connaissances et une camaraderie illimitées en fonction des intérêts et des besoins uniques des utilisateurs. Depuis qu'Inflection a développé Pi, il a été déterminé que Pi servirait d'intelligence personnelle (Personal Intelligence), et pas seulement d'outil pour aider les gens dans leur travail.
14、HyperÉcriture
Hyperwrite est un outil d'agent d'écriture IA qui aide les rédacteurs créatifs de tout niveau à écrire plus rapidement et avec plus de confiance. Il comprend des fonctionnalités telles que l'écriture automatique et la saisie anticipée pour générer des paragraphes originaux et proposer des idées pour surmonter le blocage de l'écrivain.
L'outil est disponible sous forme d'extension Chrome gratuite et peut être utilisé sur n'importe quel site Web sans interrompre le flux de travail. Il est utilisé et approuvé par les professionnels, les étudiants et les créateurs du monde entier pour augmenter leur productivité.
15、Chercheur GPT
GPT Researcher est un agent autonome basé sur l'IA utilisé pour effectuer des recherches en ligne complètes sur diverses tâches. Inspiré d'AutoGPT et de l'invite « Planifier et résoudre », l'outil vise à améliorer les problèmes de vitesse et de déterminisme rencontrés dans les modèles de langage actuels, « en offrant des performances plus stables et des vitesses plus élevées en travaillant avec des agents parallèles plutôt qu'en fonctionnant de manière synchrone ».
Selon l'équipe, les chercheurs de GPT facilitent la recherche en générant des questions de recherche pertinentes, en regroupant les données de plus de 20 sources Web et en exploitant GPT3.5-turbo-16 et GPT-4 pour créer des rapports de recherche complets.
AI Agent lancé en Chine
Après une exploration et une expérimentation continues, des produits nationaux liés aux agents d'IA ont également commencé à émerger. Voici cinq produits.
1. Alibaba Cloud ModelScopeGPT
La communauté Alibaba Cloud Mota a lancé le premier outil d'appel de modèles à grande échelle en Chine, ModelScopeGPT. Grâce à cet outil, les utilisateurs peuvent appeler d'autres modèles d'intelligence artificielle de la communauté Mota en envoyant des instructions en un seul clic, réalisant ainsi de grandes et petites applications. pour accomplir des tâches complexes.
ModelScopeGPT est basé sur le cadre de développement open source de grand modèle de langage (LLM) AI Agent (agent) ModelScope-Agent. Il s'agit d'un cadre d'agent général et personnalisable pour des applications pratiques. Il est basé sur des modèles de langage étendus (LLM) open source comme noyau et comprend des modules tels que le contrôle de la mémoire et l'utilisation des outils.
Le LLM open source est principalement responsable de la planification des tâches, de l'ordonnancement et de la génération de réponses ; le module de contrôle de la mémoire comprend principalement la récupération des connaissances et la gestion (mot d'invite) ; le module d'utilisation des outils comprend une bibliothèque d'outils, la récupération d'outils et la personnalisation des outils.
2. Agent TARS-RPA vraiment intelligent
TARS-RPA-Agent, lancé par Real Intelligence dans le domaine de l'hyper-automatisation, est un agent hyper-automatique basé sur le moteur bimode « TARS+ISSUT (Intelligent Screen Semantic Understanding) », doté d'un « cerveau » et d'un « yeux, mains et pieds". Il s'agit d'un nouveau produit modèle RPA qui peut démonter de manière autonome des tâches, percevoir l'environnement actuel, exécuter et fournir des commentaires, et mémoriser l'expérience historique.
TARS-RPA-Agent adopte un cadre technique basé sur le grand modèle TARS et la compréhension sémantique de l'écran intelligent ISSUT. Le cadre technique est divisé en deux couches : la couche inférieure est la série TARS de grands modèles comprenant des modèles de base généraux et des modèles de base de diverses industries verticales, ainsi qu'une technologie de compréhension sémantique d'écran intelligent ; la couche supérieure est le modèle ultra-large qui s'appuie sur ces deux technologies clés pour réaliser des mises à niveau et des transformations complètes.Produits d'automatisation.
Le LLM principal de TARS-RPA-Agent est le grand modèle vertical "TARS" auto-développé par Real Intelligence, basé sur une base de grand modèle générale. Le grand modèle TARS a d'excellentes fonctions courantes telles que la génération de texte, la compréhension du langage, les questions et réponses de connaissances, et le raisonnement logique.
3. Agent intelligent OmBot ohm
Lors de la Conférence mondiale sur l'intelligence artificielle de 2023, Lianhui Technology a lancé OmBot, un agent autonome (Auto AI Agent) basé sur les capacités de grands modèles, et a lancé le premier lot d'applications pour les exigences typiques des scènes.
L'agent autonome Lianhui contient les quatre capacités principales que sont la cognition, la mémoire, la pensée et l'action. En tant qu'agent automatique et autonome, il fonctionne en boucle sous la forme la plus simple. À chaque itération, ils génèrent des instructions et des opérations autodirigées. Par conséquent, il ne repose pas sur des humains pour guider les commandes et est hautement évolutif.
4. Technologie Lanma Demandez à XBot
La plate-forme d'agent "Ask XBot" construite par Lanma Technology est divisée en deux couches : la première couche est l'autonomisation des experts. Les experts définissent les flux de travail et les enseignent aux machines par glisser-déposer, glisser et dialoguer, aidant ainsi les employés de première ligne à construire Méthodologie pour un travail plus efficace ; le deuxième niveau est pour les employés d'utiliser l'Agent. Les employés de première ligne peuvent communiquer avec l'Agent via un langage naturel et émettre des instructions, permettant à l'Agent d'aider à l'analyse des données, à la récupération d'informations et à d'autres tâches.
L'entreprise prévoit de faire en sorte que les clients Ask puissent être servis plus efficacement et plus intelligemment sur la plate-forme.
5、ChatDev
ChatDev, lancé par une équipe de recherche conjointe de l'Université Tsinghua, de l'Université des postes et télécommunications de Pékin et de l'Université Brown, est un agent générateur. Il s'agit d'un cadre de développement logiciel de bout en bout basé sur le chat qui exploite les grands modèles de langage (LLM) pour faciliter une communication et une collaboration efficaces entre plusieurs acteurs (version "gpt3.5-turbo-16k" de ChatGPT) dans le processus de développement logiciel. .
L'objectif principal de ChatDev est le développement de jeux via le chat. Les utilisateurs n'ont qu'à proposer des idées, et l'ensemble du processus, de la conception aux tests, est réalisé par l'IA, et l'ensemble du processus ne prend que sept minutes.
Produits AI Agent pour différents domaines
Avant l’apparition du LLM, certaines entreprises étudiaient déjà la combinaison de l’IA traditionnelle et de l’Agent. Par conséquent, la mise en œuvre d’AI Agentmt dans divers domaines est beaucoup plus rapide que prévu.
Vous trouverez ci-dessous des applications d'agent représentatives dans plusieurs domaines industriels.
Dans le domaine médical, les agents peuvent aider à diagnostiquer, traiter et surveiller les patients. IBM Watson Health est un agent d'IA qui analyse les données médicales pour identifier les problèmes de santé potentiels et recommander des options de traitement.
Dans le domaine financier, les agents peuvent analyser les données financières, détecter les fraudes et faire des recommandations d'investissement. Charles Schwab utilise un agent d'intelligence artificielle appelé Intelligent Portfolio pour créer et gérer des portefeuilles d'investissement en fonction des objectifs d'investissement des clients.
Dans les scénarios de vente au détail, les agents peuvent fournir des recommandations personnalisées, améliorer la gestion de la chaîne d'approvisionnement et améliorer l'expérience client. Alexa d'Amazon est un agent IA qui peut recommander des produits, passer des commandes et suivre les expéditions.
Dans le domaine de la fabrication, Agent peut optimiser les processus de production, prévoir les besoins de maintenance et améliorer la qualité des produits. General Electric utilise un agent d'IA appelé Predix pour surveiller les machines en temps réel afin de prédire et de prévenir les pannes d'équipement.
Dans le domaine des transports, les agents IA autonomes peuvent aider à la planification des itinéraires, à la gestion du trafic et à la sécurité des véhicules. Le Autopilot de Tesla aide les véhicules autonomes et aide les conducteurs à se garer, à changer de voie et à conduire en toute sécurité.
Dans le secteur de l'éducation, Agnet peut offrir une expérience d'apprentissage personnalisée, automatiser les tâches administratives et analyser les performances des étudiants. L'agent IA de Pearson Aida peut fournir des commentaires aux étudiants et suggérer des parcours d'apprentissage personnalisés.
En agriculture, les agents d’IA peuvent optimiser la production agricole, surveiller la qualité des sols et prédire les conditions météorologiques. John Deere utilise un agent d'IA appelé See&Spray pour détecter et localiser les mauvaises herbes sans affecter les cultures.
D'autres produits AGENT ont été lancés à l'étranger
1、Cognosys
Cognosys est un agent d'IA basé sur le Web conçu pour révolutionner la productivité et simplifier les tâches complexes, en utilisant la technologie d'IA la plus avancée pour améliorer votre vie quotidienne.
2、Doanythingmachine
Gérez facilement vos tâches avec une machine à tout faire où l'agent IA personnel de l'utilisateur priorisera et terminera vos tâches pour vous.
3、alphakit
Une plateforme intuitive pour créer et gérer des équipes d'agents IA autonomes axés sur des objectifs, le tout depuis votre téléphone Créez et gérez des équipes d'agents IA autoGPT. Définissez simplement vos objectifs et Alphakit s'occupe du reste.
4、GPTConsole
GPTConsole est une interface de ligne de commande (CLI) révolutionnaire conçue pour offrir aux développeurs les avantages de l'intelligence artificielle. Il va au-delà des fonctionnalités traditionnelles des terminaux pour permettre aux utilisateurs d'effectuer des tâches complexes à l'aide d'invites.
5、Finitions
Convertissez votre base de connaissances en chat IA en 2 minutes en fournissant un lien vers la base de connaissances. Fini fournit aux utilisateurs un agent IA infatigable prêt à répondre immédiatement aux questions des clients 24h/24 et 7j/7.
6、Sort
Spell est un agent d'IA autonome basé sur GPT4 qui peut être appliqué à un travail quotidien efficace. Spell possède également des fonctionnalités indispensables pour vous aider à travailler plus intelligemment et à apprendre à exploiter la puissance de l'IA générative pour générer un ou plusieurs agents autonomes innovants qui s'efforceront de résoudre vos problèmes.
7、Aomni
Aomni est un agent d'IA de recherche d'informations qui peut trouver, extraire et traiter pour vous toutes les données sur Internet, améliorant ainsi votre travail de recherche. Aomni peut utiliser une variété d'outils pour planifier intelligemment vos requêtes pour obtenir les résultats finaux, y compris un navigateur Web complet qui lui permet d'accéder à n'importe quelle information sur Internet sans avoir besoin d'une API.
Le planificateur de requêtes d'Aomni est basé sur l'architecture AutoGPT de pointe actuelle, planifiant et mettant à jour intelligemment chaque requête pour garantir l'exactitude et la diversité des sources.
8、Fine-Tuner.ai
Avec Fine-Tuner.ai, les utilisateurs peuvent créer des agents d'IA complexes et sur mesure sans compétences techniques ni codage, en saisissant simplement vos données et vos idées. Plus d'une douzaine d'agents d'IA professionnels peuvent créer des questions-réponses précises, une recherche de documents, une automatisation des processus, etc. pour les utilisateurs grâce à des données en temps réel téléchargées telles que PDF, CV, PPT et URL.
9、SuperAGI
Un framework d'IA autonome open source qui vous permet de développer et de déployer rapidement et de manière fiable des agents autonomes utiles, ainsi qu'une infrastructure pour créer, gérer et exécuter des agents autonomes.
10、Jaune.ai
Yellow.ai est la principale plateforme d'IA conversationnelle d'entreprise qui alimente les agents d'IA dynamiques dans l'entreprise, conçue pour offrir des interactions de type humain via sa plateforme no-code/low-code afin d'augmenter la satisfaction des clients et d'accroître l'engagement des employés.
11、Mode divin
Permet aux utilisateurs d'exécuter AutoGPT dans le navigateur. Godmode permet aux utilisateurs de déployer plusieurs agents IA en même temps pour effectuer des tâches à l'aide de l'IA, et les utilisateurs peuvent également utiliser leurs propres clés API OpenAI.
12、E42
E42 est une plateforme d'automatisation des processus cognitifs qui permet aux entreprises de créer des agents cognitifs multifonctionnels pour automatiser divers processus entre fonctions. La plateforme cognitive et sans code s’intègre parfaitement à la technologie et aux processus existants des utilisateurs pour libérer la plus grande valeur dans tous les départements. Les utilisateurs peuvent utiliser E42 pour créer leurs propres agents IA, tels que des analystes IA et des recruteurs IA dans des secteurs verticaux.
13、Remerciant
Les agents IA de Thankful sont formés et adaptés pour travailler au sein de votre service d'assistance existant, résolvant facilement les demandes de clients à volume élevé par e-mail, chat, SMS et canaux intégrés à l'application. Avec la capacité de comprendre, de connecter, de résoudre, de personnaliser et d’informer, les agents ThankfulAI offrent des expériences de service de type humain avec une vitesse comparable à celle d’une machine et une expertise intrinsèquement évolutive.
14、Aktify
Utilisez les agents d'IA virtuels d'Aktify pour cloner votre équipe commerciale sans augmenter les effectifs. Aktify gérera un nombre illimité de prospects qui ne répondent pas à grande échelle et amènera systématiquement les clients prêts à parler à la porte de votre équipe commerciale. C'est plus qu'un simple chatbot SMS.
15、TeamSmart AI
Augmentez votre productivité avec un accès en un clic à TeamSmart AI. Regroupez du contenu, générez du code, rédigez des tweets et bien plus encore directement dans votre navigateur. ChatGPT s'ouvre instantanément d'un simple clic sur l'icône ou d'un raccourci clavier, offrant un accès instantané à une bibliothèque de conseils de qualité sans vous connecter.
16、Réflexion sur GPT
BrainstormGPT intègre plusieurs agents, LLM et recherche automatique pour simplifier la conversion de sujet en rapport de réunion. Les sujets personnalisés, les rôles définis par l'utilisateur, les discussions autonomes des agents et les rapports générés dans un délai de 20 minutes équivalent approximativement à 300 recherches, 10 heures de discussions et 100 000 analyses de texte.
17、AgentRunner.Ai
AgentRunner.ai est un outil de création d'agents d'IA autonomes qui exploite la puissance de GPT-4 pour créer et former des agents entièrement autonomes. Permet aux utilisateurs de définir des objectifs pour leurs agents et de les laisser décider comment atteindre ces objectifs sans aucune connaissance technique ni compétence en programmation.
L'outil offre des fonctionnalités telles que la création d'agents autonomes dotés de personnalités uniques, l'exécution de l'agent pour effectuer des tâches ou acquérir de nouvelles compétences, décider de ce que l'agent peut faire et l'intégration avec des comptes OpenAI ou Google Cloud.
18、Reste
Gista aide les entreprises à interagir avec les visiteurs de leur site Web et à les convertir en prospects 24h/24 et 7j/7, et ses principales fonctionnalités incluent la création d'agents de conversion IA et d'agents commerciaux IA. Grâce à Gista, les entreprises peuvent facilement convertir les visiteurs de leur site Web en prospects et créer des listes de diffusion.
19、Agent4
L'une des fonctionnalités clés d'Agent4 est la possibilité de créer des agents virtuels basés sur l'IA, capables de répondre aux questions, d'aider à planifier des réunions, d'écouter des messages vocaux et de fournir des résumés.
Vous pouvez facilement créer des interactions personnalisées pour les agents, leur permettant de répondre aux questions et de gérer diverses tâches avec la voix de votre marque. Vous pouvez également choisir la manière dont les agents répondent aux appels en temps réel et décider si et quand vous devez parler à quelqu'un.
20、Cometcore IA
Cometcore AI est une plate-forme innovante qui fournit un ensemble polyvalent d'outils basés sur l'IA pour améliorer la productivité et la communication. Avec Cometcore, vous pouvez créer, coder et automatiser des agents mignons.
21、assistant personnel
Un agent IA conçu pour tout gérer, de la réservation de vols à la réalisation de recherches approfondies et tout le reste.
Projet AI Agent sur Github
1、OpenAGI
OpenAGI est une plateforme de recherche AGI open source spécialement conçue pour fournir des tâches complexes en plusieurs étapes, accompagnées d'ensembles de données spécifiques à la tâche, de mesures d'évaluation et d'une variété de modèles évolutifs. OpenAGI formule des tâches complexes sous forme de requêtes en langage naturel en entrée de LLM. Le LLM sélectionne, synthétise et exécute ensuite les modèles fournis par OpenAGI pour résoudre la tâche.
Le projet a également proposé un mécanisme d'apprentissage par renforcement par retour de tâches (RLTF), qui utilise les résultats de la résolution de tâches comme retour d'information pour améliorer les capacités de résolution de tâches de LLM. LLM est chargé de synthétiser divers modèles externes pour résoudre des tâches complexes, tandis que RLTF fournit des commentaires pour améliorer ses capacités de résolution de tâches, fournissant ainsi une boucle de rétroaction pour une IA qui s'auto-améliore. Le paradigme du LLM exploitant divers modèles experts pour résoudre des tâches complexes est une approche prometteuse de l’AGI.
2、Agent-LLM
Agent-LLM est une plate-forme d'automatisation de l'IA conçue pour optimiser la gestion efficace des instructions d'IA auprès de plusieurs fournisseurs.
L'agent est équipé d'une mémoire adaptative et cette solution polyvalente offre un système de plug-in puissant qui prend en charge une variété de commandes, y compris la navigation Web. Avec la prise en charge croissante de nombreux fournisseurs et modèles d'IA, Agent-LLM continue d'évoluer pour améliorer une variété d'applications.
3、AutoGPT-Next-Web
Cet agent peut déployer l'interface utilisateur Web AutoGPT-Next-Web bien conçue sur Vercel en un seul clic et déployer gratuitement votre application Web privée AutoGPT-Next-Web en un seul clic. Basé sur AutoGPT-Next-Web, les utilisateurs peuvent utiliser Vercel pour déployer gratuitement en un clic et créer un site Web AutoGPT personnel en 1 minute.
4、MiniGPT-4
Cet agent peut utiliser de grands modèles de langage avancés pour améliorer la compréhension du langage visuel.
5、Mini-AGI
Mini-AGI est le plus petit agent autonome à usage général basé sur GPT3.5/4. Il combine des invites puissantes, un ensemble minimal d'outils et une mémoire à court terme (enchaînement de pensées), avec une augmentation des données via le stockage vectoriel qui sera bientôt ajouté, pour analyser les cours des actions, effectuer des tests de cybersécurité, créer des œuvres d'art et commander des pizzas.
6、Adolescent-AGI
Inspiré de plusieurs projets liés à l'Auto-GPT (principalement BabyAGI) et de l'article "Generative Agents: Interactive Simulation of Human Behaviour", ce projet Python utilise OpenAI et Pinecone pour fournir de la mémoire à un agent IA et lui permettre de "réfléchir" avant d'agir. (sortie de texte).
7、FastGPT
FastGPT est un système de questions et réponses de base de connaissances basé sur le grand modèle de langage LLM, offrant un traitement de données prêt à l'emploi, des appels de modèles et d'autres fonctionnalités. Dans le même temps, le flux de travail peut être orchestré via la visualisation Flow pour réaliser des scénarios de questions et réponses complexes.
8、DémoGPT
Avec DemoGPT, vous pouvez créer rapidement une démo en utilisant uniquement des phrases simples.
9、AGILocal
Exécutez localement des projets AGI basés sur LLMDA, ChatGLM et d'autres modèles.
10. ai-town (catégorie de jeu)
La ville IA open source de la célèbre institution d'investissement a16z est un kit de démarrage déployable sous licence MIT pour créer et personnaliser votre propre version d'une ville IA. Il s'agit d'une ville virtuelle où les personnages de l'IA vivent, discutent et socialisent.
11, gptrpg (catégorie de jeu)
gptrpg Ce référentiel contient deux éléments : un simple environnement de type RPG pour un agent IA compatible LLM et un simple agent IA qui se connecte à l'API OpenAI pour exister dans cet environnement.
12. SFighterAI (catégorie de jeu)
Le projet est un agent d'IA formé à l'aide d'un apprentissage par renforcement profond pour vaincre le boss final du jeu Street Fighter II: Special Champion Edition. L'agent IA prend des décisions basées uniquement sur les valeurs des pixels RVB de l'écran de jeu. Dans l'état de sauvegarde fourni, l'agent atteint un taux de victoire de 100 % au premier tour du niveau final.