マイクロソフトは最近、相互に通信できる複数のエージェントを使用してLLMアプリケーションを構築するためのフレームワークであるAutoGenを提案しました。 同様に、Google DeepMindは最近、「How FaR is Large Language Model from Agents with Theory-of Mind?」という論文を発表しました。 Meta's Shepherd: Language Model Generationの批評家でさえ、同じ自律型AIエージェントが自分でタスクを増強して実行すると語っています。
AutoGenは、次世代のLLMアプリケーションの作成を簡素化し、複雑なワークフローを自動化および最適化します。 この AI エージェントは複数の会話モードをサポートしており、開発者はエージェントの対話をカスタマイズできます。 さまざまなアプリケーション向けにさまざまな作業システムを提供し、OpenAIのツールを置き換えて推論APIを強化できます。
それについて知っておくべき6つの自律型AIエージェント
記事の出典:AI類人猿
過去数か月にわたって、自律型AIエージェントに関連する研究作業が大幅に増加し、特に大規模言語モデル(LLM)のコンテキストで、電子メールの送信、交渉、製品の製造、調達、注文の履行、航空券の予約、さらには近い将来のLLMの設定方法など、人々がインターネットやネットワークと対話する方法が変化しています。
LLMは現在、人間のガイダンスに依存しており、自律的な推論を欠いていますが、自律エージェントは独立して動作し、リアルタイムの意思決定を行い、変化するシナリオに適応することができます。 自律エージェントのエキサイティングなアプリケーションの1つは、LLMのパフォーマンスを向上させる機能です。 彼らはマルチエージェントの会話で協力し、フィードバックと推論のコミュニケーションを通じてLLMを改善することを可能にします。
マイクロソフトは最近、相互に通信できる複数のエージェントを使用してLLMアプリケーションを構築するためのフレームワークであるAutoGenを提案しました。 同様に、Google DeepMindは最近、「How FaR is Large Language Model from Agents with Theory-of Mind?」という論文を発表しました。 Meta's Shepherd: Language Model Generationの批評家でさえ、同じ自律型AIエージェントが自分でタスクを増強して実行すると語っています。
其他论文还包括 SELF: 大規模言語モデルのための言語駆動型自己進化 和 SelfEvolve: 大規模言語モデルによるコード進化フレームワーク。
OpenAIはまた、来月のDevDayで同様の製品(JARVISと呼ばれる)を発売する準備をしています。
以下は最新の自律型AIエージェントのリストです:
自動生成
たとえば、マイクロソフトのAutoGenは、LLMを活用して、学習、適応、さらにはコーディングが可能な汎用性の高いエージェントを作成します。 この機能の収束は、キャッシュや人間の介入などの機能と相まって、AIシステムを進化させ、繁栄させることができます。
AutoGenは、次世代のLLMアプリケーションの作成を簡素化し、複雑なワークフローを自動化および最適化します。 この AI エージェントは複数の会話モードをサポートしており、開発者はエージェントの対話をカスタマイズできます。 さまざまなアプリケーション向けにさまざまな作業システムを提供し、OpenAIのツールを置き換えて推論APIを強化できます。
ミュージックエージェント
マイクロソフトの研究者は最近、LLMを搭載した音楽の自律エージェントであるMusicAgentを発売しました。 伝えられるところでは、このAIエージェントは、開発者がユーザーの要求を自動的に分析し、ソリューションとして適切なツールを選択するのに役立ちます。 彼らの新しいフレームワークは、ハグフェイス、GitHub、ウェブ検索など、さまざまなソースからの多数の音楽関連ツールと直接統合されています。
これに加えて、研究者は自律ワークフローを調整して音楽タスクとの互換性を向上させ、ユーザーがツールセットを拡張できるようにしました。 より多くの音楽関連機能をMusicAgentに統合したい。
ミニアギ
MiniAGIは、GPT-3.5-TurboおよびGPT-4とシームレスに動作するシンプルな自律エージェントです。 強力なプロンプトと最小限のツールキット、一連の考え、要約付きの短期記憶を使用します。 さらに、それは独白と自己批判する能力を持っています。
マルチGPT
マルチGPTは、協調的なタスク達成のための「expertGPT」を備えた実験的なマルチエージェントシステムです。 各ExpertGPTは、個別の短期記憶と長期記憶、および他の人と通信する能力を備えています。 ユーザーはタスクを割り当てることができ、expertGPTは協力してタスクを完了します。
システムは、情報の収集と検索のためのインターネットアクセスを提供します。 短期記憶と長期記憶の両方を効果的に管理します。 テキスト生成にGPT-4インスタンスを使用し、人気のあるWebサイトやプラットフォームへのアクセスを提供し、GPT-3.5を使用したファイルストレージと要約が含まれています。 これにより、Multi-GPTはさまざまなタスクやデータ管理のニーズに対応する用途の広いツールになります。
ビーボット
BeeBotは、さまざまな実用的なタスクを簡素化および自動化するように設計された自律型AIアシスタントです。 BeeBotを使用すると、ユーザーはAutoPackを介してツールを選択する便利さを体験でき、タスクの進化に応じて追加のツールに柔軟にアクセスできます。 さらに、組み込みの永続性により、BeeBotは情報を記憶して呼び出すことができるため、より信頼性の高いアシスタントになります。
e2bと呼ばれる一般的な標準に従うREST APIのおかげで、さまざまなシステムやサービスで簡単に動作できます。 BeeBotはまた、WebSocketサーバーを使用して更新をリアルタイムで共有することにより、ユーザーに情報を提供します。 メモリ内、コンピューター上、データベース内など、ファイルを格納するさまざまな方法で動作します。
ベビーアギ
Baby AGI は、OpenAI と Pinecone API と LangChain フレームワークを使用してタスク管理を簡素化する Python スクリプトです。 このAI駆動型システムは、過去のタスクから学んだ、事前定義された目標に基づいてタスクを作成、整理、優先順位付け、および実行することに優れています。
Baby AGIは、OpenAIの自然言語処理(NLP)機能を活用して、確立された目標に沿った新しいタスクを策定します。 Pineconeはタスクの結果を保存し、コンテキストを取得するためのリポジトリとして機能し、LangChainフレームワークは決定を処理します。