60 đại lý AI bạn phải tham khảo khi khởi nghiệp kinh doanh mô hình ngôn ngữ lớn

Nguồn: TMTpost Media

Vào tháng 4, không lâu sau khi Baidu phát hành Wen Xin Yi Yan, nhiều người vẫn than thở rằng những bức ảnh do Wen Xin Yi Yan tạo ra thật hạnh phúc biết bao. Thậm chí, nhiều người còn phát điên vì các khóa đào tạo khác nhau như ChatGPT và Midjourney. đang nghĩ đến cơ hội giới thiệu Đại lý AI tới hàng tỷ người trên thế giới "một cách hữu ích và có ý nghĩa".

Vào tháng 5, khi OpenAI hoàn thành vòng tài trợ mới trị giá 300 triệu USD, người sáng lập Sam Altman đã nói riêng với một số nhà phát triển rằng ông hy vọng xây dựng ChatGPT thành một trợ lý làm việc cá nhân. chatbot để tạo ra các Agent AI tự động, các chức năng liên quan có thể sẽ được triển khai trong trợ lý ChatGPT.

Tại cuộc họp toàn thể nhân viên vào tháng 6, Zuckerberg đã công bố một loạt công nghệ đang ở các giai đoạn phát triển khác nhau, một trong số đó sẽ mang đến các Đặc vụ AI với những tính cách và khả năng khác nhau để cung cấp hỗ trợ hoặc giải trí cho người dùng.

Mới trong tháng 7, Meta đã phát hành dự án AI Agent MetaGPT, đây là một khung tác nhân tự động dựa trên GPT-4 tập trung vào phát triển phần mềm.

Tại Trung Quốc, mặc dù AutoGPT đã trở nên phổ biến ở nước ngoài ngay từ tháng 4, nhưng do hầu hết người dân còn chưa hiểu rõ về AI Agent đằng sau nó nên phản ứng ban đầu không quá nhiệt tình.

Phải đến khi bài blog về AI Agent của Lilian Weng, người đứng đầu bộ phận nghiên cứu trí tuệ nhân tạo ứng dụng của OpenAI, vào đầu tháng 7, vòng tròn AI mới bùng nổ, giới truyền thông, giới học thuật, nghiên cứu và lĩnh vực đầu tư mới thực sự bắt đầu bàn tán. AI Agent nhiệt tình.

Kết quả là, đất nước này đã thực sự bắt đầu bùng nổ trong việc khám phá và nghiên cứu về Tác nhân AI, và một số nhà sản xuất đã bắt đầu tái cấu trúc kiến trúc sản phẩm và mô hình kinh doanh dựa trên mô hình Tác nhân AI.

Khi các nguyên tắc, mô hình và phương pháp xây dựng AI Agent ngày càng rõ ràng, nhiều doanh nhân mắc kẹt trong công nghệ, mô hình, sinh thái và thậm chí cả chính sách đang nhìn thấy một tương lai tươi sáng.

Tác nhân AI không chỉ cho phép mọi người nhìn thấy hướng đi của mô hình ngôn ngữ lớn (LLM, Mô hình ngôn ngữ lớn), nó còn cho phép nhiều doanh nhân tiếp tục khơi dậy hy vọng khởi nghiệp LLM và cũng cho phép phần lớn doanh nghiệp nhìn thấy xu hướng hiệu quả trong tương lai ứng dụng LLM.

Về khả năng khởi nghiệp của AI Agent, đồng sáng lập OpenAI Andrej Karpathy tin rằng những người bình thường, doanh nhân và những người đam mê công nghệ có nhiều lợi thế hơn OpenAI trong việc xây dựng Agent và mọi người đều ở trạng thái cạnh tranh bình đẳng.

Về phía các công ty lớn, trước khả năng các công ty công nghệ lớn, startup sẽ chớp lấy cơ hội làm Đại lý, Bill Gates cũng cho biết ông sẽ thất vọng nếu Microsoft không can thiệp.

Với sự thúc đẩy mạnh mẽ của những gã khổng lồ công nghệ, sự đón nhận nhanh chóng của các doanh nhân và sự giới thiệu tích cực của các doanh nghiệp lớn, Tác nhân AI đã trở nên hoàn toàn phổ biến. Và không giống như tình huống LLM thiếu triển khai trước đó, lần này AI Agent không còn chỉ là ý tưởng trên giấy nữa, nhiều công ty đã tung ra các dự án Agent và các sản phẩm liên quan.

Những người trong ngành tiết lộ rằng ít nhất hơn 100 dự án đang nỗ lực thương mại hóa các tác nhân AI và gần 100.000 nhà phát triển đang xây dựng các tác nhân tự trị. Trong số các Đại lý AI này, có các dự án Đại lý nước ngoài chủ yếu dựa trên GPT và khung Đại lý nguồn mở, cũng như các sản phẩm Đại lý trong nước dựa trên các mô hình lớn trong nước (mô hình lớn trong lĩnh vực tự nghiên cứu) + kiến trúc nguồn mở.

Nói hết rồi, công ty nào đã tung ra sản phẩm Đại lý? Hình thức sản phẩm AI Agent hiện nay như thế nào? Bài viết này thống kê 60 AI Agent trên khắp thế giới để mọi người hiểu rõ hơn về AI Agent.

**PS: **Vì trong bài viết này có nhiều dự án Đại lý được review nên số lượng từ đã lên tới 1W+, khuyên các bạn nên sưu tầm trước rồi mới đọc.

Bắt đầu với Tác nhân AI

Mặc dù LLM có đủ trí tuệ nhưng muốn nó đưa ra câu trả lời chính xác thì cần phải nhập đủ chính xác. Nếu một bậc thầy và một người bình thường sử dụng cùng một mô hình lớn để đặt câu hỏi, câu trả lời họ nhận được sẽ rất khác nhau: người trước có thể sử dụng nhiều kỹ thuật khác nhau để đạt được kết quả mong muốn, trong khi người sau chỉ có thể nhìn vào LLM và thở dài.

Muốn sử dụng tốt LLM thì trước tiên bạn phải học cách sử dụng nó, nhu cầu này đã hình thành nên một thị trường đào tạo rộng lớn. Dự án nhắc nhở, đồng thời làm tăng độ khó của việc sử dụng LLM, cũng làm giảm trải nghiệm người dùng. LLM, lẽ ra phải thể hiện đầy đủ những ưu điểm của ngôn ngữ tự nhiên, lại trở nên không thân thiện với người dùng thông thường vì tính phức tạp của nó.

Bằng cách này, dự án kịp thời đã trở thành một ngọn núi lớn giữa người bình thường và những người mẫu lớn.

Làm thế nào để giải quyết vấn đề này tốt hơn? Câu trả lời chính là AI Agent (ở Trung Quốc gọi là AI Agent).

AI Agent là một thực thể thông minh có thể nhận thức được môi trường, đưa ra quyết định và thực hiện hành động. Khác với AI truyền thống, AI Agent có khả năng hoàn thành từng bước một mục tiêu nhất định bằng cách suy nghĩ độc lập và gọi các công cụ.

Sau sự xuất hiện của LLM, Tác nhân AI được định nghĩa là tác nhân do LLM điều khiển để thực hiện xử lý tự động các vấn đề chung.

Chúng tôi biết rằng LLM chủ yếu giỏi xử lý và tạo văn bản. Họ có thể trả lời câu hỏi, viết bài, tạo nội dung sáng tạo, trợ giúp lập trình và hơn thế nữa. Nhưng LLM vẫn là một công cụ thụ động chỉ tạo ra đầu ra khi bạn cung cấp đầu vào cho nó.

Tác nhân AI cung cấp nhiều khả năng hơn, đặc biệt là về khả năng tương tác với môi trường, ra quyết định chủ động và thực hiện nhiều nhiệm vụ khác nhau. Có thể nói AI Agent chính là chìa khóa để thực sự khai thác tiềm năng của LLM, nó có thể cung cấp khả năng hành động mạnh mẽ cho cốt lõi của LLM.

Sự khác biệt chính giữa Tác nhân AI và các mô hình lớn là sự tương tác giữa các mô hình lớn và con người dựa trên việc triển khai. Việc người dùng có rõ ràng, rành mạch hay không sẽ ảnh hưởng đến hiệu quả câu trả lời của mô hình lớn, không có câu trả lời nào chính xác và hiệu quả, kể cả ChatGPT có năng lực nhất.

Công việc của AI Agent chỉ cần có mục tiêu là có thể suy nghĩ độc lập và hành động theo mục tiêu, sẽ chia nhỏ từng bước lập kế hoạch chi tiết theo nhiệm vụ được giao, dựa vào phản hồi từ thế giới bên ngoài và tư duy độc lập để tạo ra bản thân để đạt được mục tiêu.

Ví dụ: nếu bạn yêu cầu ChatGPT mua một tách cà phê, phản hồi mà ChatGPT đưa ra nhìn chung tương tự như "Bạn không thể mua cà phê, đó chỉ là trợ lý AI bằng văn bản".

Nhưng bạn cần yêu cầu công cụ AI Agent dựa trên ChatGPT mua một tách cà phê, trước tiên nó sẽ chia nhỏ cách mua một tách cà phê cho bạn và lên kế hoạch cho một số bước như đặt hàng và thanh toán thay bạn thông qua APP, sau đó làm theo các bước sau để gọi APP chọn đồ mang đi. Sau đó gọi chương trình thanh toán để đặt hàng và thanh toán. Quá trình này không yêu cầu con người chỉ định từng bước của thao tác.

Mặc dù cả công cụ và tác nhân AI đều là các chương trình phần mềm được thiết kế để tự động hóa các tác vụ, nhưng các đặc điểm chính cụ thể giúp phân biệt tác nhân AI với phần mềm AI phức tạp hơn.

Khi một công cụ AI có các đặc điểm sau thì nó có thể được coi là Tác nhân AI:

**Tự chủ: **Các tác nhân ảo AI có thể thực hiện các nhiệm vụ một cách độc lập mà không cần sự can thiệp hay can thiệp của con người.

**Nhận thức: **Các chức năng của tác nhân nhận thức và giải thích môi trường của họ thông qua nhiều cảm biến khác nhau (chẳng hạn như máy ảnh hoặc micrô).

**Khả năng phản ứng: **Các tác nhân AI có thể đánh giá môi trường và phản ứng phù hợp để đạt được mục tiêu của mình.

**Lý luận và ra quyết định: **Tác nhân AI là công cụ thông minh có thể phân tích dữ liệu và đưa ra quyết định để đạt được mục tiêu. Họ sử dụng các kỹ thuật và thuật toán lý luận để xử lý thông tin và thực hiện hành động thích hợp.

Học tập: Họ có thể học hỏi và cải thiện hiệu suất của mình thông qua các yếu tố và kỹ thuật học máy, học sâu và học tăng cường.

**Giao tiếp: **Các tác nhân AI có thể giao tiếp với các tác nhân hoặc con người khác bằng các phương pháp khác nhau, chẳng hạn như hiểu và phản hồi ngôn ngữ tự nhiên, nhận dạng giọng nói và trao đổi tin nhắn qua văn bản.

Định hướng mục tiêu: Họ hướng tới việc đạt được các mục tiêu cụ thể, có thể được xác định trước hoặc học hỏi thông qua tương tác với môi trường.

**Xét về mặt danh mục, tác nhân AI hiện có thể được chia thành tác nhân tự trị (Autonomous Agent) và tác nhân tạo sinh (Generative Agent). **

Các tác nhân tự trị như Auto-GPT có thể tự động thực hiện các nhiệm vụ và đạt được kết quả mong đợi dựa trên nhu cầu của mọi người thông qua ngôn ngữ tự nhiên. Trong mô hình hợp tác này, tác nhân tự trị chủ yếu phục vụ con người và giống như một công cụ hiệu quả hơn.

Các tác nhân sáng tạo, chẳng hạn như thị trấn Westworld do các nhà nghiên cứu tại Stanford và Google cùng tạo ra hay các robot hình người trong "Westworld", sống trong cùng một môi trường, có ký ức và mục tiêu riêng, không chỉ tương tác với con người mà còn tương tác với nhau. khác. Các tương tác robot khác.

Về các tác nhân AI, bài đánh giá về Tác nhân dựa trên LLM dài 86 trang do Nhóm xử lý ngôn ngữ tự nhiên của Đại học Fudan (FudanNLP) ra mắt gần đây đã tóm tắt một cách toàn diện hiện trạng của các tác nhân thông minh dựa trên các mô hình ngôn ngữ quy mô lớn, bao gồm: nền tảng, thành phần, và ứng dụng của bối cảnh Đại lý dựa trên LLM cũng như xã hội đại lý được thảo luận nhiều.

Nói nhiều như vậy, có thể nhiều bạn vẫn chưa có cảm nhận trực quan về tác nhân AI. Đừng lo lắng, dưới đây chúng tôi sẽ sử dụng một trường hợp so sánh để bạn hiểu sâu hơn.

Tác nhân thông minh Ai thâm nhập vào nhiều lĩnh vực khác nhau

AiAgent.app là một ứng dụng web cho phép người dùng tạo các tác nhân AI tùy chỉnh để thực hiện các nhiệm vụ cụ thể và đạt được mục tiêu.

Dưới đây, Kênh Wang Jiwei sẽ xem xét những ưu điểm của tác nhân AI thông qua trải nghiệm so sánh giữa việc sử dụng tác nhân AI và trực tiếp sử dụng LLM.

Ví dụ: nếu bạn muốn biết tin tức và xu hướng trong ngành AI trong tháng qua, hãy nhập Claude: bản tóm tắt những tin tức và xu hướng mới nhất trong ngành AI trong tháng qua.

Kết quả thu được như hình dưới đây:

Như bạn có thể thấy, Claude chỉ liệt kê một vài bản tóm tắt thông tin tin tức liên quan đến AI.

Nhập đoạn này vào AiAgent.app, trước tiên nó sẽ chia nhu cầu của bạn thành 10 nhiệm vụ, sau đó tương tác với người dùng thông qua lời nhắc để hoàn thành từng nhiệm vụ và xuất kết quả cho từng nhiệm vụ. Rõ ràng, nội dung về ngành AI gần đây có được trong AiAgent.app toàn diện hơn nội dung có được bằng cách sử dụng trực tiếp các LLM khác.

Có thể lấy được nội dung này trực tiếp bằng cách sử dụng các mô hình lớn không? Về mặt lý thuyết, nó có thể được hoàn thành bằng cách nhập nhiều hơn, nhưng nó cần phải được nhập ít nhất mười lần và độ chính xác của dữ liệu đầu vào không thể được đảm bảo và đôi khi bạn thậm chí không biết mình muốn lấy thông tin gì.

Trong AiAgent.app, bạn chỉ cần nhập một câu, nó sẽ phân tích các nhu cầu có thể có của bạn và liệt kê các mục tiêu nội dung tương đối toàn diện, hướng dẫn bạn thực hiện những gì bạn muốn và hiệu quả sẽ tăng lên gấp nhiều lần.

So sánh cả hai, rõ ràng AI Agent vượt trội hơn về mức độ phong phú và hiệu quả thu thập nội dung. Loại tác nhân nội dung thông tin này có giá trị lớn đối với những người hành nghề truyền thông, các nhà phân tích trong ngành và các ngành nghề khác, đồng thời có thể giảm đáng kể thời gian thu thập dữ liệu nghiên cứu.

Hiện có một số tác nhân như vậy nhắm mục tiêu vào các nhóm người dùng và kịch bản ứng dụng chính xác hơn. Ví dụ: GPT Researcher do Đại học Columbia ra mắt là Đại lý dành cho các nhà nghiên cứu dựa trên ChatGPT, có thể tạo nhiều báo cáo nghiên cứu khác nhau cho người dùng để thúc đẩy nghiên cứu.

Trường hợp này chỉ nói về việc thu thập nội dung. Trên thực tế, các tác nhân cho nhiều kịch bản ứng dụng đã xuất hiện, đủ để huy động nhiều ứng dụng phần mềm và thậm chí cả thiết bị phần cứng để hoàn thành các nhiệm vụ khác nhau.

Ví dụ: một số người đã sử dụng AutoGPT để đặt bữa ăn, đặt vé, đón taxi và mua sắm; 25 Đại lý AI ở thị trấn Westworld của Stanford đang đi bộ, hẹn hò, trò chuyện, uống cà phê và chia sẻ tin tức trong ngày mỗi ngày; Google Deepmind có ra mắt việc sử dụng tác nhân Robot cho cánh tay robot để tự động thực hiện nhiều nhiệm vụ khác nhau; Amazon cũng ra mắt Amazon Bedrock Agents để tự động phân tách các nhiệm vụ phát triển ứng dụng AI dành cho doanh nghiệp; IBM Watson Health đã và đang giúp các bác sĩ chẩn đoán, điều trị và theo dõi bệnh nhân ở nhiều bệnh viện.

Ai Agent tuy chưa phổ biến từ lâu nhưng ngay khi xuất hiện đã được rất nhiều công ty ở nhiều lĩnh vực ủng hộ. Khả năng đa mô hình của các mô hình ngôn ngữ lớn cùng với sức mạnh tính toán lớn hơn ngày nay đã cho phép các Đại lý, được đề xuất từ nhiều năm trước, nhanh chóng đạt được giá trị và được triển khai trong nhiều lĩnh vực hơn với tỷ lệ siêu thâm nhập.

Với sự xuất hiện của Đại lý AI nguồn mở như MetaGPT, ngày càng có nhiều nhà cung cấp công nghệ và nhóm doanh nhân giới thiệu Đại lý và nhiều tổ chức đã công nhận và chấp nhận Đại lý. Nó chắc chắn sẽ nhanh chóng trở thành mô hình chính để triển khai LLM trong nhiều lĩnh vực khác nhau, giúp đỡ hàng nghìn người. của các ngành thay đổi hoạt động kinh doanh của họ. Ứng dụng LLM tốt.

Danh sách 60 Đại lý AI trên toàn thế giới

AiAgent.app được đề cập trong trường hợp trên là một trong những sản phẩm AI Agent tiêu biểu đang có đà phát triển trong những tháng gần đây. Bạn có thể xem nhiều đại lý trong và ngoài nước, bao gồm cả đại lý AI này trong danh sách kiểm kê dự án bên dưới.

Để mọi người hiểu rõ hơn về các Tác nhân AI đã được ra mắt cho đến nay, Kênh Wang Jiwei (id: jiwei1122) chia các Tác nhân AI này thành các báo cáo truyền thông, các dự án ra mắt trong nước, theo ngành, ở nước ngoài và các dự án GitHub. được khen thưởng dần dần trong tương lai.Thư viện dự án phân loại các Đại lý này thành các loại khác nhau.

Các Tác nhân AI được đánh giá trong bài viết này bao gồm cả khung và công cụ AI Agent cũng như các sản phẩm AGENT dựa trên một số khung nguồn mở, đồng thời hầu hết các dự án và sản phẩm đều là các tác nhân tự trị.

Do một số nhà sản xuất tương đối kín đáo và không công khai với thế giới bên ngoài nên các Tác nhân AI được liệt kê trong bài viết này là chưa đầy đủ nên còn gọi là danh sách các Tác nhân AI không đầy đủ. Chúng tôi hoan nghênh nhiều nhà sản xuất và doanh nhân hơn liên hệ với kênh của Wang Jiwei sau khi đọc bài viết này và tất cả chúng ta đều có thể đóng góp cho sự thịnh vượng và phát triển của hệ sinh thái AI AGENT.

Đặc vụ AI được truyền thông đưa tin

1, GPT tự động

Auto GPT là một dự án mã nguồn mở miễn phí trên Github kết hợp công nghệ GPT-4 và GPT-3.5 để tạo các dự án hoàn chỉnh thông qua API.

Khác với ChatGPT, người dùng không cần phải liên tục đặt câu hỏi cho AI để có được câu trả lời tương ứng, trong AutoGPT, họ chỉ cần cung cấp cho AI tên, mô tả và năm mục tiêu, sau đó AutoGPT có thể tự hoàn thành dự án . Nó có thể đọc và ghi tệp, duyệt web, xem lại kết quả của lời nhắc của chính nó và kết hợp chúng với lịch sử lời nhắc đã nói.

Auto-GPT là một trong những ví dụ đầu tiên về GPT-4 hoạt động hoàn toàn tự động, vượt qua ranh giới những gì trí tuệ nhân tạo có thể làm.

2、Đặc vụGPT

AgentGPT cho phép bạn định cấu hình và triển khai các tác nhân AI tự trị. Chỉ cần đặt tên cho AI tùy chỉnh của bạn và yêu cầu nó bắt đầu bất kỳ mục tiêu nào có thể tưởng tượng được và nó sẽ cố gắng đạt được mục tiêu đó bằng cách nghĩ về một nhiệm vụ cần hoàn thành, thực hiện nhiệm vụ và học hỏi từ kết quả.

3, AGI bé

Đây là một hệ thống quản lý tác vụ dựa trên AI. Hệ thống sử dụng OpenAI và API Pinecone để tạo, ưu tiên và thực thi các tác vụ. Tạo nhiệm vụ bằng cách phân tích kết quả của các nhiệm vụ trước đó và các mục tiêu được xác định trước, đồng thời sử dụng xử lý ngôn ngữ tự nhiên (NLP) và Chroma của OpenAI để lưu trữ và truy xuất kết quả nhiệm vụ theo ngữ cảnh.

Điểm hấp dẫn của Baby AGI nằm ở khả năng tự động giải quyết các nhiệm vụ và duy trì các mục tiêu đã xác định trước dựa trên kết quả của các nhiệm vụ trước đó, cũng như sắp xếp thứ tự ưu tiên các nhiệm vụ một cách hiệu quả.

4,Jarvis (ÔmGPT)

Một hệ thống cộng tác độc đáo do Microsoft phát triển có thể sử dụng nhiều mô hình AI để hoàn thành một nhiệm vụ nhất định, với ChatGPT đóng vai trò là người điều khiển tác vụ. Dự án, được gọi là JARVIS trên GitHub, hiện có sẵn để dùng thử trên Huggingface (do đó là HuggingGPT), một tác nhân hoạt động cực kỳ tốt với văn bản, hình ảnh, âm thanh và thậm chí cả video.

Cách thức hoạt động tương tự như cách OpenAI thể hiện khả năng đa phương thức của GPT 4 thông qua văn bản và hình ảnh, nhưng JARVIS tiến một bước xa hơn và tích hợp nhiều LLM nguồn mở khác nhau cho hình ảnh, video, âm thanh, v.v. và cũng có thể kết nối với Internet và truy cập các tập tin. Ví dụ: bạn có thể nhập URL từ một trang web và đặt câu hỏi về nó.

5,Aiagent.app

Ai Agent là một ứng dụng web cho phép người dùng tạo các tác nhân AI tùy chỉnh để thực hiện các nhiệm vụ cụ thể và đạt được mục tiêu. Tác nhân AI hoạt động bằng cách chia nhỏ mục tiêu thành các nhiệm vụ nhỏ hơn và hoàn thành từng nhiệm vụ một. Các lợi ích bao gồm khả năng chạy đồng thời nhiều tác nhân AI và dân chủ hóa khả năng tiếp cận công nghệ tiên tiến.

AI Agent cũng tự hào có các tính năng như khối mã nội tuyến với tính năng tô sáng cú pháp và cộng tác liền mạch với nền tảng của bên thứ ba. Công cụ này được sử dụng miễn phí và cung cấp một cách đơn giản để xây dựng các tác nhân AI mà không cần thêm kiến thức kỹ thuật.

6, Lạc đàAGI

Camel AGI là một công cụ AI tổng quát cho phép người dùng giải quyết các nhiệm vụ nhất định bằng các tác nhân AI tự động nhập vai, tất nhiên người dùng cần kích hoạt Java để sử dụng công cụ này. Camel AGI cho phép người dùng hoàn thành các tác vụ bằng cách sử dụng tác nhân AI và cung cấp tùy chọn đăng nhập bằng Google hoặc gắn dấu sao cho công cụ này trên Github.

7. Mô phỏng "Westworld" Thị trấn Westworld

Đối với dự án này, các nhà nghiên cứu từ Đại học Stanford và Google đã tạo ra một môi trường hộp cát tương tác chứa 25 tác nhân AI tổng hợp có thể mô phỏng hành vi của con người. Họ đi dạo trong công viên, uống cà phê trong quán cà phê và chia sẻ tin tức với đồng nghiệp, thể hiện hành vi xã hội tốt đến mức đáng ngạc nhiên.

Ví dụ: bắt đầu từ khái niệm do người dùng chỉ định rằng một nhân viên hỗ trợ muốn tổ chức bữa tiệc Ngày lễ tình nhân, nhân viên hỗ trợ sẽ tự động phát tán lời mời dự tiệc trong hai ngày tới, kết bạn mới, mời nhau đi hẹn hò và tổ chức tiệc tùng cũng như điều phối các sự kiện vào đúng thời điểm. Thời điểm để cùng nhau xuất hiện trong các bữa tiệc.

8、GPT-Kỹ sư

GPT-Engineer là một công cụ AI nguồn mở cho phép người dùng chỉ định những gì họ muốn xây dựng và sau đó trò chuyện rõ ràng với AI để tạo cơ sở mã cần thiết. Công cụ này được thiết kế để cung cấp trải nghiệm người dùng đơn giản và linh hoạt, cho phép người dùng điều chỉnh và mở rộng chức năng của nó theo nhu cầu của họ.

Công cụ này bao gồm các chức năng như chỉ định danh tính của tác nhân AI, lưu trữ lịch sử liên lạc với GPT4 và chạy lại nhật ký tin nhắn. Những đóng góp cho dự án đều được hoan nghênh và những cá nhân quan tâm có thể tham khảo lộ trình, dự án và các vấn đề có sẵn trên kho GitHub. GPT-Engineer đặt mục tiêu trở thành một nền tảng mở để các nhà phát triển khám phá và xây dựng hộp công cụ tạo mã của họ.

9,MetaGPT

MetaGPT, do Meta Corporation ra mắt, là một khung đa tác nhân sử dụng đầu vào một dòng để tạo API, câu chuyện của người dùng, cấu trúc dữ liệu, phân tích cạnh tranh, v.v. Khung này có thể đóng vai trò là người quản lý sản phẩm, kỹ sư phần mềm và kiến trúc sư. Khung này có thể hoạt động như một công ty phần mềm hoàn chỉnh, điều phối các SOP chỉ bằng một dòng mã.

MetaGPT được tích hợp với thiết kế quy trình SOP của con người. Do đó, các tác nhân dựa trên LLM tạo ra các tài liệu và thiết kế có cấu trúc, đa dạng, chất lượng cao. MetaGPT được thiết kế để giúp dễ dàng thiết kế các giải pháp cho các nhiệm vụ phức tạp và cung cấp khả năng giải quyết vấn đề gần như tương đương với trí thông minh của con người.

10、Đại lý Bedrock của Amazon

Đại lý Amazon Bedrock do Amazon phát hành cho phép các nhà phát triển nhanh chóng tạo các đại lý được quản lý hoàn toàn. Bằng cách thực hiện các lệnh gọi API đến hệ thống doanh nghiệp, các đại lý của Amazon Bedrock đẩy nhanh việc phát hành các ứng dụng AI tổng hợp để quản lý và thực thi các hoạt động.

Đại lý Amazon Bedrock đơn giản hóa kỹ thuật và điều phối nhanh chóng các tác vụ yêu cầu của người dùng. Sau khi thiết lập, các nhân viên hỗ trợ này có thể tự động xây dựng lời nhắc và cải thiện chúng một cách an toàn bằng dữ liệu dành riêng cho công ty để cung cấp phản hồi bằng ngôn ngữ tự nhiên cho người dùng. Các tác nhân nâng cao này có khả năng suy ra các hành động cần thiết để tự động xử lý các yêu cầu của người dùng.

11, nvidia Voyager

Voyager, do NVIDIA, Viện Công nghệ California và các tổ chức khác cùng ra mắt, sử dụng GPT-4 để hướng dẫn việc học các tác nhân Minecraft thông qua thế giới pixel. Cần lưu ý rằng Voyager dựa vào việc tạo mã thay vì học tăng cường.

Voyager là tác nhân học tập suốt đời đầu tiên chơi Minecraft. Không giống như các tác nhân Minecraft khác sử dụng các kỹ thuật học tăng cường cổ điển, Voyager sử dụng GPT-4 để liên tục cải thiện bản thân bằng cách viết, cải tiến và chuyển mã được lưu trữ trong thư viện kỹ năng bên ngoài.

Điều này dẫn đến các chương trình nhỏ giúp điều hướng, mở cửa, khai thác tài nguyên, chế tạo cuốc hoặc chiến đấu với thây ma. GPT-4 mở ra một mô hình mới trong đó "đào tạo" là thực thi mã và "mô hình đào tạo" là cơ sở mã kỹ năng mà Du hành lắp ráp lặp đi lặp lại.

12, Đại lý robot

Nhóm nghiên cứu chung của Meta và CMU đã mất hai năm để phát triển thành công tác nhân robot đa năng RoboAgent. RoboAgent đã đạt được 12 kỹ năng phức tạp khác nhau thông qua đào tạo chỉ với 7.500 quỹ đạo, bao gồm nướng bánh, nhặt đồ, phục vụ trà, dọn dẹp nhà bếp và các nhiệm vụ khác, đồng thời có thể khái quát và áp dụng trong 100 tình huống chưa xác định.

RoboAgent vẫn tiếp tục thực hiện nhiệm vụ cho dù gặp phải mức độ can thiệp nào. Mục tiêu của nghiên cứu này là thiết lập một mô hình học tập robot hiệu quả nhằm giải quyết các thách thức về tính đa dạng của tập dữ liệu và bối cảnh. Các nhà nghiên cứu đã đề xuất kiến trúc Biến áp chặn hành động đa tác vụ (MT-ACT) để xử lý các bộ dữ liệu robot đa tác vụ đa phương thức thông qua nâng cao ngữ nghĩa và trình bày chính sách hiệu quả.

**13 、 Biến AI Pi **

Bộ não cốt lõi của sản phẩm AI Agent cá nhân Pi do Inflection AI tung ra là mô hình lớn Inflection-1 do công ty phát triển và hiệu suất của nó tương đương với GPT-3.5. Không giống như các chatbot đa năng phổ biến, Pi chỉ có thể thực hiện các cuộc trò chuyện thân thiện, đưa ra lời khuyên ngắn gọn hoặc thậm chí chỉ lắng nghe.

Đặc điểm chính của nó là lòng nhân ái, khiêm tốn, tò mò, hài hước và đổi mới, trí tuệ cảm xúc tốt, có thể cung cấp kiến thức và tình bạn không giới hạn theo sở thích và nhu cầu riêng của người dùng. Kể từ khi Inflection phát triển Pi, người ta đã xác định Pi sẽ đóng vai trò là trí tuệ cá nhân (Personal Intelligence) chứ không chỉ là công cụ hỗ trợ con người trong công việc.

14, Siêu ghi

Hyperwrite là một công cụ tác nhân viết AI giúp các nhà văn sáng tạo ở mọi cấp độ viết nhanh hơn và tự tin hơn. Nó bao gồm các tính năng như tự động viết và gõ trước để tạo các đoạn văn gốc và đưa ra các ý tưởng để vượt qua trở ngại của người viết.

Công cụ này có sẵn dưới dạng tiện ích mở rộng miễn phí của Chrome và có thể được sử dụng trên bất kỳ trang web nào mà không làm gián đoạn quy trình làm việc. Nó được các chuyên gia, sinh viên và người sáng tạo trên khắp thế giới sử dụng và tin cậy để tăng năng suất của họ.

15、Nhà nghiên cứu GPT

GPT Researcher là một tác nhân tự trị dựa trên AI được sử dụng để tiến hành nghiên cứu trực tuyến toàn diện về nhiều nhiệm vụ khác nhau. Lấy cảm hứng từ AutoGPT và lời nhắc "Lập kế hoạch và giải quyết", công cụ này nhằm mục đích cải thiện các vấn đề về tốc độ và tính xác định có trong các mô hình ngôn ngữ hiện tại, "mang lại hiệu suất ổn định hơn và tốc độ cao hơn bằng cách làm việc trong các tác nhân song song thay vì hoạt động đồng bộ" .

Theo nhóm, các nhà nghiên cứu GPT tạo điều kiện thuận lợi cho nghiên cứu bằng cách tạo ra các câu hỏi nghiên cứu có liên quan, tổng hợp dữ liệu từ hơn 20 nguồn web và tận dụng GPT3.5-turbo-16 và GPT-4 để tạo báo cáo nghiên cứu toàn diện.

AI Agent ra mắt tại Trung Quốc

Sau khi liên tục tìm tòi và thử nghiệm, các sản phẩm liên quan đến tác nhân AI trong nước cũng bắt đầu xuất hiện, dưới đây là 5 sản phẩm.

1. Mô hình đám mây của AlibabaScopeGPT

Cộng đồng Alibaba Cloud Mota đã ra mắt công cụ gọi mô hình quy mô lớn đầu tiên tại Trung Quốc, ModelScopeGPT. Thông qua công cụ này, người dùng có thể gọi các mô hình trí tuệ nhân tạo khác trong cộng đồng Mota bằng cách gửi hướng dẫn chỉ bằng một cú nhấp chuột, từ đó hiện thực hóa các ứng dụng lớn và nhỏ. để hoàn thành các nhiệm vụ phức tạp.

ModelScopeGPT dựa trên khung phát triển ModelScope-Agent (tác nhân) mô hình ngôn ngữ lớn (LLM) mã nguồn mở. Đây là một khung Tác nhân chung, có thể tùy chỉnh dành cho các ứng dụng thực tế. Nó dựa trên các mô hình ngôn ngữ lớn (LLM) nguồn mở làm cốt lõi và bao gồm các mô-đun như kiểm soát bộ nhớ và sử dụng công cụ.

LLM nguồn mở chủ yếu chịu trách nhiệm lập kế hoạch nhiệm vụ, lập lịch và tạo phản hồi; mô-đun kiểm soát bộ nhớ chủ yếu bao gồm truy xuất kiến thức và quản lý (từ nhắc nhở); mô-đun sử dụng công cụ bao gồm thư viện công cụ, truy xuất công cụ và tùy chỉnh công cụ.

2. Tác nhân TARS-RPA thực sự thông minh

TARS-RPA-Agent, được Real Intelligence ra mắt trong lĩnh vực siêu tự động hóa, là một tác nhân siêu tự động dựa trên công cụ chế độ kép "TARS+ISSUT (Hiểu ngữ nghĩa màn hình thông minh)", với "bộ não" và " mắt, tay và chân". Đây là một sản phẩm mô hình RPA mới có thể tự động tháo dỡ các nhiệm vụ, nhận biết môi trường hiện tại, thực hiện và đưa ra phản hồi cũng như ghi nhớ kinh nghiệm lịch sử.

TARS-RPA-Agent áp dụng khung kỹ thuật dựa trên mô hình lớn TARS và hiểu biết ngữ nghĩa của màn hình thông minh ISSUT. Khung kỹ thuật được chia thành hai lớp: lớp dưới cùng là chuỗi TARS gồm các mô hình lớn bao gồm các mô hình cơ bản chung và mô hình cơ bản của các ngành dọc khác nhau và công nghệ hiểu ngữ nghĩa màn hình thông minh; lớp trên là mô hình cực lớn dựa trên hai công nghệ chủ chốt này để hoàn thành quá trình nâng cấp và chuyển đổi toàn diện.

LLM cốt lõi của TARS-RPA-Agent là mô hình lớn "TARS" dọc do Real Intelligence tự phát triển dựa trên cơ sở mô hình lớn nói chung. Mô hình lớn TARS có các chức năng chính thống tuyệt vời như tạo văn bản, hiểu ngôn ngữ, hỏi đáp kiến thức, và khả năng suy luận logic.

3. Đại lý thông minh OmBot ohm

Tại Hội nghị Trí tuệ nhân tạo thế giới năm 2023, Lianhui Technology đã phát hành một tác nhân tự trị (Auto AI Agent) dựa trên khả năng của mô hình lớn - OmBot Ohm Agent và ra mắt loạt ứng dụng đầu tiên dựa trên các yêu cầu cảnh điển hình.

Tác nhân tự trị Lianhui chứa bốn khả năng cốt lõi là nhận thức, trí nhớ, suy nghĩ và hành động. Là một tác nhân tự động và tự trị, nó chạy theo một vòng lặp ở dạng đơn giản nhất. Ở mỗi lần lặp, chúng tạo ra các hướng dẫn và hoạt động Tự định hướng. Do đó, nó không dựa vào con người để hướng dẫn các lệnh và có khả năng mở rộng cao.

4. Công nghệ Lanma Hỏi XBot

Nền tảng Agent "Ask XBot" do Lanma Technology xây dựng được chia thành hai lớp: lớp đầu tiên là trao quyền cho chuyên gia. Các chuyên gia xác định quy trình công việc và dạy chúng cho máy thông qua tương tác kéo, thả, kéo và đối thoại, từ đó hỗ trợ nhân viên tuyến đầu xây dựng Phương pháp để làm việc hiệu quả hơn, cấp độ thứ hai là dành cho nhân viên sử dụng Tác nhân. Nhân viên tuyến đầu có thể giao tiếp với Tác nhân thông qua ngôn ngữ tự nhiên và đưa ra hướng dẫn, cho phép Tác nhân hỗ trợ phân tích dữ liệu, truy xuất thông tin và các nhiệm vụ khác.

Công ty có kế hoạch xây dựng Ask Customer để có thể phục vụ hiệu quả và thông minh hơn trên nền tảng này.

5, ChatDev

ChatDev, được thành lập bởi nhóm nghiên cứu chung của Đại học Thanh Hoa, Đại học Bưu chính Viễn thông Bắc Kinh và Đại học Brown, là một tác nhân mang tính sáng tạo. Đây là khung phát triển phần mềm toàn diện dựa trên trò chuyện, tận dụng các mô hình ngôn ngữ lớn (LLM) để tạo điều kiện giao tiếp và cộng tác hiệu quả giữa nhiều tác nhân (phiên bản ("gpt3.5-turbo-16k" của ChatGPT) trong quy trình phát triển phần mềm .

Mục đích chính của ChatDev là phát triển trò chơi thông qua trò chuyện. Người dùng chỉ cần đề xuất ý tưởng và toàn bộ quá trình từ thiết kế đến thử nghiệm đều được AI hoàn thành và toàn bộ quá trình chỉ mất bảy phút để hoàn thành.

Sản phẩm AI Agent cho các lĩnh vực khác nhau

Trước khi LLM xuất hiện, một số công ty đã nghiên cứu sự kết hợp giữa AI và Agent truyền thống. Do đó, việc triển khai AI Agentmt trong nhiều lĩnh vực khác nhau nhanh hơn nhiều so với mọi người mong đợi.

Dưới đây là các ứng dụng Đại lý đại diện trong một số lĩnh vực ngành nghề.

Trong lĩnh vực y tế, Đại lý có thể giúp chẩn đoán, điều trị và theo dõi bệnh nhân. IBM Watson Health là một tác nhân AI phân tích dữ liệu y tế để xác định các vấn đề sức khỏe tiềm ẩn và đề xuất các phương án điều trị.

Trong lĩnh vực tài chính, Đại lý có thể phân tích dữ liệu tài chính, phát hiện gian lận và đưa ra khuyến nghị đầu tư. Charles Schwab sử dụng một tác nhân trí tuệ nhân tạo có tên Danh mục thông minh để tạo và quản lý danh mục đầu tư dựa trên mục tiêu đầu tư của khách hàng.

Trong các tình huống kinh doanh bán lẻ, Đại lý có thể đưa ra các đề xuất được cá nhân hóa, cải thiện việc quản lý chuỗi cung ứng và nâng cao trải nghiệm của khách hàng. Alexa của Amazon là một đại lý AI có thể giới thiệu sản phẩm, đặt hàng và theo dõi lô hàng.

Trong sản xuất, Đại lý có thể tối ưu hóa quy trình sản xuất, dự đoán nhu cầu bảo trì và nâng cao chất lượng sản phẩm. General Electric sử dụng tác nhân AI có tên Predix để giám sát máy móc theo thời gian thực nhằm dự đoán và ngăn ngừa lỗi thiết bị.

Trong lĩnh vực giao thông vận tải, Đại lý AI tự động có thể hỗ trợ lập kế hoạch tuyến đường, quản lý giao thông và an toàn phương tiện. Autopilot của Tesla hỗ trợ các phương tiện tự lái và giúp người lái xe đỗ xe, chuyển làn và lái xe an toàn.

Trong ngành giáo dục, Agnet có thể cung cấp trải nghiệm học tập được cá nhân hóa, tự động hóa các nhiệm vụ hành chính và phân tích hiệu suất của học sinh. Nhân viên AI Aida của Pearson có thể cung cấp cho sinh viên phản hồi và đề xuất lộ trình học tập được cá nhân hóa.

Trong nông nghiệp, tác nhân AI có thể tối ưu hóa sản xuất cây trồng, giám sát chất lượng đất và dự đoán các kiểu thời tiết. John Deere đang sử dụng một tác nhân AI có tên See&Spray để phát hiện và xác định vị trí của cỏ dại mà không ảnh hưởng đến cây trồng.

Các sản phẩm AGENT khác đã được ra mắt ở nước ngoài

1 、 Nhận thức

Cognosys là một tác nhân AI dựa trên web được thiết kế để cách mạng hóa năng suất và đơn giản hóa các tác vụ phức tạp, sử dụng công nghệ AI tiên tiến nhất để nâng cao cuộc sống hàng ngày của bạn.

2,Máy làm bất cứ điều gì

Dễ dàng quản lý công việc của bạn bằng máy "làm tất cả" trong đó tác nhân AI cá nhân của người dùng sẽ ưu tiên và hoàn thành nhiệm vụ cho bạn

3, bảng chữ cái

Một nền tảng trực quan để tạo và quản lý các nhóm gồm các tác nhân AI tự động hướng đến mục tiêu, tất cả đều từ điện thoại của bạn Tạo và quản lý các nhóm tác nhân AI autoGPT. Chỉ cần xác định mục tiêu của bạn và Alphakit sẽ lo phần còn lại.

4, Bảng điều khiển GPT

GPTConsole là giao diện dòng lệnh (CLI) mang tính cách mạng được thiết kế để mang lại cho các nhà phát triển những lợi thế của trí tuệ nhân tạo. Nó vượt xa chức năng thiết bị đầu cuối truyền thống để cho phép người dùng thực hiện các tác vụ phức tạp bằng cách sử dụng lời nhắc.

5, Kết thúc

Chuyển đổi cơ sở kiến thức của bạn thành trò chuyện AI trong 2 phút bằng cách cung cấp liên kết đến cơ sở kiến thức. Fini cung cấp cho người dùng một đại lý AI không mệt mỏi sẵn sàng trả lời các câu hỏi của khách hàng ngay lập tức 24/7.

6, Chính tả

Spell là một tác nhân AI tự trị dựa trên GPT4 có thể được áp dụng cho công việc hiệu quả hàng ngày. Spell cũng có các tính năng rất cần thiết để giúp bạn làm việc thông minh hơn và học cách khai thác sức mạnh của AI tổng hợp để tạo ra một hoặc nhiều tác nhân tự trị sáng tạo sẽ hoạt động để giải quyết vấn đề của bạn.

7, Aomni

Aomni là một tác nhân AI truy xuất thông tin có thể tìm, trích xuất và xử lý bất kỳ dữ liệu nào trên Internet cho bạn, nâng cao công việc nghiên cứu của bạn. Aomni có thể sử dụng nhiều công cụ khác nhau để lập kế hoạch truy vấn của bạn một cách thông minh nhằm đạt được kết quả cuối cùng, bao gồm trình duyệt web đầy đủ cho phép truy cập bất kỳ thông tin nào trên Internet mà không cần API.

Công cụ lập kế hoạch truy vấn của Aomni dựa trên kiến trúc AutoGPT hiện đại, lập kế hoạch và cập nhật thông minh từng yêu cầu để đảm bảo tính chính xác và đa dạng của nguồn.

8、Fine-Tuner.ai

Với Fine-Tuner.ai, người dùng có thể xây dựng các tác nhân AI phức tạp, được thiết kế riêng mà không cần kỹ năng kỹ thuật hoặc mã hóa, chỉ cần nhập dữ liệu và ý tưởng của bạn. Hơn chục tác nhân AI chuyên nghiệp có thể tạo Hỏi & Đáp chính xác, tìm kiếm tài liệu, tự động hóa quy trình, v.v. cho người dùng thông qua dữ liệu thời gian thực được tải lên như PDF, CV, PPT và URL.

9、Siêu AGI

Khung AI tự trị nguồn mở cho phép bạn phát triển và triển khai các tác nhân tự trị hữu ích một cách nhanh chóng và đáng tin cậy cũng như cơ sở hạ tầng để xây dựng, quản lý và vận hành các tác nhân tự trị.

10, Vàng.ai

Yellow.ai là nền tảng AI đàm thoại cấp doanh nghiệp hàng đầu, hỗ trợ các tác nhân AI năng động trong doanh nghiệp, được thiết kế để cung cấp các tương tác giống con người thông qua nền tảng không có mã/mã thấp nhằm tăng sự hài lòng của khách hàng và tăng mức độ tương tác của nhân viên. .

11.Chế độ thần thánh

Cho phép người dùng chạy AutoGPT trên trình duyệt. Godmode cho phép người dùng triển khai nhiều tác nhân AI cùng lúc để hoàn thành các tác vụ bằng AI và người dùng cũng có thể sử dụng khóa API OpenAI của riêng mình.

12、E42

E42 là một nền tảng tự động hóa quy trình nhận thức cho phép doanh nghiệp tạo ra các tác nhân nhận thức đa chức năng để tự động hóa các quy trình khác nhau trên nhiều chức năng. Nền tảng không cần mã, hướng đến nhận thức tích hợp hoàn hảo với công nghệ và quy trình hiện có của người dùng để khai thác giá trị cao nhất giữa các phòng ban. Người dùng có thể sử dụng E42 để xây dựng các tác nhân AI của riêng mình, chẳng hạn như nhà phân tích AI và nhà tuyển dụng AI trong các ngành dọc.

13, Cảm ơn

Các nhân viên AI của Thankful được đào tạo và điều chỉnh để làm việc trong bộ phận trợ giúp hiện có của bạn, dễ dàng giải quyết các yêu cầu số lượng lớn của khách hàng qua email, trò chuyện, SMS và các kênh trong ứng dụng. Với khả năng hiểu, kết nối, giải quyết, cá nhân hóa và thông báo, các đại lý ThankfulAI mang đến trải nghiệm dịch vụ giống như con người với tốc độ như máy và khả năng mở rộng chuyên môn vốn có.

14, xác nhận

Sử dụng các đại lý AI ảo của Aktify để sao chép đội ngũ bán hàng của bạn mà không cần tăng số lượng nhân viên. Aktify sẽ xử lý số lượng khách hàng tiềm năng không phản hồi không giới hạn trên quy mô lớn) và luôn mang đến cho khách hàng sự sẵn sàng trò chuyện ngay trước cửa nhà nhóm bán hàng của bạn, nó không chỉ là một chatbot qua SMS.

15 AI AI thông minh của nhóm

Tăng năng suất của bạn bằng cách truy cập TeamSmart AI bằng một cú nhấp chuột. Tổng hợp nội dung, tạo mã, tweet nháp và hơn thế nữa ngay trong trình duyệt của bạn. ChatGPT sẽ mở ngay lập tức bằng cách nhấp vào biểu tượng hoặc phím tắt, cung cấp quyền truy cập tức thì vào thư viện các mẹo chất lượng mà không cần đăng nhập.

16, Động nãoGPT

BrainstormGPT tích hợp nhiều tác nhân, LLM và tìm kiếm tự động để đơn giản hóa việc chuyển đổi báo cáo chủ đề sang cuộc họp. Các chủ đề tùy chỉnh, vai trò do người dùng xác định, các cuộc thảo luận tự chủ của tổng đài viên và kết quả báo cáo trong vòng 20 phút tương đương với 300 lượt tìm kiếm, 10 giờ thảo luận và 100.000 lượt phân tích văn bản.

17、AgentRunner.Ai

AgentRunner.ai là một công cụ tạo tác nhân AI tự động, tận dụng sức mạnh của GPT-4 để tạo và đào tạo các tác nhân tự chủ hoàn toàn. Cho phép người dùng đặt mục tiêu cho đại lý của họ và để họ quyết định cách đạt được những mục tiêu đó mà không cần bất kỳ kiến thức kỹ thuật hoặc kỹ năng lập trình nào.

Công cụ này cung cấp các tính năng như tạo tác nhân tự trị với các tính cách độc đáo, điều hành tác nhân để thực hiện nhiệm vụ hoặc học các kỹ năng mới, quyết định những gì tác nhân có thể làm và tích hợp với tài khoản OpenAI hoặc Google Cloud.

18, Ở lại

Gista giúp các doanh nghiệp tương tác với khách truy cập trang web và chuyển đổi họ thành khách hàng tiềm năng 24/7 và các tính năng chính của nó bao gồm xây dựng đại lý chuyển đổi AI và đại lý bán hàng AI. Sử dụng Gista, doanh nghiệp có thể dễ dàng chuyển đổi khách truy cập trang web thành khách hàng tiềm năng và xây dựng danh sách email.

19、Đặc vụ4

Một trong những tính năng chính của Agent4 là khả năng tạo các tác nhân ảo được hỗ trợ bởi AI có thể trả lời các câu hỏi, giúp đặt lịch họp, nghe thư thoại và cung cấp các bản tóm tắt.

Bạn có thể dễ dàng tạo các tương tác tùy chỉnh cho đại lý, cho phép họ trả lời các câu hỏi và xử lý nhiều nhiệm vụ khác nhau bằng tiếng nói của thương hiệu bạn. Bạn cũng có thể chọn cách tổng đài viên phản hồi cuộc gọi trong thời gian thực và quyết định xem bạn có cần nói chuyện với ai đó hay không và khi nào.

20 AI lõi sao chổi

Cometcore AI là một nền tảng sáng tạo cung cấp một bộ công cụ linh hoạt do AI điều khiển để cải thiện năng suất và giao tiếp. Với Cometcore, bạn có thể tạo, mã hóa và tự động hóa các đặc vụ dễ thương.

21, trợ lý cá nhân

Một tác nhân AI được thiết kế để xử lý mọi việc từ đặt vé máy bay đến tiến hành nghiên cứu chuyên sâu và mọi việc liên quan.

Dự án AI Agent trên Github

1,OpenAGI

OpenAGI là một nền tảng nghiên cứu AGI mã nguồn mở được thiết kế đặc biệt để thực hiện các nhiệm vụ gồm nhiều bước phức tạp, kèm theo các bộ dữ liệu dành riêng cho nhiệm vụ, số liệu đánh giá và nhiều mô hình có thể mở rộng. OpenAGI hình thành các tác vụ phức tạp dưới dạng truy vấn ngôn ngữ tự nhiên làm đầu vào cho LLM. Sau đó, LLM sẽ chọn, tổng hợp và thực thi các mô hình do OpenAGI cung cấp để giải quyết nhiệm vụ.

Dự án cũng đề xuất cơ chế học tăng cường phản hồi nhiệm vụ (RLTF), sử dụng kết quả giải quyết nhiệm vụ làm phản hồi để cải thiện khả năng giải quyết nhiệm vụ của LLM. LLM chịu trách nhiệm tổng hợp các mô hình bên ngoài khác nhau để giải quyết các nhiệm vụ phức tạp, trong khi RLTF cung cấp phản hồi để cải thiện khả năng giải quyết nhiệm vụ của mình, cung cấp vòng phản hồi để AI tự cải thiện. Mô hình LLM vận hành các mô hình chuyên gia khác nhau để giải quyết các nhiệm vụ phức tạp là một cách tiếp cận đầy hứa hẹn đối với AGI.

2、Đại lý-LLM

Agent-LLM là một nền tảng tự động hóa AI được thiết kế để hỗ trợ quản lý hướng dẫn AI hiệu quả trên nhiều nhà cung cấp.

Tác nhân được trang bị bộ nhớ thích ứng và giải pháp linh hoạt này cung cấp một hệ thống plug-in mạnh mẽ hỗ trợ nhiều lệnh khác nhau, bao gồm cả duyệt web. Với sự hỗ trợ ngày càng tăng của nhiều nhà cung cấp và mô hình AI, Agent-LLM tiếp tục phát triển để nâng cao nhiều ứng dụng.

3, AutoGPT-Next-Web

Tác nhân này có thể triển khai giao diện người dùng Web AutoGPT-Next-Web được thiết kế tốt trên Vercel chỉ bằng một cú nhấp chuột và triển khai miễn phí ứng dụng web AutoGPT-Next-Web riêng tư của bạn chỉ bằng một cú nhấp chuột. Dựa trên AutoGPT-Next-Web, người dùng có thể sử dụng Vercel để triển khai miễn phí chỉ bằng một cú nhấp chuột và xây dựng trang web AutoGPT cá nhân trong 1 phút.

4,MiniGPT-4

Tác nhân này có thể sử dụng các mô hình ngôn ngữ lớn tiên tiến để nâng cao khả năng hiểu ngôn ngữ hình ảnh.

5,AGI nhỏ

Mini-AGI là tác nhân tự trị có mục đích chung nhỏ nhất dựa trên GPT3.5/4. Nó kết hợp các lời nhắc mạnh mẽ, một bộ công cụ tối thiểu và trí nhớ ngắn hạn (chuỗi suy nghĩ), với tính năng tăng cường dữ liệu thông qua bộ lưu trữ vectơ sẽ sớm được bổ sung, để phân tích giá cổ phiếu, thực hiện kiểm tra an ninh mạng, tạo tác phẩm nghệ thuật và đặt mua pizza.

6, Thanh thiếu niên-AGI

Lấy cảm hứng từ một số dự án liên quan đến Auto-GPT (chủ yếu là BabyAGI) và bài báo "Tác nhân sáng tạo: Mô phỏng tương tác hành vi con người", dự án Python này sử dụng OpenAI và Pinecone để cung cấp bộ nhớ cho tác nhân AI và cho phép nó "suy nghĩ" trước khi hành động (xuất văn bản).

7, FastGPT

FastGPT là hệ thống hỏi đáp cơ sở kiến thức dựa trên mô hình ngôn ngữ lớn LLM, cung cấp khả năng xử lý dữ liệu ngay lập tức, gọi mô hình và các khả năng khác. Đồng thời, quy trình làm việc có thể được sắp xếp thông qua trực quan hóa Flow để hiện thực hóa các tình huống câu hỏi và câu trả lời phức tạp.

8, DemoGPT

Với DemoGPT, bạn có thể nhanh chóng tạo bản demo chỉ bằng những câu đơn giản.

9,AGI cục bộ

Các dự án AGI được điều hành cục bộ dựa trên LLMDA, ChatGLM và các mô hình khác.

10. ai-town (thể loại trò chơi)

Thị trấn AI nguồn mở của tổ chức đầu tư nổi tiếng a16z là một bộ công cụ khởi đầu có thể triển khai, được MIT cấp phép để xây dựng và tùy chỉnh phiên bản thị trấn AI của riêng bạn. Đây là một thị trấn ảo nơi các nhân vật AI sống, trò chuyện và giao lưu.

11, gptrpg (danh mục trò chơi)

gptrpg Kho lưu trữ này chứa hai thứ: một môi trường giống RPG đơn giản dành cho tác nhân AI hỗ trợ LLM và một tác nhân AI đơn giản kết nối với API OpenAI để tồn tại trong môi trường đó.

12. SFighterAI (Thể loại trò chơi)

Dự án là một đặc vụ AI được đào tạo bằng cách sử dụng phương pháp học tăng cường sâu để đánh bại trùm cuối trong trò chơi Street Fighter II: Special Champion Edition. Tác nhân AI đưa ra quyết định chỉ dựa trên giá trị pixel RGB của màn hình trò chơi. Ở trạng thái lưu được cung cấp, người đại diện đạt được tỷ lệ thắng 100% trong vòng đầu tiên của cấp độ cuối cùng.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)