Cú hích nội bộ của OpenAI, tác nhân AI có thể thực sự trở thành giai đoạn phát triển ứng dụng Internet tiếp theo không?

Question

![](https://img-cdn.gateio.im/social/moments-bab2147faf-55720ecd7b-dd1a6f-7649e1) Nguồn hình ảnh: Được tạo bởi Unbounded AILịch sử phát triển của các ứng dụng Internet có thể coi là một quá trình phát triển và đổi mới không ngừng, với sự tiến bộ không ngừng của công nghệ, các ứng dụng Internet sáng tạo liên tục xuất hiện.Sự phát triển của các ứng dụng Internet có thể được chia thành ba giai đoạn:>> 1. Trang webVào những năm 1990, với sự phổ biến của Internet, một số công ty Internet quan trọng đã nổi lên như Amazon, Yahoo, Google, v.v. Các công ty này đã phát triển một số ứng dụng Internet quan trọng, chẳng hạn như thương mại điện tử, công cụ tìm kiếm, quảng cáo trực tuyến, v.v.>> 2. Ứng dụng di động (Mobile)Vào những năm 2000, với sự phát triển của Internet di động, một số ứng dụng di động quan trọng đã xuất hiện, chẳng hạn như điện thoại thông minh, kho ứng dụng di động, v.v.>> 3. Ứng dụng đại lý AIVào những năm 2020, với sự phát triển của công nghệ AI, một số ứng dụng trí tuệ nhân tạo quan trọng đã xuất hiện như nhận dạng giọng nói, nhận dạng hình ảnh và xử lý ngôn ngữ tự nhiên. Đặc biệt sau khi OpenAI ra mắt ChatGPT, ứng dụng tác nhân AI tự trị được điều khiển bởi mô hình ngôn ngữ lớn (LLM) sẽ đưa ứng dụng tác nhân AI lên một giai đoạn phát triển mới.## Bản đồ phát triển đại lý AI![](https://img-cdn.gateio.im/social/moments-bab2147faf-18c67a00f1-dd1a6f-7649e1) Nguồn hình ảnh: e2b## Tác nhân AI là gìTác nhân AI (AI agent) là chương trình máy tính được thiết kế và lập trình bằng công nghệ AI, có thể thực hiện độc lập một số nhiệm vụ nhất định và phản ứng với môi trường. Một tác nhân AI có thể được xem như một tác nhân nhận thức được môi trường của nó, thay đổi nó thông qua các quyết định và hành động của chính nó, đồng thời cải thiện hiệu suất của nó bằng cách học hỏi và thích nghi. Sử dụng cả trí nhớ ngắn hạn (học theo ngữ cảnh) và trí nhớ dài hạn (truy xuất thông tin từ các kho lưu trữ vectơ bên ngoài), tác nhân có khả năng lập kế hoạch bằng cách "suy nghĩ" từng bước, chia mục tiêu thành các nhiệm vụ nhỏ hơn và phản ánh về hiệu suất của chính nó.Các tác nhân AI thường kết hợp nhiều công nghệ, chẳng hạn như học máy, xử lý ngôn ngữ tự nhiên, thị giác máy tính, lập kế hoạch và suy luận, cho phép các tác nhân xử lý thông tin và đưa ra quyết định một cách tự động.OpenAI đã nhiều lần bày tỏ sự nhiệt tình của mình đối với các tác nhân AI. Người đồng sáng lập OpenAI, Andrej Karpathy, gần đây đã nói trong một sự kiện ngoại tuyến dành cho các nhà phát triển rằng nếu một bài báo đề xuất một phương pháp đào tạo mô hình khác, OpenAI sẽ chế giễu nó trong nội bộ, nghĩ rằng đó là tất cả những gì còn sót lại từ trò chơi của họ. Nhưng khi bài báo mới về Đại lý AI xuất hiện, họ sẽ thảo luận về nó một cách nghiêm túc và hào hứng.![](https://img-cdn.gateio.im/social/moments-bab2147faf-e811068452-dd1a6f-7649e1)## Đại lý tự trị được hỗ trợ bởi LLM là gìLilian Weng, giám đốc nghiên cứu ứng dụng AI tại OpenAI, gần đây đã xuất bản một bài báo dài 10.000 từ về tác nhân AI: "Các tác nhân tự động được hỗ trợ bởi các mô hình ngôn ngữ lớn (LLM)", cung cấp giải thích chuyên sâu về ứng dụng tác nhân AI là gì được xây dựng bởi đào tạo LLM. Có rất nhiều ứng dụng tuyệt vời của các tác nhân AI được hỗ trợ bởi LLM, chẳng hạn như AutoGPT, GPT-Engineer, BabyAGI và SuperAGI.Trong hệ thống đại lý tự trị do LLM cung cấp, LLM hoạt động như bộ não của đại lý và được bổ sung bởi một số thành phần chính: Lập kế hoạch, Bộ nhớ và Sử dụng Công cụ.Tác nhân này chia nhỏ các nhiệm vụ lớn thành các mục tiêu nhỏ hơn, có thể quản lý được, cho phép xử lý hiệu quả các nhiệm vụ phức tạp. Nó cũng cho phép tự phê bình và nhìn lại bản thân về những hành động trong quá khứ, học hỏi từ những sai lầm và điều chỉnh cho các bước trong tương lai, từ đó nâng cao chất lượng của kết quả cuối cùng.Điểm đặc biệt của tác nhân tự chủ LLM là nó giống như có một “trí nhớ”, có khả năng ghi nhớ ngắn hạn (dài hạn) những gì đã học được trong quá trình huấn luyện. Ngoài ra, LLM tự động mang đến khả năng học cách gọi các API bên ngoài để lấy thông tin bổ sung còn thiếu trong trọng số mô hình (thường khó thay đổi sau khi đào tạo trước), bao gồm thông tin hiện tại, khả năng thực thi mã, quyền truy cập vào các nguồn thông tin độc quyền, v.v.Thú vị và đầy hứa hẹn như các tác nhân AI, vẫn còn nhiều thách thức xung quanh sự cường điệu xung quanh các tác nhân AI. Các tác nhân AI đang trở thành tương lai của các ứng dụng phần mềm và sẽ ngày càng trở nên phổ biến hơn.Như Lilian Weng đã đề cập, các tác nhân tự trị LLM cũng gặp phải một số hạn chế phổ biến, bao gồm độ dài ngữ cảnh hạn chế, thách thức về lập kế hoạch dài hạn và phân tách nhiệm vụ, tính ổn định của LLM, v.v.Nhưng chắc chắn rằng những vấn đề và thách thức này sẽ được khắc phục hoặc giảm bớt.Các tác nhân AI đã mang lại những thay đổi cho công việc và cuộc sống của chúng ta, và sự thay đổi này rất khó đảo ngược. Sau khi thử điều gì đó tốt, bạn có chịu đựng điều gì đó thực sự tồi tệ không?Người giới thiệu:**