Plugin: Ứng dụng gốc thay thế AI có rào cản gia nhập thấp nhất

Nguồn: AI New Intelligence

Nguồn hình ảnh: Được tạo bởi Unbounded AI

mô hình lớn + mô hình plug-in rất có thể là một trong những câu trả lời cho việc thương mại hóa các mô hình lớn AI.

Ngày 17/10, tại "Hội nghị Baidu World Conference 2023", Robin Li đã chính thức cho ra mắt phiên bản Wenxin model 4.0 mới nhất.

Trong một thời gian, các đánh giá khác nhau đổ vào, và các phương tiện truyền thông khoa học và công nghệ lớn đã tiến hành đánh giá toàn diện mô hình từ các khía cạnh của sự hiểu biết, thế hệ, logic và khả năng ghi nhớ.

Tuy nhiên, ngoài việc liên tục nói về Wenxin 4.0, một chức năng hơi thấp khác tại buổi họp báo cũng lạnh lùng cho thấy xu hướng phát triển của các mẫu xe lớn trong tương lai.

**Đây là chức năng plug-in của Baidu Wenxin 4.0. **

Hiện tại, Wenxin 4.0 có 8 plug-in một mình, bao gồm một dòng gương đổ bóng (văn bản để video), nói vẽ tranh (nhìn vào hình ảnh và nói), E Yan Yi Tu (phân tích dữ liệu hình ảnh), và như vậy.

Các plugin này cũng có thể được kết hợp tự do để hoàn thành các tác vụ phức tạp hơn.

Không chỉ vậy, nền tảng phát triển plug-in mô hình lớn Baidu Wenxin, Lingjing Matrix Platform, đã được 27.000 nhà phát triển áp dụng trong một tháng sau khi ra mắt và các nhà phát triển cá nhân chiếm hơn 30%.

Vì vậy, tại sao Baidu rất coi trọng plugin? Và sự thịnh vượng của hệ sinh thái plug-in có ý nghĩa gì đối với mô hình lớn?

** Plugin, hãy để mô hình lớn như cánh hổ **

Ở một mức độ nào đó, các plug-in tương đương với một "ứng dụng sát thủ" ẩn khác cho các mô hình lớn. "

Nếu không cải thiện thuật toán và tham số mô hình, có thể mở rộng đáng kể và cải thiện khả năng của mô hình chỉ với một bổ trợ đơn giản.

Trước đây, GPT-4 đã đạt được hiệu quả tăng cường sức mạnh cho hổ thông qua chức năng plug-in. Thế giới bên ngoài thậm chí còn gọi đó là sự gia tăng ** Sự xuất hiện của GPT-4.5 **.

Vào ngày 9 tháng 7 năm nay, OpenAI đã thông báo rằng plugin chính thức Trình thông dịch mã (Trình thông dịch mã) sẽ có sẵn cho tất cả người dùng ChatGPT Plus thông qua bảng điều khiển Beta trong Cài đặt.

Vậy chính xác thì Code Interpreter có thể làm gì?

Nói một cách đơn giản, nó tương đương với việc mở rộng lớn ranh giới khả năng GPT-4, cho phép GPT-4 làm được nhiều việc mà trước đây không thể thực hiện được.

Ví dụ: sau khi plugin ra mắt, người dùng Twitter @歸藏 đã trình diễn quá trình phân tích dữ liệu người đăng ký bản tin bằng trình phân tích cú pháp mã.

Trình phân tích cú pháp mã không cần sử dụng bất kỳ phần mềm phức tạp nào từ phân tích dữ liệu đến lập bản đồ, chỉ cần nói điều gì đó thẳng thừng: "Tôi muốn phân tích xu hướng tăng trưởng thuê bao trong tháng trước".

Ngoài ra, mọi người cũng có thể trực tiếp sử dụng "lời nói của con người" để cho phép GPT tạo ra một số hình ảnh GIF trực quan từ dữ liệu.

Ví dụ: nếu mọi người muốn tạo biểu tượng địa lý của ngọn hải đăng Mỹ, họ chỉ cần tải lên dữ liệu vị trí địa lý và GPT có thể tự động tạo GIF sau thông qua chức năng trình cắm.

Và ngay cả khi bạn muốn tạo video từ hình ảnh, CodeInterpreter có thể làm điều đó trong tầm tay bạn. Sau khi bật plugin, chỉ cần nói với GPT: "Tôi muốn sử dụng hình ảnh này để tạo video lia từ phải sang trái." "

GPT sẽ tự động tạo video về hình ảnh do Midjourney tạo ra theo yêu cầu của bạn.

Netizen ChaseLean sử dụng ChatGPT để tạo video burger

Ngay cả những người có ít kinh nghiệm về mã và lập trình cũng có thể sử dụng plugin CodeInterpreter để tạo một trò chơi đơn giản trong 5 phút.

Chỉ với một vài lời nhắc, một mini game đơn giản đã hoàn thành

Nói chung, CodeInterpreter bao gồm các chức năng bao gồm nhiều nhiệm vụ khác nhau như phá vỡ rào cản phương thức, chuyển đổi các dạng vật liệu và thực hiện phân tích dữ liệu.

Lý do tại sao plugin có chức năng "bất chấp bầu trời" như vậy là vì nó phá vỡ rào cản giữa ngôn ngữ tự nhiên và ngôn ngữ mã. **

Với nó, người dùng có thể cắt bỏ các quy trình mã phức tạp và trực tiếp hoàn thành các tác vụ đa miền và đa phương thức khác nhau thông qua tương tác ngôn ngữ tự nhiên (được gọi là "lời nói của con người").

Bởi vì điều này, một số người đã thốt lên rằng plug-in tăng gấp đôi khả năng của mô hình này là sự xuất hiện của GPT-4.5.

Do đó, không khó hiểu tại sao Baidu lại coi trọng việc phát triển các plugin đến vậy.

Đối với các nhóm phát triển mô hình lớn, việc tạo ra một mô hình bao gồm tất cả các nhu cầu của người dùng là không thể và không thực tế. Bởi trong quá trình tiến hóa AI, người dùng chắc chắn sẽ sinh ra nhiều ý tưởng, nhu cầu mới và khó đoán hơn.

Tại thời điểm này, một loạt các plug-in linh hoạt đã trở thành một "bộ phận giả" giúp mở rộng khả năng của các mô hình lớn.

**Plugin nở **

Ngoài các plugin gốc đi kèm với OpenAI, các plugin khác đã xuất hiện trên đường đua AI hiện tại.

Ở đây, chúng tôi sẽ thực hiện một số liệt kê đơn giản để xem những plugin tiện ích mở rộng đa dạng với các chức năng khác nhau sẽ mang lại cho các mô hình lớn hơn.

Trò chuyệnPDF

ChatPDF là một công cụ PDF trực tuyến mạnh mẽ, người dùng chỉ cần tải file PDF lên ChatPDF, ChatPDF có thể nhanh chóng sử dụng AI để phân tích cú pháp nội dung của file PDF, đồng thời tạo ra câu trả lời chính xác để trả lời câu hỏi của người dùng.

Ngoài tính năng Hỏi &Đáp thông minh, ChatPDF còn cung cấp tính năng chỉnh sửa, chuyển đổi và nén tệp trực tuyến. Nếu người dùng muốn thêm hoặc xóa các yếu tố khỏi tệp PDF hoặc thay đổi một số văn bản hoặc hình ảnh, tính năng chỉnh sửa trực tuyến của ChatPDF sẽ rất hữu ích.

### Monica

Một plugin thanh bên trang web kết nối với giao diện API của ChatGPT và khi được khởi chạy, Monica có thể sử dụng khả năng của ChatGPT để diễn giải bất kỳ thông tin hoặc văn bản nào hoặc thảo luận về nội dung của trang và cung cấp bản dịch khi duyệt bất kỳ trang web nào.

Điều đáng nói là ngoài ChatGPT, Monica còn tích hợp giao diện của các AI khác như Claued và Bard, và nếu điều này là chưa đủ, người dùng còn có thể tự tìm kiếm và thêm các công cụ AI khác trong thư viện AI mà họ truy cập, để họ có thể đáp ứng nhu cầu đa dạng của mình thông qua các AI khác nhau.

### ChatHub

Đây là một plugin cho phép bạn sử dụng các chatbot khác nhau trong một ứng dụng, hiện hỗ trợ ChatGPT và BingChat mới và sẽ tích hợp nhiều chatbot hơn như Google Bard trong tương lai. Người dùng có thể giao tiếp với nhiều chatbot cùng một lúc và dễ dàng so sánh câu trả lời của họ.

### Ghi chúGPT

Đây là một plugin sử dụng ChatGPT để tóm tắt video. Hỗ trợ chụp ảnh màn hình và ghi chú trên các trang web video chỉ với một cú nhấp chuột.

Sau khi khởi chạy plugin, người dùng có thể nhanh chóng sử dụng ChatGPT để có được thông tin chính về nội dung video và tạo tóm tắt và tóm tắt khi đối mặt với một số video dài nhất định, đồng thời chụp ảnh màn hình hoặc ghi lại các ghi chú có dấu thời gian trong khi xem video chỉ bằng một cú nhấp chuột.

### Trợ lý AI ngôi sao thông minh

Đây là sản phẩm mô hình nhận thức AI đầu tiên ở Trung Quốc hỗ trợ các trình cắm và Zhixing AI hiện có quyền truy cập vào 7 trình cắm, bao gồm truy vấn thời tiết, tìm kiếm Bing, Wolfram, v.v., có thể nhanh chóng cung cấp thông tin thời tiết theo thời gian thực, trả lời các vấn đề toán học nâng cao và tiến hành phân tích tài chính chuyên sâu.

Trong khi đó, ChatGPT chỉ có thể sử dụng 3 plugin cùng một lúc, trong khi Smartstar AI không giới hạn số lượng plugin.

### WPSAI

Nó tương đương với phiên bản Microsoft 365 Copilot trong nước, với chữ viết tắt, mở rộng, tiếp tục, thay đổi phong cách viết, tóm tắt và tóm tắt những điểm chính của bài viết, nhanh chóng tạo phác thảo PPT, sản xuất mẫu PPT bằng một cú nhấp chuột, xử lý thông minh bảng Excel và các chức năng khác và có các tính năng mới về tương tác bằng giọng nói, có thể được sử dụng cho văn phòng di động trên các thiết bị đầu cuối màn hình nhỏ như điện thoại di động.

**Tham vọng trong plugin **

Ngoài các loại chức năng plug-in khác nhau của bên thứ ba nói trên, các gã khổng lồ công nghệ lớn cũng đã cho thấy một động lực theo hướng plug-in.

Ví dụ: nền tảng plug-in AI của Microsoft cung cấp một loạt các công cụ và dịch vụ cho phép các nhà phát triển sử dụng ChatGPT của Microsoft và Bing mới để tạo và triển khai các trình cắm AI khác nhau, bao gồm các lớp mô hình khả năng, lớp dữ liệu, lớp ứng dụng, v.v. Các plugin của nó trải rộng trên nhiều kịch bản và sản phẩm, chẳng hạn như Dynamics 365, Microsoft 365, v.v. **

Tại Trung Quốc, Baidu cũng đã ra mắt nền tảng "Spirit Matrix", được biết đến là cho phép mọi người phát triển các plug-in AI, cố gắng xây dựng một hệ sinh thái plug-in khổng lồ dựa trên lời nói của Wen Xin.

Đằng sau bố cục lớn này, ít nhất ý định của những người khổng lồ được tiết lộ ở hai khía cạnh:

**1. Lấy plug-in làm điểm đột phá để mở ra con đường thương mại hóa quy mô lớn; **

**2. Với hệ sinh thái plug-in khổng lồ, hãy xây dựng các rào cản phần mềm như CUDA của NVIDIA. **

Về điểm đầu tiên, tại sao mô hình mô hình lớn + mô hình plug-in rất có thể là câu trả lời cho việc thương mại hóa AI quy mô lớn?

Lý do thực sự rất đơn giản, mô hình lớn trước đây, cho dù đó là văn bản AI, bản vẽ, trường kích hoạt của nó chỉ có thể giới hạn trong một phạm vi hẹp, duy nhất.

Một mô hình lớn có thể có trình độ viết tốt, nhưng trong thực tế, làm thế nào để giải quyết các nhiệm vụ đa danh mục và cụ thể của so sánh hàng hóa và phân tích tài chính?

Nhu cầu của mọi người trong cuộc sống rất đa dạng và đa cấp, từ quan điểm này, khi mô hình lớn phá vỡ giới hạn của một chế độ duy nhất và đáp ứng nhu cầu đa dạng này, đó là khởi đầu của thương mại hóa quy mô lớn thực sự. **

Và các chức năng plug-in của mỗi bên ngoài tương đương với các mô hình lớn? "Mắt" và "tay" làm cho nó không còn giới hạn trong một lĩnh vực duy nhất và phạm vi của phương thức.

Trong tương lai, người dùng có thể chỉ cần một lối vào mô hình lớn để hoàn thành các tác vụ như đặt vé, đặt đồ ăn, đặt đồ ăn và đặt đồ ăn mang đi.

Điều này cũng dẫn đến điểm thứ hai, đó là rào cản sinh thái bị chi phối bởi ** plug-in. **

Trong đường đua mô hình lớn hiện nay, mặc dù có vô số ứng dụng AI có nguồn gốc trong và ngoài nước, khi một phần đáng kể trong số đó vẫn là các sản phẩm "shell" dựa trên ChatGPT.

Thực tế này cũng phản ánh từ một phía: trong việc lựa chọn các mô hình lớn, hầu hết các nhà phát triển và người dùng vẫn chỉ nhận ra các sản phẩm đầu mạnh nhất.

A16Z, một tổ chức đầu tư nổi tiếng, đã công bố vào tháng trước rằng một phần đáng kể trong số 50 trang web AI hàng đầu theo lưu lượng truy cập là các ứng dụng "vỏ bọc"

Nói cách khác, đối với các mô hình lớn, miễn là người dùng gặp phải cái nào tốt nhất để sử dụng, anh ta ít có khả năng sử dụng cái kia.

Theo logic này, nếu nhiều công ty không muốn rơi vào tình trạng lặp lại bánh xe, lựa chọn tốt nhất phải là chuyển trọng tâm của họ sang phía ứng dụng.

Kinh nghiệm lịch sử cho thấy trong cuộc cạnh tranh của phần mềm và ứng dụng, ai có thể cung cấp cho các nhà phát triển một môi trường phát triển thân thiện và ngưỡng thấp, ai có thể đi đầu trong việc thiết lập các rào cản sinh thái của riêng họ.

Về vấn đề này, CUDA của NVIDIA có thể nói là một ví dụ tuyệt vời.

Sau khi phát triển không ngừng, CUDA đã hình thành một hệ sinh thái phong phú và trưởng thành. NVIDIA cũng đã đạt được sự ràng buộc sâu sắc về phần mềm và phần cứng: với phần mềm của anh ấy, bạn phải mua phần cứng của anh ấy và mua phần cứng của anh ấy bằng CUDA có thể hiệu quả gấp đôi.

Hiện tại, cách bố trí của những gã khổng lồ lớn trong các plug-in cũng khá giống với CUDA của NVIDIA: nếu các nhà phát triển hoặc người dùng muốn đạt được sự phát triển ứng dụng AI ngưỡng thấp và nhanh chóng, họ phải dựa trên khả năng của các mô hình lớn của họ.

Đổi lại, sự thịnh vượng của hệ sinh thái ứng dụng sẽ củng cố sự phụ thuộc của mọi người vào mô hình lớn của nó.

Bất cứ ai đi đầu trong việc hiện thực hóa một hệ sinh thái như vậy thúc đẩy và bổ sung cho nhau bằng các ứng dụng sẽ là người đầu tiên dựng lên các rào cản sinh thái của riêng mình trong kỷ nguyên AI.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)