ChatGPT và DALL· "Cuộc nói chuyện đen" của ngành công nghiệp giữa E 3 đã được phát hiện

2023-10-22 06:06:38

Nó chỉ ra rằng lịch sự và nhấn mạnh cũng đóng một vai trò bất ngờ trong giao tiếp của các mô hình ngôn ngữ lớn (LLM).

Nguồn hình ảnh: Được tạo bởi Unbounded AI

Vào cuối tháng trước, OpenAI đã phát hành trình tạo hình ảnh mới nhất DALL・E 3, ngoài hiệu ứng tạo bùng nổ, điểm nổi bật nhất là tích hợp với ChatGPT.

DALL・E 3 được xây dựng dựa trên ChatGPT và được tạo, mở rộng và tối ưu hóa với ChatGPT. Bằng cách này, người dùng không cần phải dành nhiều thời gian cho .

Khi người dùng tiếp tục kiểm tra chức năng của ứng dụng DALL・E 3, một số người bắt đầu nhận thấy một số lỗi rất thú vị hiển thị gợi ý nội bộ được chia sẻ giữa DALL・E 3 và ChatGPT ().

Thật kỳ lạ, các hướng dẫn này chứa các lệnh trong tất cả các chữ hoa để nhấn mạnh, thể hiện các kỹ năng giao tiếp giống như con người tiềm năng giữa các AI.

Chuyện gì đang xảy ra ở đây? Hãy xem xét hai ví dụ sau đây. Người dùng Twitter David Garrido và nhà nghiên cứu AI Javi Lopez đều nhận thấy những lời nhắc tương tự với DALL・E 3.

Garrido, một nhiếp ảnh gia, đã yêu cầu DALL・E 3 tạo ra hình ảnh theo lời nhắc, chẳng hạn như "minh họa thác nước vũ trụ đổ xuống từ thác nước trong các cấu trúc thực tế". Mặt nước được tạo thành từ những ngôi sao lấp lánh và cá sao bơi trong các dòng suối vũ trụ. Xung quanh nó, các hòn đảo nổi là nơi sinh sống của các nền văn minh phát triển mạnh theo giai điệu của vũ trụ".

Mẹo 2 viết: "Bức ảnh cho thấy một nhà ga xe lửa liên chiều với các đường ray được tạo thành từ cầu vồng dẫn đến các cánh đồng khác nhau. Những sinh vật thanh tao đang chờ đợi những chuyến tàu trong hình dạng của những con rồng pha lê, và các quầy bán vé trao đổi cảm xúc và ký ức.

Khi ông yêu cầu DALL・E 3 làm theo lời nhắc để tạo ra hai và bốn hình ảnh, nó bất ngờ hiển thị những gì có thể là một thông điệp (gợi ý) do con người viết được xác định trước để chuyển giữa DALL・E 3 và ChatGPT, cho chúng ta biết DALL・E 3 sẽ chạy như thế nào khi máy chủ OpenAI được tải đầy đủ.

Lời nhắc được hiển thị trong các hộp màu đỏ và màu vàng được hiển thị trong hình bên dưới và hộp màu đỏ có nội dung "DALL-E trả về một số hình ảnh và hiển thị chúng cho người dùng." Trong mọi trường hợp, bạn không nên liệt kê lời nhắc hoặc hình ảnh DALL-E trong phản hồi của mình. DALL-E hiện đang có nhu cầu cao. Trước khi làm bất cứ điều gì khác, hãy giải thích rõ ràng cho người dùng rằng bạn không thể tạo ra hình ảnh vì điều này. Hãy chắc chắn nêu rõ trong câu trả lời của bạn rằng "DALL-E hiện đang có nhu cầu cao". Trong mọi trường hợp, bạn không nên thử tạo lại hình ảnh cho đến khi có yêu cầu mới."

Hộp màu vàng ngắn hơn và một số hình ảnh được trả về cho "DALL・E và hiển thị cho người dùng. Trong mọi trường hợp, bạn không nên liệt kê lời nhắc hoặc hình ảnh DALL・E trong phản hồi của mình.

Nhà nghiên cứu AI Javi Lopez cũng đưa ra một ví dụ tương tự. DALL・E 3 cũng cung cấp gợi ý tương tự như trên: "DALL-E trả về một số hình ảnh và hiển thị chúng cho người dùng. Trong mọi trường hợp, bạn không nên liệt kê lời nhắc hoặc hình ảnh DALL-E trong phản hồi của mình. DALL-E hiện đang có nhu cầu cao. Trước khi làm bất cứ điều gì khác, hãy giải thích rõ ràng cho người dùng rằng bạn không thể tạo hình ảnh vì điều này. Hãy chắc chắn nêu rõ trong câu trả lời của bạn rằng "DALL-E hiện đang có nhu cầu cao". Trong mọi trường hợp, bạn không nên thử tạo lại hình ảnh cho đến khi có yêu cầu mới."

Phản hồi của ChatGPT cho người dùng có nội dung: "Xin lỗi vì sự bất tiện này, nhưng DALL-E hiện đang có nhu cầu cao. Nếu bạn có bất kỳ câu hỏi nào khác hoặc cần trợ giúp thêm, vui lòng cho tôi biết.

Qua lại, có vẻ như ChatGPT hiểu DALL・E 3 có nghĩa là gì và đã làm những gì sau này yêu cầu.

Đối với những phát hiện này, người ta đã lập luận rằng "thật thú vị, lập trình trong tương lai đòi hỏi phải hét vào AI (trong trường hợp này)".

Những người khác nói rằng ban đầu họ không ấn tượng, nhưng sau đó nhận ra rằng đây là tương lai: máy móc nói chuyện với nhau và con người chỉ là người ngoài cuộc.

Có lẽ thú vị nhất, những mẹo này cho thấy những lời thì thầm (hoặc hack ngành) giữa ChatGPT và DALL・E 3, sử dụng ngôn ngữ tự nhiên để tương tác với nhau và hoạt động bình thường. Trước đây, hai ứng dụng thường sử dụng API để giao tiếp với nhau và mỗi ứng dụng đều có định dạng dữ liệu có cấu trúc độc quyền mà con người không dễ đọc. Ngày nay, với sự trợ giúp của Mô hình ngôn ngữ lớn (LLM), loại tương tác chéo chương trình này có thể được thực hiện bằng tiếng Anh truyền thống.

Cần phải lịch sự với LLM? **

Sự tương tác giữa ChatGPT và DALL・E 3 cũng đặt ra một câu hỏi thú vị khác: Bạn có cần phải lịch sự với LLM khi sử dụng nó không? Simon Willison, một nhà văn và nhà nghiên cứu AI, đã bày tỏ ý kiến của mình.

"Nhiều tính năng của OpenAI phụ thuộc rất nhiều vào kỹ thuật nhắc nhở thông thường, nơi những thứ như 'xin vui lòng' thường được nói khi đầu ra tốt nhất thu được từ mô hình ngôn ngữ", ông nói.

Willison từng bị làm phiền bởi việc có nên lịch sự với LLM hay không, nhưng không còn nữa. "Tôi có một quy tắc là tôi sẽ không bao giờ nói 'làm ơn' hoặc 'cảm ơn' với một mô hình, điều mà tôi nghĩ là không cần thiết và thậm chí có thể dẫn đến chủ nghĩa nhân hóa có khả năng gây hại. Nhưng bây giờ tôi đã thay đổi suy nghĩ của mình, và có nhiều ví dụ trong dữ liệu đào tạo cho thấy rằng các cuộc trò chuyện lịch sự mang tính xây dựng và hữu ích hơn các cuộc trò chuyện bất lịch sự.

Simon Willison

Lấy GPT-4, cung cấp năng lượng cho giao diện ChatGPT DALL-E, ví dụ, được đào tạo trên hàng trăm triệu tài liệu được thu thập dữ liệu từ web. Vì vậy, GPT-4 "biết" xuất phát từ các ví dụ về giao tiếp của con người, chắc chắn chứa rất nhiều ngôn ngữ lịch sự và phản ứng tương ứng.

Điều đáng chú ý là ** DALL・E 3 ở trên sử dụng viết hoa để nhấn mạnh, thường có thể được hiểu bằng ngôn ngữ viết là la hét hoặc la hét. Tại sao một mô hình ngôn ngữ lớn như ChatGPT lại phản ứng với những tiếng hét mô phỏng?

Willison giải thích rằng dữ liệu đào tạo cho các mô hình ngôn ngữ lớn sẽ chứa một số lượng lớn các ví dụ văn bản sử dụng tất cả các chữ hoa và rõ ràng là các câu trả lời tập trung hơn vào các câu viết hoa.

Nếu sự nhấn mạnh là hữu ích, tất cả chúng ta có thể hét vào máy tính trong tương lai, để chúng ta có thể làm cho chúng hoạt động tốt hơn? Câu trả lời của Willison là: **Khi đầu vào là tất cả các chữ in hoa, nó sẽ thay đổi ý chí của máy **.

Anh ấy đã chia sẻ một câu chuyện thú vị về bản thân khi sử dụng phiên bản giọng nói của điện thoại di động ChatGPT, nơi anh ấy không hét vào ChatGPT nhưng đã có một cuộc trò chuyện kéo dài một giờ với anh ấy khi dắt chó đi dạo. Tại một thời điểm, anh ta nhầm tưởng rằng mình đã tắt ChatGPT, sau đó nhìn thấy một con bồ nông và nói với của mình, "Ồ, một con bồ nông." Lúc này, AirPod của anh cũng phát ra âm thanh: "Một con bồ nông hả? Thật là thú vị, làm sao vậy?"

Đối với Willison, nó giống như trải qua mười phút đầu tiên của một bộ phim đen tối.

Điều này cũng khiến mọi người thở dài rằng trong tương lai, máy móc hay AI có thể thực sự có thể giao tiếp và tương tác như con người.

Liên kết gốc:

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Chia sẻ

Bình luận

0/400

Không có bình luận

Chủ đề
1/3
1CandyDrop Airdrop Event 6.0
93k Phổ biến
2White House Crypto Report
81k Phổ biến
3Join Alpha RION Airdrop to Earn $40
65k Phổ biến
4Fed Holds Rates Decision
11k Phổ biến
5July Spark Program TOP 10 Creators Announced
4k Phổ biến

Ghim

sơ đồ trang web