Cách đây một thời gian, Zhang Ying đã chia sẻ một số nhận định về xu hướng AI và 7 gợi ý cho tinh thần khởi nghiệp AI tại Hội nghị AI của Học viện Chaos, anh ấy đã đề cập đến trong gợi ý đầu tiên:
"Mọi người phải chú ý đến việc học và ứng dụng AI. Lặp lại hiệu quả quan trọng hơn bất cứ điều gì khác. Điểm mấu chốt là học cách viết các từ gợi ý. Biết cách đặt câu hỏi là rất quan trọng. Làm thế nào để tương tác tốt hơn với AI cũng là một khoa học." *
Hôm nay chúng ta sẽ nói một chút về "Kỹ thuật". Vào đầu năm, nhiều từ điển Midjourney đã trở nên phổ biến trên Internet, chẳng hạn như:
đèn neon lấp lánh
góc nhìn cao góc nhìn cao
bề mặt đánh bóng tương lai
Phong cách cổ điển, Vintage thế kỷ 18-19
Ukiyo-e ukiyoe truyền thống của Nhật Bản
……
Mãi cho đến gần đây, các đại thần lại giở trò QR code, sau khi viết lời nhắc về phong cách và các yếu tố, họ có thể cho ra một số "mã QR nghệ thuật AI" độc đáo:
**Chúng tôi biết rằng bạn có thể sử dụng một mô hình ngôn ngữ lớn hay không phụ thuộc phần lớn vào chất lượng của các từ gợi ý của bạn, nhưng đừng nghĩ về các từ gợi ý là đơn giản, nó không chỉ là thêm một vài từ hoặc câu khi đặt câu hỏi. đơn giản như vậy, sở dĩ gọi là Kỹ thuật (prompt engineering) là vì có nhiều thực hành kỹ thuật phức tạp. **
Trong bài viết hôm nay, chúng ta bắt đầu với hai trường hợp, ** trường hợp đầu tiên là một ví dụ về văn bản thuần túy, và trường hợp thứ hai là một ví dụ yêu cầu mã để triển khai, ** để giới thiệu một số nguyên tắc và kỹ thuật quan trọng của Kỹ thuật:
**Trường hợp đầu tiên là "mô hình viết quảng cáo kiểu nóng" rất phổ biến trong một số cộng đồng AI, chủ yếu sử dụng văn bản thuần túy để viết các mẫu và lời nhắc quy tắc cho AI. **
**Trường hợp thứ hai là một ví dụ về "robot gọi đồ ăn" trong khóa học kỹ thuật nhắc ChatGPT mà Ng Enda và OpenAI chính thức hợp tác. **
**Cuối cùng, hãy tóm tắt một số nguyên tắc và kỹ thuật cơ bản. **
Tất nhiên, không có sự khác biệt cơ bản giữa văn bản thuần túy của lời nhắc và mã viết, mục đích của việc sử dụng mã là tiết kiệm mã thông báo và làm cho đầu ra ổn định và chính xác hơn, bởi vì tiếng Trung vẫn sẽ chiếm nhiều mã thông báo hơn. để gọi API trên quy mô lớn Đôi khi, chi phí sẽ tăng mạnh. Lời nhắc văn bản thuần túy cũng có thể rất phức tạp.Ví dụ, tôi đã thấy hơn 600 dòng lời nhắc văn bản và chúng bao gồm nhiều nhóm mô-đun.
1Một mô hình viết quảng cáo phổ biến (văn bản thuần túy)
Hãy giới thiệu ngắn gọn "Kỹ thuật" (prompt engineering) là gì? Thông thường, điều đó có nghĩa là chuyển đổi các câu hỏi bạn muốn hỏi thành đầu vào ở định dạng cụ thể và sử dụng các mẫu, quy tắc và thuật toán được xác định trước để xử lý, để AI có thể hiểu rõ hơn về nhiệm vụ và đưa ra câu trả lời tương ứng. Cho phép AI hiểu chính xác các nhiệm vụ ở mức độ lớn nhất, giảm hiểu lầm và lỗi do cách diễn đạt ngôn ngữ không rõ ràng, đồng thời cho phép AI thực hiện các nhiệm vụ cụ thể một cách chính xác và đáng tin cậy.
Hãy chuyển sang ví dụ văn bản này. Trong nhiều tình huống yêu cầu viết quảng cáo, chẳng hạn như các trang thương mại điện tử, viết quảng cáo trồng Xiaohongshu, bài đăng trên diễn đàn, v.v., nếu bạn trực tiếp để AI viết, hiệu quả có thể không tốt, ** nhưng thông qua "năm bước" này, bạn có thể làm cho chất lượng đầu ra được cải thiện và kết quả ổn định hơn. **
Bước đầu tiên, "cung cấp" bài viết quảng cáo mà bạn cho là tốt cho AI và để AI học được bài viết quảng cáo này rõ ràng, chúng ta cần nói rõ với AI: "Tiếp theo, tôi sẽ gửi cho bạn một bài học viết bài quảng cáo , mục đích là Tạo mô hình viết bài quảng cáo cho các mô hình phổ biến, sau khi học xong bạn chỉ cần nhắn lại: Tôi đã học rồi. Bài viết quảng cáo như sau: "
**Bước thứ hai, sau khi AI trả lời "Đã học", chúng ta sẽ bắt đầu để AI làm mẫu cho phong cách viết của bài viết quảng cáo này.
Bước thứ ba Nói chung, AI không tóm tắt tốt vào thời điểm này. Chúng ta cần để AI tìm hiểu thêm và thay đổi câu trả lời của chính nó. Lúc này, chúng ta có thể cung cấp cho AI một khuôn khổ. Tất nhiên, bước này cũng có thể được tích hợp trực tiếp vào bước trước đó.
Bước thứ tư, chúng tôi để AI gán trọng số cho từng phần.
Bước 5, Chúng tôi đặt tên cho mẫu này để AI có thể nhanh chóng gọi nó.
Dưới đây là một vài ví dụ ứng dụng:
Đối với nhiều lĩnh vực viết quảng cáo có định dạng tương đối và không đòi hỏi tính sáng tạo cao, nội dung của AI đã đạt trên mức cơ bản và phần còn lại có thể được sửa đổi thủ công.
**Bạn cũng có thể tiếp tục tinh chỉnh mô hình này, chẳng hạn như yêu cầu AI viết sáng tạo hơn hoặc "cung cấp" cho AI bản sao ban đầu phù hợp hơn với nhu cầu của bạn và bạn có thể sử dụng ý tưởng và khuôn khổ đào tạo này để đào tạo phù hợp hơn cho bạn mô hình bài viết. **
Cuối cùng là link của mô hình đào tạo này như sau, các bạn quan tâm có thể thử:
Dựa trên ý tưởng tập luyện này, cư dân mạng cũng đã chế ra nhiều kịch bản thú vị, bạn có thể thử:
2** Mô hình robot đặt hàng (triển khai bằng mã)**
Làm cách nào để sử dụng ChatGPT để xây dựng robot đặt bữa ăn? Chúng ta có thể làm điều đó thông qua Kỹ thuật.
Ví dụ về robot đặt bữa ăn này xuất phát từ khóa học DeepLearning.ai. Người sáng lập DeepLearning.ai Wu Enda đã hợp tác với nhà phát triển OpenAI Iza Fulford để khởi động khóa học Kỹ thuật dành cho nhà phát triển. Wu Enda là một giáo sư ngôi sao trong lĩnh vực AI. Ông là giáo sư thỉnh giảng tại Khoa Khoa học Máy tính và Kỹ thuật Điện tại Đại học Stanford. Ông từng là giám đốc của Phòng thí nghiệm Trí tuệ Nhân tạo Stanford.
ChatGPT là một giao diện đối thoại trò chuyện, từ đó chúng ta có thể xây dựng rô bốt trò chuyện với các chức năng tùy chỉnh, chẳng hạn như nhân viên dịch vụ khách hàng AI cho nhà hàng hoặc người đặt hàng AI và các vai trò khác.
Nhưng vì đây là một kịch bản thương mại, chúng tôi cần phản hồi chính xác và ổn định từ ChatGPT, tại thời điểm này, sử dụng ngôn ngữ máy tính sẽ phù hợp hơn văn bản thuần túy, vì vậy chúng tôi cần triển khai gói OpenAI Python trước.
Đối với mô hình chatbot tùy chỉnh này, về cơ bản, chúng tôi đang đào tạo một bot nhận một loạt tin nhắn làm đầu vào và xuất các tin nhắn do mô hình tạo ra. Trong ví dụ này, GPT-3.5 được sử dụng và 3.5 có thể phù hợp hơn cho mục đích thương mại ở giai đoạn này vì GPT-4 quá đắt.
**Tình huống ứng dụng của robot đặt hàng này là một tiệm bánh pizza, các chức năng được thực hiện là: đầu tiên chào khách hàng, sau đó thu thập đơn đặt hàng và hỏi xem họ cần nhận hay giao hàng. **Trong trường hợp giao hàng, bot đặt hàng có thể hỏi địa chỉ. Cuối cùng, bot đặt hàng thu tiền thanh toán.
Trong cuộc trò chuyện thực tế, rô bốt đặt hàng sẽ tạo phản hồi theo thông tin nhập của người dùng và hướng dẫn của hệ thống:
Người dùng nói: "Xin chào, tôi muốn đặt một chiếc bánh pizza"
Bot đặt hàng sẽ trả lời: "Tuyệt, bạn muốn đặt loại pizza nào? Chúng tôi có pizza xúc xích Ý, phô mai và cà tím, giá của chúng là bao nhiêu"
Trong suốt cuộc trò chuyện, robot đặt hàng sẽ đưa ra phản hồi dựa trên đầu vào của người dùng và hướng dẫn của hệ thống, để cuộc trò chuyện trở nên tự nhiên và trôi chảy hơn, đồng thời tránh chèn thông tin gợi ý rõ ràng vào cuộc trò chuyện.
Đầu tiên, chúng tôi xác định một "hàm trợ giúp" thu thập tin nhắn của người dùng để giúp chúng tôi không phải nhập chúng theo cách thủ công. Hàm này sẽ thu thập các gợi ý từ giao diện người dùng và nối chúng vào một danh sách có tên là ngữ cảnh, sau đó được sử dụng để gọi mô hình mỗi lần, bao gồm thông tin hệ thống và menu.
Phản hồi ChatGPT và phản hồi của người dùng sẽ được thêm vào ngữ cảnh và ngữ cảnh này sẽ ngày càng dài hơn. Bằng cách đó, ChatGPT có tất cả thông tin cần thiết để quyết định việc cần làm tiếp theo. Dưới đây là những từ gợi ý được ngữ cảnh triển khai: "Bạn là một bot đặt hàng, một dịch vụ tự động thu thập các đơn đặt hàng từ một tiệm bánh pizza. Trước tiên, bạn chào khách hàng, sau đó nhận đơn đặt hàng và hỏi xem bạn muốn nhận hay giao hàng." (Xem hình bên dưới để biết chi tiết)
Nếu nó thực sự hoạt động, nó sẽ là: người dùng nói "Xin chào, tôi muốn đặt một chiếc bánh pizza". Sau đó, bot đặt hàng nói: "Được rồi, bạn muốn đặt loại pizza nào? Chúng tôi có pizza xúc xích cay, phô mai và cà tím, chúng có giá bao nhiêu"
Vì lời nhắc đã chứa giá nên nó sẽ được liệt kê trực tiếp tại đây. Người dùng có thể trả lời: Tôi thích một chiếc bánh pizza cà tím vừa. Vì vậy, người dùng và robot đặt hàng có thể tiếp tục cuộc trò chuyện này mãi mãi, bao gồm cả việc họ có muốn giao hàng hay không, họ có cần thêm nguyên liệu hay không và kiểm tra kỹ xem họ có cần những thứ khác không (chẳng hạn như nước? Hay khoai tây chiên?)...
Cuối cùng, chúng tôi yêu cầu bot đặt hàng tạo một bản tóm tắt dựa trên cuộc hội thoại để có thể gửi đến hệ thống đặt hàng:
Trong liên kết đầu ra cuối cùng, đầu ra bao gồm: danh mục sản phẩm (pizza, nguyên liệu, đồ uống, đồ ăn nhẹ...), loại, kích cỡ, giá cả, có yêu cầu giao hàng hay không và địa chỉ. Vì chúng tôi muốn kết quả hoàn toàn ổn định và có thể dự đoán được mà không cần bất kỳ sự sáng tạo nào, chúng tôi sẽ đặt nhiệt độ thành 0. Cuối cùng, những kết quả như vậy có thể được gửi trực tiếp đến hệ thống đặt hàng.
Vì bài viết này không có đầy đủ các mã, tôi tin rằng bạn không muốn nhìn thấy các mã dày đặc trên điện thoại di động của mình, vì vậy chúng tôi chỉ đưa ra những điểm chính ở đây. Nếu muốn tìm hiểu thêm, bạn có thể xem video hướng dẫn chi tiết này:
3 Một số nguyên tắc và kỹ thuật chính
Cuối cùng, hãy tóm tắt hai nguyên tắc chính và những hạn chế hiện tại của các mô hình ngôn ngữ lớn. Bạn cần biết giới hạn dưới hiện tại của các khả năng của mô hình ngôn ngữ lớn là ở đâu, điều này hữu ích hơn cho việc tìm kiếm các tình huống ứng dụng cụ thể.
**Hai nguyên tắc là: viết hướng dẫn rõ ràng và cụ thể, đồng thời cho người mẫu đủ thời gian để suy nghĩ. **
Nguyên tắc này nhấn mạnh rằng khi sử dụng các mô hình ngôn ngữ như ChatGPT, cần phải đưa ra các hướng dẫn rõ ràng và cụ thể, rõ ràng không có nghĩa là ngắn gọn, các từ gợi ý quá ngắn thường khiến mô hình rơi vào tình trạng phỏng đoán. Có 4 chiến lược cụ thể theo nguyên tắc này:
**1) Sử dụng dấu phân cách để phân định rõ ràng các phần khác nhau của đầu vào. **
Dấu phân cách có thể là dấu gạch ngược, dấu ngoặc kép, v.v. Ý tưởng cốt lõi là xác định rõ ràng các phần khác nhau của đầu vào, giúp mô hình hiểu và xử lý đầu ra. Dấu phân cách là để cho mô hình biết rõ rằng đây là một phần độc lập, có thể tránh "tiêm gợi ý" một cách hiệu quả. Cái gọi là tiêm nhanh đề cập đến một số hướng dẫn xung đột có thể được tạo do nhầm lẫn khi một số người dùng thêm đầu vào mới, dẫn đến kết quả không chính xác.
**2) Yêu cầu đầu ra có cấu trúc: Để làm cho đầu ra của mô hình phân tích cú pháp dễ dàng hơn, có thể yêu cầu đầu ra có cấu trúc. **
Trong từ nhắc, bạn có thể chỉ định: Tạo ba tên sách hư cấu, cùng với tác giả và thể loại của chúng, được cung cấp ở định dạng sau: ID sách, Tiêu đề, Tác giả và Thể loại.
**3) Yêu cầu mô hình kiểm tra xem điều kiện có được đáp ứng hay không. **
Nếu nhiệm vụ có các giả định và các điều kiện này không nhất thiết phải được đáp ứng, thì mô hình có thể được yêu cầu kiểm tra các giả định này trước, cho biết nếu chúng không được đáp ứng và dừng nhiệm vụ phản hồi trực tiếp để tránh kết quả sai không mong muốn.
Giống như trong ví dụ sau: chúng ta sẽ sao chép một đoạn mô tả cách pha trà, sau đó sao chép lời nhắc cho biết nếu văn bản chứa một loạt chỉ dẫn, hãy viết lại các chỉ dẫn đó theo định dạng sau, tiếp theo là bước -by-step hướng dẫn. Nếu văn bản không chứa một loạt hướng dẫn, chỉ cần viết "Không có bước nào được cung cấp".
**4) Gợi ý hàng loạt nhỏ: cung cấp các ví dụ thành công về việc thực hiện các tác vụ trước khi yêu cầu mô hình hoàn thành tác vụ thực tế. **
Chiến lược này đơn giản nhưng quan trọng, đó là chúng ta có thể đưa một ví dụ chính xác vào từ gợi ý. Ví dụ: chúng tôi yêu cầu người mẫu trả lời với giọng điệu nhất quán, nhiệm vụ nhập liệu là "trả lời câu hỏi theo phong cách nhất quán", sau đó đưa ra ví dụ về cuộc trò chuyện giữa một đứa trẻ và ông nội, đứa trẻ nói: "Dạy cháu cái gì kiên nhẫn là”, ông nội Trả lời bằng phép loại suy.
Bây giờ chúng tôi yêu cầu người mẫu trả lời với giọng điệu nhất quán, khi câu hỏi tiếp theo là: "hãy dạy tôi khả năng phục hồi là gì". Vì mô hình đã có sẵn một vài ví dụ này nên nó sẽ trả lời nhiệm vụ tiếp theo với giọng điệu tương tự, nó sẽ trả lời: "Sự kiên cường giống như một cái cây có thể bị gió uốn cong nhưng không bao giờ bị gãy".
**Nguyên tắc 2: Cho người mẫu đủ thời gian để suy nghĩ. **
Nếu mô hình đưa ra một lỗi lập luận vì nó muốn rút ra một kết luận sai, thì nó nên cố gắng xây dựng lại các từ gợi ý.Ý tưởng cốt lõi là yêu cầu mô hình thực hiện một loạt các lập luận liên quan trước khi đưa ra câu trả lời cuối cùng. Có 2 chiến lược theo nguyên tắc này:
1) Chỉ định các bước để hoàn thành nhiệm vụ:
Nêu rõ các bước cần thiết để hoàn thành một nhiệm vụ có thể giúp mô hình hiểu rõ hơn về nhiệm vụ và tạo ra đầu ra chính xác hơn.
2) Hướng dẫn mô hình (trước khi vội vàng kết luận) đưa ra giải pháp của riêng mình:
Việc hướng dẫn rõ ràng cho mô hình tự suy luận về giải pháp trước khi đưa ra kết luận có thể giúp mô hình hoàn thành nhiệm vụ chính xác hơn.
**Thảo luận bổ sung: Làm thế nào để xem các hạn chế của mô hình? **
Hiện tại, vấn đề lớn nhất đối với việc thương mại hóa các mô hình ngôn ngữ lớn là "ảo ảnh". Bởi vì trong quá trình đào tạo của nó, mô hình lớn tiếp xúc với một lượng lớn kiến thức, nhưng nó không ghi nhớ hoàn toàn thông tin mà nó đã thấy và không rõ ranh giới kiến thức ở đâu. Điều này có nghĩa là mô hình lớn có thể cố gắng trả lời tất cả các câu hỏi, đôi khi bịa ra những điều nghe có vẻ hợp lý nhưng không phải vậy.
Một chiến lược để giảm ảo giác trước tiên là yêu cầu mô hình ngôn ngữ lớn tìm tất cả các phần có liên quan từ văn bản, sau đó yêu cầu nó sử dụng các trích dẫn đó để trả lời câu hỏi và truy tìm câu trả lời trở lại tài liệu nguồn. Chiến lược này có thể làm giảm sự xuất hiện của ảo giác.
Bài viết hôm nay mang tính thực tế hơn, chúng tôi giải thích một số ứng dụng chuyên sâu của Kỹ thuật (kỹ thuật nhanh) thông qua hai trường hợp (một văn bản thuần túy và một trường hợp thông qua lập trình).
Các mô hình ngôn ngữ lớn như GPT-3.5 và GPT-4 hiểu mọi thứ, nhưng chính vì nó quá rộng nên nếu bạn không gợi ý cho nó, câu trả lời bạn nhận được thường là bánh xe ô tô.
Tầm quan trọng của (nhắc nhở) tại thời điểm này là hiển nhiên, và nó không chỉ là một từ, hoặc một câu đơn giản, nếu bạn muốn đạt được các chức năng phức tạp hơn, bạn cũng cần các từ gợi ý phức tạp hơn.
Nó cũng đòi hỏi mọi người phải động não để nghĩ ra những lối chơi mới lạ hơn, phù hợp hơn và tính “độc quyền” của nó cũng rất mạnh. Ví dụ, "Nhà hát Opera Không gian" từng đoạt giải thưởng trước đó, tác giả tuyên bố rằng ông đã dành hơn 80 giờ và hơn 900 lần lặp lại để tạo ra tác phẩm này và đã từ chối chia sẻ những lời nhắc mà Midjourney đã sử dụng cho đến nay.
** Tất nhiên, bản thân nó có thể chỉ là nhu cầu theo từng giai đoạn Sam Altman từng nói: Sau 5 năm nữa, có thể không cần cất nhắc vị trí kỹ sư nữa, vì AI sẽ có khả năng tự học. Nhưng không thể phủ nhận rằng "nhu cầu theo từng giai đoạn" này là một vũ khí quan trọng để thực sự giúp AI thâm nhập vào mọi khía cạnh của doanh nghiệp. **
Bây giờ chúng ta không cần phải bắt đầu lại từ đầu, có rất nhiều cộng đồng tốt trong và ngoài nước, mọi người đang trao đổi kinh nghiệm về việc sử dụng các từ gợi ý và thậm chí liệt kê các từ gợi ý phổ biến hiện nay, chúng tôi sẽ liệt kê trong phần phụ lục tại cuối bài viết.
** Từ góc độ khởi nghiệp/đầu tư, mọi người hiện đang thảo luận về cơ hội trong lớp ứng dụng ở đâu, tôi thường vào các trang web từ gợi ý phổ biến này để xem, và có thể tôi có thể tìm thấy một số đổi mới trong các tình huống ứng dụng từ những trang web phổ biến mới được phát hành cảm hứng từ nhanh chóng. Cho dù bạn đã xem bao nhiêu, tốt hơn là nên thử. **
Phụ lục: Một số trang web thảo luận từ nhanh
Cộng đồng AI:
(Một trang web từ gợi ý phổ biến ở nước ngoài, có thể được sắp xếp theo mức độ phổ biến và bao gồm đầy đủ các tình huống.)
2、 Viết s trên Reddit (r/Writings):
(Subreddit Bài viết trên Reddit là một cộng đồng rất tích cực, nơi người dùng đăng và trả lời các lời nhắc viết khác nhau.)
3. Liệt kê 100 từ nhắc hay nhất
(100 từ gợi ý ChatGPT hay nhất để thúc đẩy quy trình làm việc của bạn.)
4. Một trang web từ gợi ý của Trung Quốc:
(Nó có thể được sắp xếp theo mức độ phổ biến và các kịch bản được đề cập rất đầy đủ, từ viết lách, lập trình đến tài chính, chăm sóc y tế, v.v.)
5. Một trang web nhắc từ khác của Trung Quốc: Tip Wizard
(Xiaohongshu copywriting xếp hạng cao nhất và nó có màn hình trực quan hơn về các từ gợi ý.)
Xem bản gốc
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Làm thế nào để huấn luyện AI làm việc cho bạn? Bí Mật Của Lời Nhắc (_)
Nguồn: Đối tác ma trận
Cách đây một thời gian, Zhang Ying đã chia sẻ một số nhận định về xu hướng AI và 7 gợi ý cho tinh thần khởi nghiệp AI tại Hội nghị AI của Học viện Chaos, anh ấy đã đề cập đến trong gợi ý đầu tiên:
Hôm nay chúng ta sẽ nói một chút về "Kỹ thuật". Vào đầu năm, nhiều từ điển Midjourney đã trở nên phổ biến trên Internet, chẳng hạn như:
đèn neon lấp lánh
góc nhìn cao góc nhìn cao
bề mặt đánh bóng tương lai
Phong cách cổ điển, Vintage thế kỷ 18-19
Ukiyo-e ukiyoe truyền thống của Nhật Bản
……
Mãi cho đến gần đây, các đại thần lại giở trò QR code, sau khi viết lời nhắc về phong cách và các yếu tố, họ có thể cho ra một số "mã QR nghệ thuật AI" độc đáo:
Trong bài viết hôm nay, chúng ta bắt đầu với hai trường hợp, ** trường hợp đầu tiên là một ví dụ về văn bản thuần túy, và trường hợp thứ hai là một ví dụ yêu cầu mã để triển khai, ** để giới thiệu một số nguyên tắc và kỹ thuật quan trọng của Kỹ thuật:
Tất nhiên, không có sự khác biệt cơ bản giữa văn bản thuần túy của lời nhắc và mã viết, mục đích của việc sử dụng mã là tiết kiệm mã thông báo và làm cho đầu ra ổn định và chính xác hơn, bởi vì tiếng Trung vẫn sẽ chiếm nhiều mã thông báo hơn. để gọi API trên quy mô lớn Đôi khi, chi phí sẽ tăng mạnh. Lời nhắc văn bản thuần túy cũng có thể rất phức tạp.Ví dụ, tôi đã thấy hơn 600 dòng lời nhắc văn bản và chúng bao gồm nhiều nhóm mô-đun.
1Một mô hình viết quảng cáo phổ biến (văn bản thuần túy)
Hãy giới thiệu ngắn gọn "Kỹ thuật" (prompt engineering) là gì? Thông thường, điều đó có nghĩa là chuyển đổi các câu hỏi bạn muốn hỏi thành đầu vào ở định dạng cụ thể và sử dụng các mẫu, quy tắc và thuật toán được xác định trước để xử lý, để AI có thể hiểu rõ hơn về nhiệm vụ và đưa ra câu trả lời tương ứng. Cho phép AI hiểu chính xác các nhiệm vụ ở mức độ lớn nhất, giảm hiểu lầm và lỗi do cách diễn đạt ngôn ngữ không rõ ràng, đồng thời cho phép AI thực hiện các nhiệm vụ cụ thể một cách chính xác và đáng tin cậy.
Hãy chuyển sang ví dụ văn bản này. Trong nhiều tình huống yêu cầu viết quảng cáo, chẳng hạn như các trang thương mại điện tử, viết quảng cáo trồng Xiaohongshu, bài đăng trên diễn đàn, v.v., nếu bạn trực tiếp để AI viết, hiệu quả có thể không tốt, ** nhưng thông qua "năm bước" này, bạn có thể làm cho chất lượng đầu ra được cải thiện và kết quả ổn định hơn. **
Bước đầu tiên, "cung cấp" bài viết quảng cáo mà bạn cho là tốt cho AI và để AI học được bài viết quảng cáo này rõ ràng, chúng ta cần nói rõ với AI: "Tiếp theo, tôi sẽ gửi cho bạn một bài học viết bài quảng cáo , mục đích là Tạo mô hình viết bài quảng cáo cho các mô hình phổ biến, sau khi học xong bạn chỉ cần nhắn lại: Tôi đã học rồi. Bài viết quảng cáo như sau: "
**Bạn cũng có thể tiếp tục tinh chỉnh mô hình này, chẳng hạn như yêu cầu AI viết sáng tạo hơn hoặc "cung cấp" cho AI bản sao ban đầu phù hợp hơn với nhu cầu của bạn và bạn có thể sử dụng ý tưởng và khuôn khổ đào tạo này để đào tạo phù hợp hơn cho bạn mô hình bài viết. **
Cuối cùng là link của mô hình đào tạo này như sau, các bạn quan tâm có thể thử:
Dựa trên ý tưởng tập luyện này, cư dân mạng cũng đã chế ra nhiều kịch bản thú vị, bạn có thể thử:
2** Mô hình robot đặt hàng (triển khai bằng mã)**
Làm cách nào để sử dụng ChatGPT để xây dựng robot đặt bữa ăn? Chúng ta có thể làm điều đó thông qua Kỹ thuật.
Ví dụ về robot đặt bữa ăn này xuất phát từ khóa học DeepLearning.ai. Người sáng lập DeepLearning.ai Wu Enda đã hợp tác với nhà phát triển OpenAI Iza Fulford để khởi động khóa học Kỹ thuật dành cho nhà phát triển. Wu Enda là một giáo sư ngôi sao trong lĩnh vực AI. Ông là giáo sư thỉnh giảng tại Khoa Khoa học Máy tính và Kỹ thuật Điện tại Đại học Stanford. Ông từng là giám đốc của Phòng thí nghiệm Trí tuệ Nhân tạo Stanford.
Nhưng vì đây là một kịch bản thương mại, chúng tôi cần phản hồi chính xác và ổn định từ ChatGPT, tại thời điểm này, sử dụng ngôn ngữ máy tính sẽ phù hợp hơn văn bản thuần túy, vì vậy chúng tôi cần triển khai gói OpenAI Python trước.
**Tình huống ứng dụng của robot đặt hàng này là một tiệm bánh pizza, các chức năng được thực hiện là: đầu tiên chào khách hàng, sau đó thu thập đơn đặt hàng và hỏi xem họ cần nhận hay giao hàng. **Trong trường hợp giao hàng, bot đặt hàng có thể hỏi địa chỉ. Cuối cùng, bot đặt hàng thu tiền thanh toán.
Trong cuộc trò chuyện thực tế, rô bốt đặt hàng sẽ tạo phản hồi theo thông tin nhập của người dùng và hướng dẫn của hệ thống:
Người dùng nói: "Xin chào, tôi muốn đặt một chiếc bánh pizza"
Bot đặt hàng sẽ trả lời: "Tuyệt, bạn muốn đặt loại pizza nào? Chúng tôi có pizza xúc xích Ý, phô mai và cà tím, giá của chúng là bao nhiêu"
Trong suốt cuộc trò chuyện, robot đặt hàng sẽ đưa ra phản hồi dựa trên đầu vào của người dùng và hướng dẫn của hệ thống, để cuộc trò chuyện trở nên tự nhiên và trôi chảy hơn, đồng thời tránh chèn thông tin gợi ý rõ ràng vào cuộc trò chuyện.
Đầu tiên, chúng tôi xác định một "hàm trợ giúp" thu thập tin nhắn của người dùng để giúp chúng tôi không phải nhập chúng theo cách thủ công. Hàm này sẽ thu thập các gợi ý từ giao diện người dùng và nối chúng vào một danh sách có tên là ngữ cảnh, sau đó được sử dụng để gọi mô hình mỗi lần, bao gồm thông tin hệ thống và menu.
Vì lời nhắc đã chứa giá nên nó sẽ được liệt kê trực tiếp tại đây. Người dùng có thể trả lời: Tôi thích một chiếc bánh pizza cà tím vừa. Vì vậy, người dùng và robot đặt hàng có thể tiếp tục cuộc trò chuyện này mãi mãi, bao gồm cả việc họ có muốn giao hàng hay không, họ có cần thêm nguyên liệu hay không và kiểm tra kỹ xem họ có cần những thứ khác không (chẳng hạn như nước? Hay khoai tây chiên?)...
Cuối cùng, chúng tôi yêu cầu bot đặt hàng tạo một bản tóm tắt dựa trên cuộc hội thoại để có thể gửi đến hệ thống đặt hàng:
Vì bài viết này không có đầy đủ các mã, tôi tin rằng bạn không muốn nhìn thấy các mã dày đặc trên điện thoại di động của mình, vì vậy chúng tôi chỉ đưa ra những điểm chính ở đây. Nếu muốn tìm hiểu thêm, bạn có thể xem video hướng dẫn chi tiết này:
3 Một số nguyên tắc và kỹ thuật chính
Cuối cùng, hãy tóm tắt hai nguyên tắc chính và những hạn chế hiện tại của các mô hình ngôn ngữ lớn. Bạn cần biết giới hạn dưới hiện tại của các khả năng của mô hình ngôn ngữ lớn là ở đâu, điều này hữu ích hơn cho việc tìm kiếm các tình huống ứng dụng cụ thể.
**Hai nguyên tắc là: viết hướng dẫn rõ ràng và cụ thể, đồng thời cho người mẫu đủ thời gian để suy nghĩ. **
Nguyên tắc này nhấn mạnh rằng khi sử dụng các mô hình ngôn ngữ như ChatGPT, cần phải đưa ra các hướng dẫn rõ ràng và cụ thể, rõ ràng không có nghĩa là ngắn gọn, các từ gợi ý quá ngắn thường khiến mô hình rơi vào tình trạng phỏng đoán. Có 4 chiến lược cụ thể theo nguyên tắc này:
**1) Sử dụng dấu phân cách để phân định rõ ràng các phần khác nhau của đầu vào. **
Dấu phân cách có thể là dấu gạch ngược, dấu ngoặc kép, v.v. Ý tưởng cốt lõi là xác định rõ ràng các phần khác nhau của đầu vào, giúp mô hình hiểu và xử lý đầu ra. Dấu phân cách là để cho mô hình biết rõ rằng đây là một phần độc lập, có thể tránh "tiêm gợi ý" một cách hiệu quả. Cái gọi là tiêm nhanh đề cập đến một số hướng dẫn xung đột có thể được tạo do nhầm lẫn khi một số người dùng thêm đầu vào mới, dẫn đến kết quả không chính xác.
Trong từ nhắc, bạn có thể chỉ định: Tạo ba tên sách hư cấu, cùng với tác giả và thể loại của chúng, được cung cấp ở định dạng sau: ID sách, Tiêu đề, Tác giả và Thể loại.
Nếu nhiệm vụ có các giả định và các điều kiện này không nhất thiết phải được đáp ứng, thì mô hình có thể được yêu cầu kiểm tra các giả định này trước, cho biết nếu chúng không được đáp ứng và dừng nhiệm vụ phản hồi trực tiếp để tránh kết quả sai không mong muốn.
Giống như trong ví dụ sau: chúng ta sẽ sao chép một đoạn mô tả cách pha trà, sau đó sao chép lời nhắc cho biết nếu văn bản chứa một loạt chỉ dẫn, hãy viết lại các chỉ dẫn đó theo định dạng sau, tiếp theo là bước -by-step hướng dẫn. Nếu văn bản không chứa một loạt hướng dẫn, chỉ cần viết "Không có bước nào được cung cấp".
Chiến lược này đơn giản nhưng quan trọng, đó là chúng ta có thể đưa một ví dụ chính xác vào từ gợi ý. Ví dụ: chúng tôi yêu cầu người mẫu trả lời với giọng điệu nhất quán, nhiệm vụ nhập liệu là "trả lời câu hỏi theo phong cách nhất quán", sau đó đưa ra ví dụ về cuộc trò chuyện giữa một đứa trẻ và ông nội, đứa trẻ nói: "Dạy cháu cái gì kiên nhẫn là”, ông nội Trả lời bằng phép loại suy.
Bây giờ chúng tôi yêu cầu người mẫu trả lời với giọng điệu nhất quán, khi câu hỏi tiếp theo là: "hãy dạy tôi khả năng phục hồi là gì". Vì mô hình đã có sẵn một vài ví dụ này nên nó sẽ trả lời nhiệm vụ tiếp theo với giọng điệu tương tự, nó sẽ trả lời: "Sự kiên cường giống như một cái cây có thể bị gió uốn cong nhưng không bao giờ bị gãy".
**Nguyên tắc 2: Cho người mẫu đủ thời gian để suy nghĩ. **
Nếu mô hình đưa ra một lỗi lập luận vì nó muốn rút ra một kết luận sai, thì nó nên cố gắng xây dựng lại các từ gợi ý.Ý tưởng cốt lõi là yêu cầu mô hình thực hiện một loạt các lập luận liên quan trước khi đưa ra câu trả lời cuối cùng. Có 2 chiến lược theo nguyên tắc này:
Nêu rõ các bước cần thiết để hoàn thành một nhiệm vụ có thể giúp mô hình hiểu rõ hơn về nhiệm vụ và tạo ra đầu ra chính xác hơn.
2) Hướng dẫn mô hình (trước khi vội vàng kết luận) đưa ra giải pháp của riêng mình:
Việc hướng dẫn rõ ràng cho mô hình tự suy luận về giải pháp trước khi đưa ra kết luận có thể giúp mô hình hoàn thành nhiệm vụ chính xác hơn.
**Thảo luận bổ sung: Làm thế nào để xem các hạn chế của mô hình? **
Hiện tại, vấn đề lớn nhất đối với việc thương mại hóa các mô hình ngôn ngữ lớn là "ảo ảnh". Bởi vì trong quá trình đào tạo của nó, mô hình lớn tiếp xúc với một lượng lớn kiến thức, nhưng nó không ghi nhớ hoàn toàn thông tin mà nó đã thấy và không rõ ranh giới kiến thức ở đâu. Điều này có nghĩa là mô hình lớn có thể cố gắng trả lời tất cả các câu hỏi, đôi khi bịa ra những điều nghe có vẻ hợp lý nhưng không phải vậy.
Một chiến lược để giảm ảo giác trước tiên là yêu cầu mô hình ngôn ngữ lớn tìm tất cả các phần có liên quan từ văn bản, sau đó yêu cầu nó sử dụng các trích dẫn đó để trả lời câu hỏi và truy tìm câu trả lời trở lại tài liệu nguồn. Chiến lược này có thể làm giảm sự xuất hiện của ảo giác.
Các mô hình ngôn ngữ lớn như GPT-3.5 và GPT-4 hiểu mọi thứ, nhưng chính vì nó quá rộng nên nếu bạn không gợi ý cho nó, câu trả lời bạn nhận được thường là bánh xe ô tô.
Tầm quan trọng của (nhắc nhở) tại thời điểm này là hiển nhiên, và nó không chỉ là một từ, hoặc một câu đơn giản, nếu bạn muốn đạt được các chức năng phức tạp hơn, bạn cũng cần các từ gợi ý phức tạp hơn.
Nó cũng đòi hỏi mọi người phải động não để nghĩ ra những lối chơi mới lạ hơn, phù hợp hơn và tính “độc quyền” của nó cũng rất mạnh. Ví dụ, "Nhà hát Opera Không gian" từng đoạt giải thưởng trước đó, tác giả tuyên bố rằng ông đã dành hơn 80 giờ và hơn 900 lần lặp lại để tạo ra tác phẩm này và đã từ chối chia sẻ những lời nhắc mà Midjourney đã sử dụng cho đến nay.
Bây giờ chúng ta không cần phải bắt đầu lại từ đầu, có rất nhiều cộng đồng tốt trong và ngoài nước, mọi người đang trao đổi kinh nghiệm về việc sử dụng các từ gợi ý và thậm chí liệt kê các từ gợi ý phổ biến hiện nay, chúng tôi sẽ liệt kê trong phần phụ lục tại cuối bài viết.
** Từ góc độ khởi nghiệp/đầu tư, mọi người hiện đang thảo luận về cơ hội trong lớp ứng dụng ở đâu, tôi thường vào các trang web từ gợi ý phổ biến này để xem, và có thể tôi có thể tìm thấy một số đổi mới trong các tình huống ứng dụng từ những trang web phổ biến mới được phát hành cảm hứng từ nhanh chóng. Cho dù bạn đã xem bao nhiêu, tốt hơn là nên thử. **
Phụ lục: Một số trang web thảo luận từ nhanh
(Một trang web từ gợi ý phổ biến ở nước ngoài, có thể được sắp xếp theo mức độ phổ biến và bao gồm đầy đủ các tình huống.)
(Subreddit Bài viết trên Reddit là một cộng đồng rất tích cực, nơi người dùng đăng và trả lời các lời nhắc viết khác nhau.)
(100 từ gợi ý ChatGPT hay nhất để thúc đẩy quy trình làm việc của bạn.)
(Nó có thể được sắp xếp theo mức độ phổ biến và các kịch bản được đề cập rất đầy đủ, từ viết lách, lập trình đến tài chính, chăm sóc y tế, v.v.)
(Xiaohongshu copywriting xếp hạng cao nhất và nó có màn hình trực quan hơn về các từ gợi ý.)