Bagaimana cara melatih AI agar bekerja untuk Anda? Rahasia Kata Teguran (_)

Sumber: Mitra Matrix

Sumber gambar: Dihasilkan oleh alat AI Tak Terbatas

Beberapa waktu lalu, Zhang Ying membagikan beberapa penilaian tentang tren AI dan 7 saran untuk kewirausahaan AI di Konferensi AI Akademi Kekacauan. Dia menyebutkan dalam saran pertama:

  • "Setiap orang harus memperhatikan pembelajaran dan penerapan AI. Iterasi yang efektif lebih penting dari apa pun. Poin kuncinya adalah mempelajari cara menulis kata-kata yang cepat. Mengetahui cara mengajukan pertanyaan sangat penting. Cara berinteraksi yang lebih baik dengan AI juga ilmu." *

Hari ini kita akan berbicara sedikit tentang "Teknik". Di awal tahun, berbagai kamus Midjourney menjadi populer di Internet, seperti:

lampu neon berkilauan

tampilan sudut tinggi tampilan sudut tinggi

permukaan yang dipoles futuristik

Gaya klasik, Vintage abad 18-19

Ukiyo-e ukiyoe tradisional Jepang

……

Hingga baru-baru ini, para dewa agung telah memainkan trik pada kode QR lagi. Setelah menulis kata-kata gaya dan elemen yang cepat, mereka dapat menghasilkan beberapa "kode QR seni AI" yang unik:

** Kami tahu bahwa apakah Anda dapat menggunakan model bahasa yang besar sangat bergantung pada kualitas kata-kata cepat Anda, tetapi jangan menganggap kata-kata cepat itu sederhana, itu bukan hanya beberapa kata atau kalimat lagi saat mengajukan pertanyaan Kata-katanya adalah sederhana sekali, alasan kenapa disebut Engineering (prompt engineering) karena banyak praktek engineering yang rumit. **

Dalam artikel hari ini, kita mulai dengan dua kasus, yang pertama adalah contoh teks biasa, dan yang kedua adalah contoh yang membutuhkan kode untuk diimplementasikan, untuk memperkenalkan beberapa prinsip dan teknik Teknik yang penting:

  • **Kasus pertama adalah "model copywriting gaya panas" yang sangat populer di beberapa komunitas AI. Ini terutama menggunakan teks biasa untuk menulis template dan petunjuk aturan untuk AI. **
  • **Kasus kedua adalah contoh "robot pemesanan makanan" dalam kursus teknik prompt ChatGPT yang secara resmi bekerja sama dengan Ng Enda dan OpenAI. **
  • **Akhirnya, mari kita rangkum beberapa prinsip dan teknik dasar. **

Tentu saja, tidak ada perbedaan mendasar antara teks biasa dari kata prompt dan kode penulisan. Tujuan penggunaan kode adalah untuk menyimpan token dan membuat keluaran lebih stabil dan akurat, karena bahasa Mandarin masih akan menggunakan lebih banyak token. Saat Anda membutuhkannya untuk memanggil API dalam skala besar Terkadang, biayanya akan meningkat tajam. Permintaan teks biasa juga bisa sangat kompleks, misalnya, saya telah melihat lebih dari 600 baris permintaan teks, dan terdiri dari beberapa grup modul.

1Model copywriting populer (teks biasa)

Mari kita perkenalkan secara singkat apa itu "Engineering" (teknik cepat)? Biasanya, ini berarti mengubah pertanyaan yang ingin Anda ajukan menjadi input dalam format tertentu, dan menggunakan templat, aturan, dan algoritme yang telah ditentukan sebelumnya untuk diproses, sehingga AI dapat lebih memahami tugas dan memberikan jawaban yang sesuai. Izinkan AI untuk secara akurat memahami tugas secara maksimal, mengurangi kesalahpahaman dan kesalahan yang disebabkan oleh ekspresi bahasa yang tidak jelas, dan memungkinkannya melakukan tugas tertentu secara akurat dan andal.

Mari beralih ke contoh teks ini. Dalam banyak skenario yang membutuhkan copywriting, seperti halaman e-commerce, copywriting penanaman Xiaohongshu, posting forum, dll., jika Anda langsung membiarkan AI menulis, efeknya mungkin tidak bagus,**tetapi melalui "lima langkah" ini, Anda bisa membuat Peningkatan kualitas output dan hasil yang lebih stabil. **

Langkah pertama, "beri makan" copywriting yang menurut Anda bagus untuk AI, dan agar AI dapat mempelajari copywriting ini dengan jelas, kami perlu mengatakan dengan jelas kepada AI: "Selanjutnya, saya akan mengirimkan studi copywriting kepada Anda , tujuannya adalah Buat model copywriting untuk model populer. Setelah selesai belajar, Anda hanya perlu menjawab: Saya sudah belajar. Copywritingnya adalah sebagai berikut: "

**Langkah kedua, setelah AI menjawab "Sudah belajar", kami akan mulai membiarkan AI mencontoh gaya penulisan copywriting ini.

Langkah ketiga, Secara umum, AI tidak meringkas dengan baik saat ini. Kita perlu membiarkan AI belajar lebih jauh dan mengubah jawabannya sendiri. Saat ini, kita dapat memberikan kerangka kerja kepada AI. Tentunya langkah ini juga bisa langsung diintegrasikan dengan langkah sebelumnya.

Langkah keempat, kami membiarkan AI menetapkan bobot ke setiap bagian.

Langkah 5, Kami menamai template ini agar AI dapat memanggilnya dengan cepat.

Berikut beberapa contoh aplikasinya:

Untuk banyak bidang copywriting yang relatif terformat dan tidak memerlukan kreativitas tinggi, konten AI telah mencapai di atas garis dasar, dan selebihnya dapat dimodifikasi secara manual.

**Anda juga dapat terus menyempurnakan model ini, seperti meminta AI untuk menulis lebih kreatif, atau "memberi makan" AI dengan salinan awal yang lebih sesuai dengan kebutuhan Anda, dan Anda dapat menggunakan ide pelatihan dan kerangka kerja ini untuk melatih lebih sesuai untuk model artikel Anda. **

Terakhir, link model pelatihan ini adalah sebagai berikut, teman-teman yang berminat bisa mencoba:

Berdasarkan ide pelatihan ini, netizen juga mengembangkan banyak skenario menarik, Anda dapat mencoba:

2** Model robot pemesanan (diimplementasikan dengan kode)**

Bagaimana cara menggunakan ChatGPT untuk membuat robot pemesanan makanan? Kita bisa melakukannya melalui Teknik.

Contoh robot pemesanan makanan ini berasal dari kursus DeepLearning.ai. Pendiri DeepLearning.ai, Wu Enda, bekerja sama dengan pengembang OpenAI Iza Fulford untuk meluncurkan kursus Teknik bagi pengembang. Wu Enda adalah profesor bintang di bidang AI. Dia adalah profesor tamu di Departemen Ilmu Komputer dan Teknik Elektro di Universitas Stanford. Dia pernah menjadi direktur Laboratorium Kecerdasan Buatan Stanford.

ChatGPT adalah antarmuka dialog obrolan, dari mana kita dapat membuat robot obrolan dengan fungsi khusus, seperti agen layanan pelanggan AI untuk restoran, atau pemesan AI dan peran lainnya.

Tetapi karena ini adalah skenario komersial, kami memerlukan respons yang akurat dan stabil dari ChatGPT. Saat ini, lebih tepat menggunakan bahasa komputer daripada teks biasa, jadi kami perlu menerapkan paket OpenAI Python terlebih dahulu.

Untuk model chatbot khusus ini, pada dasarnya kami melatih bot yang menerima serangkaian pesan sebagai masukan dan mengeluarkan pesan yang dihasilkan oleh model tersebut. Dalam contoh ini, GPT-3.5 digunakan, dan 3.5 mungkin lebih cocok untuk penggunaan komersial pada tahap ini, karena GPT-4 terlalu mahal.

**Skenario aplikasi robot pemesanan ini adalah restoran pizza. Fungsi yang direalisasikan adalah: pertama-tama menyapa pelanggan, lalu mengumpulkan pesanan, dan menanyakan apakah mereka perlu mengambil atau mengirim. **Dalam hal pengiriman, bot pemesan bisa menanyakan alamat. Terakhir, bot pemesanan mengumpulkan pembayaran.

Dalam percakapan sebenarnya, robot pemesan akan menghasilkan tanggapan sesuai dengan input pengguna dan instruksi sistem:

Pengguna berkata: "Hai, saya ingin memesan pizza"

Bot pemesanan akan menjawab: "Bagus, pizza apa yang ingin Anda pesan? Kami memiliki pizza pepperoni, keju, dan terong, berapa harganya"

Sepanjang percakapan, robot pemesanan akan menghasilkan respons berdasarkan input pengguna dan instruksi sistem, sehingga membuat percakapan lebih alami dan lancar, dan pada saat yang sama menghindari memasukkan informasi cepat yang jelas ke dalam percakapan.

Pertama, kami mendefinisikan "fungsi pembantu" yang mengumpulkan pesan pengguna agar kami tidak perlu mengetiknya secara manual. Fungsi ini akan mengumpulkan petunjuk dari UI dan menambahkannya ke daftar yang disebut konteks, yang kemudian digunakan untuk memanggil model setiap saat, termasuk informasi sistem dan menu.

Umpan balik ChatGPT dan umpan balik pengguna akan ditambahkan ke konteks, dan konteks ini akan menjadi semakin lama. Dengan begitu, ChatGPT memiliki semua informasi yang diperlukan untuk memutuskan tindakan selanjutnya. Berikut adalah kata-kata cepat yang digunakan berdasarkan konteksnya: "Anda adalah bot pemesanan, layanan otomatis yang mengumpulkan pesanan dari restoran pizza. Pertama-tama Anda menyapa pelanggan, lalu mengumpulkan pesanan, dan menanyakan apakah Anda ingin mengambil atau mengirim." (Lihat gambar di bawah untuk detailnya)

Jika benar-benar berhasil, itu akan menjadi: pengguna berkata "Hai, saya ingin memesan pizza". Kemudian bot pemesanan berkata: "Oke, pizza apa yang ingin Anda pesan? Kami punya pizza pepperoni, keju, dan terong, berapa harganya"

Karena kata prompt sudah berisi harga, maka akan langsung tercantum di sini. Pengguna mungkin menjawab: Saya suka pizza terong ukuran sedang. Jadi pengguna dan robot pemesan dapat melanjutkan percakapan ini selamanya, termasuk apakah mereka ingin mengirim, apakah mereka memerlukan bahan tambahan, dan memeriksa ulang apakah mereka memerlukan hal lain (seperti air? Atau keripik?)...

Terakhir, kami meminta bot pemesanan untuk membuat ringkasan berbasis percakapan yang dapat dikirim ke sistem pemesanan:

Di tautan keluaran terakhir, keluarannya meliputi: kategori produk (pizza, bahan, minuman, makanan ringan...), jenis, ukuran, harga, apakah diperlukan pengiriman dan alamat. Karena kami ingin hasilnya benar-benar stabil dan dapat diprediksi tanpa kreativitas apa pun, kami akan menyetel suhu ke 0. Pada akhirnya, hasil tersebut dapat langsung diserahkan ke sistem pemesanan.

Karena artikel ini tidak penuh dengan kode, saya yakin Anda tidak ingin melihat kode padat di ponsel Anda, jadi kami hanya menempatkan poin utama di sini. Jika Anda ingin mempelajari lebih lanjut, Anda dapat menonton video instruksional terperinci ini:

3 Beberapa prinsip dan teknik utama

Akhirnya, mari kita rangkum dua prinsip utama dan batasan model bahasa besar saat ini.Anda perlu mengetahui di mana batas bawah kemampuan model bahasa besar saat ini, yang lebih membantu untuk menemukan skenario aplikasi tertentu.

**Kedua prinsip tersebut adalah: tulis instruksi yang jelas dan spesifik, dan berikan waktu yang cukup bagi model untuk berpikir. **

**Prinsip 1: Tulis instruksi yang jelas dan spesifik. **

Prinsip ini menekankan bahwa ketika menggunakan model bahasa seperti ChatGPT, instruksi yang jelas dan spesifik perlu diberikan Kejelasan tidak berarti singkat Kata-kata cepat yang terlalu pendek sering membuat model jatuh ke dalam tebakan. Ada 4 strategi khusus di bawah prinsip ini:

**1) Gunakan pembatas untuk membatasi dengan jelas berbagai bagian masukan. **

Pembatas dapat berupa backticks, tanda kutip, dll. Ide intinya adalah mengidentifikasi dengan jelas berbagai bagian input, yang membantu model memahami dan memproses output. Pembatasnya adalah untuk memberi tahu model dengan jelas bahwa ini adalah bagian independen, yang secara efektif dapat menghindari "injeksi petunjuk". Injeksi cepat yang disebut mengacu pada beberapa instruksi yang bertentangan yang mungkin dibuat secara tidak sengaja ketika beberapa pengguna menambahkan masukan baru, sehingga menghasilkan hasil yang salah.

**2) Minta keluaran terstruktur: Untuk membuat keluaran model parsing lebih mudah, keluaran terstruktur dapat diminta. **

Di kata perintah, Anda dapat menentukan: Menghasilkan tiga judul buku fiksi, beserta penulis dan genrenya, dengan format berikut: ID Buku, Judul, Pengarang, dan Genre.

**3) Minta model untuk memeriksa apakah kondisi terpenuhi. **

Jika tugas memiliki asumsi dan kondisi ini belum tentu terpenuhi, model dapat diminta untuk memeriksa asumsi ini terlebih dahulu, menunjukkan jika asumsi tersebut tidak terpenuhi, dan menghentikan tugas dari umpan balik langsung untuk menghindari hasil yang salah yang tidak diharapkan.

Seperti dalam contoh berikut: kita akan menyalin paragraf yang menjelaskan cara membuat teh, lalu menyalin petunjuknya, yang mengatakan jika teks berisi serangkaian petunjuk, tulis ulang petunjuk tersebut dalam format berikut, diikuti dengan langkahnya -Instruksi langkah demi langkah. Jika teks tidak berisi rangkaian petunjuk, cukup tulis "Tidak ada langkah yang disediakan".

**4) Petunjuk batch mini: berikan contoh sukses dalam melakukan tugas sebelum meminta model untuk menyelesaikan tugas yang sebenarnya. **

Strategi ini sederhana namun penting, yaitu kita dapat menyertakan contoh yang benar dalam prompt word. Misalnya kita minta model untuk menjawab dengan nada yang konsisten, tugas inputnya adalah “menjawab pertanyaan dengan gaya yang konsisten”, lalu memberikan contoh percakapan antara anak dan kakek, anak berkata: “Ajari aku apa sabar itu", jawab sang kakek dengan analogi.

Sekarang kami meminta model untuk menjawab dengan nada yang konsisten, ketika pertanyaan berikutnya adalah: "ajari saya apa itu ketahanan". Karena model sudah memiliki beberapa contoh ini, ia akan menjawab tugas berikutnya dengan nada yang sama, ia akan menjawab: "Ketahanan seperti pohon yang dapat ditekuk oleh angin tetapi tidak pernah patah".

**Prinsip 2: Berikan waktu yang cukup bagi model untuk berpikir. **

Jika model membuat kesalahan penalaran karena ingin menarik kesimpulan yang salah, model harus mencoba merekonstruksi kata-kata cepat.Ide intinya adalah mengharuskan model untuk melakukan serangkaian penalaran terkait sebelum memberikan jawaban akhir. Ada 2 strategi di bawah prinsip ini:

1) Tentukan langkah-langkah untuk menyelesaikan tugas:

Menyatakan secara eksplisit langkah-langkah yang diperlukan untuk menyelesaikan tugas dapat membantu model memahami tugas dengan lebih baik dan menghasilkan keluaran yang lebih akurat.

2) Instruksikan model (sebelum terburu-buru mengambil kesimpulan) untuk merumuskan solusinya sendiri:

Secara eksplisit menginstruksikan model untuk bernalar tentang solusinya sendiri sebelum mencapai kesimpulan dapat membantu model menyelesaikan tugas dengan lebih akurat.

**Diskusi Tambahan: Bagaimana cara melihat keterbatasan model? **

Saat ini, masalah terbesar komersialisasi model bahasa besar adalah "ilusi". Karena selama proses pelatihannya, model besar terpapar sejumlah besar pengetahuan, tetapi tidak mengingat dengan sempurna informasi yang telah dilihatnya, dan tidak jelas di mana batas pengetahuannya. Ini berarti bahwa model besar mungkin mencoba menjawab semua pertanyaan, kadang mengarang hal-hal yang terdengar masuk akal tetapi sebenarnya tidak.

Strategi untuk mengurangi halusinasi adalah pertama-tama meminta model bahasa besar untuk menemukan semua bagian yang relevan dari teks, kemudian memintanya untuk menggunakan kutipan tersebut untuk menjawab pertanyaan, dan melacak jawabannya kembali ke dokumen sumber. halusinasi.

Artikel hari ini lebih praktis, kami menjelaskan beberapa aplikasi Teknik yang mendalam (prompt engineering) melalui dua kasus (satu teks biasa dan satu melalui pemrograman).

Model bahasa besar seperti GPT-3.5 dan GPT-4 mengerti segalanya, tetapi justru karena terlalu luas sehingga jika Anda tidak memberikan petunjuk, jawaban yang Anda dapatkan seringkali adalah roda mobil.

Pentingnya (prompt) saat ini sudah terbukti dengan sendirinya, dan bukan hanya sebuah kata, atau kalimat sederhana, jika Anda ingin mencapai fungsi yang lebih kompleks, Anda juga membutuhkan kata-kata prompt yang lebih kompleks.

Itu juga mengharuskan setiap orang untuk bertukar pikiran dan menghasilkan gameplay yang lebih baru atau lebih cocok.“Eksklusivitasnya” juga sangat kuat. Misalnya, "Space Opera House" pemenang penghargaan sebelumnya, penulis mengklaim bahwa dia menghabiskan lebih dari 80 jam dan lebih dari 900 iterasi untuk menghasilkan karya ini, dan menolak untuk membagikan apa yang diminta oleh Midjourney sejauh ini.

** Tentu saja, itu sendiri mungkin hanya permintaan bertahap.Sam Altman pernah berkata: Setelah lima tahun, mungkin tidak perlu lagi meminta posisi insinyur, karena AI akan memiliki kemampuan untuk belajar dengan sendirinya. Namun tidak dapat disangkal bahwa "permintaan bertahap" ini merupakan senjata penting untuk benar-benar membantu AI memotong semua aspek bisnis. **

Kita tidak perlu memulai dari awal sekarang, ada banyak komunitas bagus di dalam dan luar negeri, semua orang bertukar pengalaman tentang penggunaan kata-kata cepat, dan bahkan mencantumkan kata-kata cepat populer saat ini, yang akan kami cantumkan dalam lampiran di bagian akhir artikel.

** Dari perspektif kewirausahaan/investasi, semua orang sekarang mendiskusikan di mana peluang di lapisan aplikasi. Saya sering mengunjungi situs web kata cepat populer ini untuk melihat, dan mungkin saya dapat menemukan beberapa inovasi dalam skenario aplikasi dari yang baru dirilis populer inspirasi kata-kata cepat. Tidak peduli berapa banyak yang telah Anda lihat, lebih baik mencobanya. **

Tambahan: Beberapa Situs Diskusi Kata Cepat

  1. Komunitas AI:

(Situs web kata cepat populer di luar negeri, yang dapat diurutkan berdasarkan popularitas dan mencakup berbagai skenario.)

2、 Menulis di Reddit (r/Tulisan):

(Subreddit Tulisan di Reddit adalah komunitas yang sangat aktif tempat pengguna memposting dan menanggapi berbagai petunjuk penulisan.)

3. Tercantum 100 kata prompt terbaik

(100 Kata Permintaan ChatGPT Terbaik untuk Mendukung Alur Kerja Anda.)

4. Situs web kata prompt Cina:

(Bisa diurutkan berdasarkan popularitas, dan skenario yang dibahas sangat lengkap, mulai dari penulisan, pemrograman hingga keuangan, perawatan medis, dll.)

5. Situs web kata prompt Cina lainnya: Tip Wizard

(Copywriting Xiaohongshu menempati peringkat tertinggi, dan memiliki tampilan kata-kata cepat yang lebih intuitif.)

Lihat Asli
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)