AI'nın sizin için çalışması için nasıl eğitilir? Hızlı Sözün Sırrı (_)

Kaynak: Matrix Partners

Resim kaynağı: Unbounded AI aracı tarafından oluşturulmuştur

Bir süre önce Zhang Ying, Chaos Academy'nin AI Konferansında AI eğilimleri hakkında bazı yargılar ve AI girişimciliği için 7 öneri paylaştı.İlk öneride şunlardan bahsetti:

  • "Yapay zekanın öğrenilmesine ve uygulanmasına herkes dikkat etmelidir. Etkili yineleme her şeyden daha önemlidir. Kilit nokta, hızlı sözcükler yazmayı öğrenmektir. Nasıl soru sorulacağını bilmek çok önemlidir. Yapay zeka ile nasıl daha iyi etkileşime geçilir? aynı zamanda bir ilimdir." *

Bugün biraz "Mühendislik" hakkında konuşacağız. Yılın başında, çeşitli Midjourney sözlükleri internette popüler hale geldi, örneğin:

ışıltılı neon ışıkları

yüksek açılı görünüş yüksek açılı görünüş

fütüristik cilalı yüzeyler

Klasik tarz, 18.-19. yüzyıl Vintage

Ukiyo-e geleneksel Japon ukiyoe

……

Yakın zamana kadar, büyük tanrılar yine QR koduyla oyunlar oynadılar. Stil ve öğelerin hızlı sözlerini yazdıktan sonra, bazı benzersiz "AI art QR kodları" üretebilirler:

**Geniş bir dil modeli kullanıp kullanamayacağınızın büyük ölçüde yönlendirme sözcüklerinizin kalitesine bağlı olduğunu biliyoruz, ancak yönlendirme sözcüklerini basit olarak düşünmeyin, soru sorarken bu yalnızca birkaç sözcük veya cümle daha değildir. bu kadar basit, Mühendislik (hızlı mühendislik) olarak adlandırılmasının nedeni, birçok karmaşık mühendislik uygulamasının olmasıdır. **

Bugünün makalesinde, Mühendisliğin bazı önemli ilke ve tekniklerini tanıtmak için iki durumla başlıyoruz, ilki düz metin örneği, ikincisi uygulanması için kod gerektiren bir örnek:

  • **İlk durum, bazı yapay zeka topluluklarında çok popüler olan "sıcak stil metin yazarlığı modeli"dir. Yapay zeka için şablonlar ve kural istemleri yazmak için çoğunlukla düz metin kullanır. **
  • **İkinci örnek, Ng Enda ve OpenAI'nin resmi olarak işbirliği yaptığı ChatGPT bilgi istemi mühendislik kursundaki "yemek siparişi veren robot" örneğidir. **
  • **Son olarak, bazı temel ilke ve teknikleri özetleyelim. **

Elbette, bilgi istemi kelimesinin düz metni ile kod yazmak arasında temel bir fark yoktur.Kod kullanmanın amacı, belirteçleri kurtarmak ve çıktıyı daha kararlı ve doğru hale getirmektir, çünkü Çince yine de daha fazla belirteç alacaktır. API'leri büyük ölçekte çağırmak Bazen, maliyet keskin bir şekilde artacaktır. Düz metin istemleri de çok karmaşık olabilir.Örneğin, 600 satırdan fazla metin istemi gördüm ve bunlar birden fazla modül grubundan oluşuyor.

1Popüler bir metin yazarlığı modeli (düz metin)

"Mühendislik" (hızlı mühendislik) nedir kısaca tanıtalım mı? Genellikle, sormak istediğiniz soruları belirli bir formatta girdiye dönüştürmek ve işleme için önceden tanımlanmış şablonları, kuralları ve algoritmaları kullanmak anlamına gelir, böylece yapay zeka görevi daha iyi anlayabilir ve karşılık gelen yanıtları verebilir. Yapay zekanın görevleri büyük ölçüde doğru bir şekilde anlamasına, yanlış anlamaları ve net olmayan dil ifadelerinin neden olduğu hataları azaltmasına ve belirli görevleri doğru ve güvenilir bir şekilde gerçekleştirmesine izin verin.

Bu metin örneğine geçelim. E-ticaret sayfaları, Xiaohongshu ekim metin yazarlığı, forum gönderileri vb. gibi metin yazarlığı gerektiren birçok senaryoda, doğrudan AI'nın yazmasına izin verirseniz, etki iyi olmayabilir ** ancak bu "beş adım" aracılığıyla şunları yapabilirsiniz: Geliştirilmiş çıktı kalitesi ve daha kararlı sonuçlar elde edin. **

İlk adım, AI için iyi olduğunu düşündüğünüz metin yazarlığını "besleyin" ve AI'nın bu metin yazarlığını öğrenmesini netleştirmek için AI'ya açıkça şunu söylemeliyiz: "Sonra, size bir metin yazarlığı çalışması göndereceğim , amaç Popüler modeller için bir metin yazarlığı modeli oluşturmaktır. Öğrenmeyi bitirdikten sonra, yalnızca şunu yanıtlamanız gerekir: Öğrendim. Metin yazarlığı aşağıdaki gibidir: "

**İkinci adım, AI'nın "Öğrendim" yanıtından sonra, AI'nın bu metin yazarlığının yazım stilini modellemesine izin vermeye başlayacağız.

Üçüncü adım, Genel olarak konuşursak, yapay zeka şu anda iyi özetlemiyor. Yapay zekanın daha fazla öğrenmesine ve kendi yanıtlarını değiştirmesine izin vermeliyiz. Şu anda yapay zekaya bir çerçeve verebiliriz. Tabii ki, bu adım doğrudan bir önceki adıma da entegre edilebilir.

Dördüncü adımda, yapay zekanın her parçaya ağırlık atamasına izin veriyoruz.

Adım 5, AI'nın hızlı bir şekilde çağırabilmesi için bu şablonu adlandırıyoruz.

İşte birkaç uygulama örneği:

Nispeten biçimlendirilmiş ve yüksek yaratıcılık gerektirmeyen birçok metin yazarlığı alanı için, yapay zekanın içeriği taban çizgisinin üzerine çıkmıştır ve geri kalanı manuel olarak değiştirilebilir.

**Ayrıca yapay zekadan daha yaratıcı yazmasını istemek veya yapay zekayı ihtiyaçlarınıza daha uygun bir ilk kopyayla "beslemek" gibi bu modelde ince ayar yapmaya devam edebilir ve bu eğitim fikrini ve çerçevesini daha uygun eğitim vermek için kullanabilirsiniz. sizin için makale modeli. **

Son olarak bu eğitim modelinin linki şu şekilde, ilgilenen arkadaşlar deneyebilir:

Bu eğitim fikrine dayanarak, netizenler ayrıca birçok ilginç senaryo geliştirdiler, deneyebilirsiniz:

2** Bir sipariş robotu modeli (koda göre uygulanır)**

Bir yemek siparişi robotu oluşturmak için ChatGPT nasıl kullanılır? Bunu Mühendislik aracılığıyla yapabiliriz.

Bu yemek siparişi robotu örneği DeepLearning.ai kursundan alınmıştır. DeepLearning.ai'nin kurucusu Wu Enda, geliştiriciler için bir Mühendislik kursu başlatmak üzere OpenAI geliştiricisi Iza Fulford ile birlikte çalıştı. Wu Enda yapay zeka alanında yıldız bir profesör, Stanford Üniversitesi Bilgisayar Bilimi ve Elektrik Mühendisliği Bölümü'nde misafir profesör ve bir zamanlar Stanford Yapay Zeka Laboratuvarı'nın direktörüydü.

ChatGPT, bir restoran için AI müşteri hizmetleri temsilcisi veya bir AI siparişcisi ve diğer roller gibi özel işlevlere sahip bir sohbet robotu oluşturabileceğimiz bir sohbet diyalog arayüzüdür.

Ancak bu ticari bir senaryo olduğu için ChatGPT'den doğru ve istikrarlı yanıtlara ihtiyacımız var.Şu anda bilgisayar dilini kullanmak düz metinden daha uygun, bu yüzden önce OpenAI Python paketini dağıtmamız gerekiyor.

Bu özel chatbot modeli için, temelde bir dizi mesajı girdi olarak alan ve model tarafından oluşturulan mesajları çıkaran bir botu eğitiyoruz. Bu örnekte GPT-3.5 kullanılmıştır ve GPT-4 çok pahalı olduğu için 3.5 bu aşamada ticari kullanım için daha uygun olabilir.

**Bu sipariş robotunun uygulama senaryosu bir pizzacıdır. Gerçekleştirilen işlevler şunlardır: önce müşterileri karşılar, ardından siparişleri toplar ve teslim almaları mı yoksa teslim etmeleri mi gerektiğini sorar. **Teslimat durumunda sipariş botu adres isteyebilir. Son olarak, sipariş veren bot ödemeyi tahsil eder.

Gerçek görüşmede, sipariş veren robot, kullanıcının girdisine ve sistemin talimatlarına göre bir yanıt üretecektir:

Kullanıcı "Merhaba, pizza sipariş etmek istiyorum" der

Sipariş botu "Harika, ne tür pizza sipariş etmek istersin? Biberli, peynirli ve patlıcanlı pizzalarımız var, fiyatları ne kadar" diye cevap verecek.

Görüşme boyunca, sipariş veren robot, görüşmeyi daha doğal ve pürüzsüz hale getirmek ve aynı zamanda görüşmeye bariz hızlı bilgi eklemekten kaçınmak için kullanıcının girdisine ve sistemin talimatlarına dayalı bir yanıt üretecektir.

İlk olarak, kullanıcı mesajlarını toplayarak bizi manuel olarak yazmaktan kurtaran bir "yardımcı fonksiyon" tanımlıyoruz. Bu işlev, kullanıcı arabiriminden ipuçları toplayacak ve bunları, sistem bilgileri ve menüler dahil olmak üzere her seferinde modeli çağırmak için kullanılan bağlam adı verilen bir listeye ekleyecektir.

ChatGPT geri bildirimi ve kullanıcı geri bildirimi bağlama eklenecek ve bu bağlam daha da uzayacak. Bu şekilde, ChatGPT bundan sonra ne yapılacağına karar vermek için ihtiyaç duyduğu tüm bilgilere sahip olur. Bağlam tarafından konuşlandırılan hızlı sözcükler şunlardır: "Siz bir pizzacıdan sipariş toplayan otomatik bir hizmet olan bir sipariş botusunuz. Önce müşteriyi karşılarsınız, sonra siparişi alırsınız ve teslim almak mı yoksa teslim etmek mi istediğinizi sorarsınız." (Ayrıntılar için aşağıdaki resme bakın)

Gerçekten işe yarasaydı şöyle olurdu: kullanıcı "Merhaba, pizza sipariş etmek istiyorum" der. Sonra sipariş botu diyor ki: "Tamam, ne tür pizza sipariş etmek istersiniz? Biberli, peynirli ve patlıcanlı pizzalarımız var, fiyatları ne kadar"

İstem kelimesi zaten fiyatı içerdiğinden, doğrudan burada listelenecektir. Kullanıcı şöyle yanıt verebilir: Orta boy patlıcanlı pizza severim. Böylece kullanıcı ve sipariş veren robot, teslimat yapmak isteyip istemedikleri, ek malzemelere ihtiyaçları olup olmadığı ve başka şeylere (su?

Son olarak, sipariş botundan, sipariş sistemine gönderilebilecek konuşmaya dayalı bir özet oluşturmasını istiyoruz:

Son çıktı bağlantısında, çıktı şunları içerir: ürün kategorileri (pizza, malzemeler, içecekler, atıştırmalıklar...), türü, boyutu, fiyatı, teslimatın gerekli olup olmadığı ve adres. Sonucun herhangi bir yaratıcılık olmadan tamamen kararlı ve öngörülebilir olmasını istediğimiz için sıcaklığı 0 olarak ayarlayacağız. Sonunda, bu tür sonuçlar doğrudan sipariş sistemine sunulabilir.

Bu yazı kodlarla dolu olmadığı için cep telefonunuzda yoğun kodlar görmek istemediğinizi düşünüyorum o yüzden buraya sadece ana noktaları koyduk. Daha fazlasını öğrenmek istiyorsanız, bu ayrıntılı eğitim videosunu izleyebilirsiniz:

3 Bazı temel ilke ve teknikler

Son olarak, büyük dil modellerinin iki temel ilkesini ve mevcut sınırlamalarını özetleyelim.Belirli uygulama senaryolarını bulmak için daha yararlı olan, büyük dil modeli yeteneklerinin mevcut alt sınırının nerede olduğunu bilmeniz gerekir.

**İki ilke şunlardır: net ve spesifik talimatlar yazın ve modele düşünmesi için yeterli zaman verin. **

**İlke 1: Net ve spesifik talimatlar yazın. **

Bu ilke, ChatGPT gibi dil modellerini kullanırken açık ve spesifik talimatların verilmesi gerektiğini vurgular.Açıklık, kısalık anlamına gelmez.Çok kısa bilgi istemi sözcükleri genellikle modelin tahminde bulunmasına neden olur. Bu prensip altında 4 özel strateji vardır:

**1) Girişin farklı bölümlerini net bir şekilde sınırlamak için sınırlayıcıları kullanın. **

Ayırıcılar ters tikler, tırnak işaretleri vb. olabilir. Temel fikir, modelin çıktıyı anlamasına ve işlemesine yardımcı olan girdinin farklı kısımlarını net bir şekilde tanımlamaktır. Ayırıcı, modele bunun bağımsız bir parça olduğunu ve "ipucu enjeksiyonundan" etkili bir şekilde kaçınabileceğini açıkça bilmesini sağlar. Sözde bilgi istemi enjeksiyonu, bazı kullanıcılar yeni girdi eklediğinde yanlışlıkla oluşturulabilecek ve yanlış sonuçlara yol açabilecek bazı çelişkili yönergeleri ifade eder.

**2) Yapılandırılmış çıktı iste: Model çıktısını ayrıştırmayı kolaylaştırmak için yapılandırılmış çıktı talep edilebilir. **

Komut isteminde şunları belirtebilirsiniz: Yazarları ve türleri ile birlikte şu biçimde sağlanan üç kurgusal kitap başlığı oluşturun: Kitap Kimliği, Başlık, Yazar ve Tür.

**3) Modelden koşulun karşılanıp karşılanmadığını kontrol etmesini isteyin. **

Görevin varsayımları varsa ve bu koşullar mutlaka karşılanmıyorsa, modele önce bu varsayımları kontrol etmesi, karşılanmadıklarını belirtmesi ve beklenmedik yanlış sonuçlardan kaçınmak için görevin doğrudan geri beslemesini durdurması söylenebilir.

Aşağıdaki örnekte olduğu gibi: çayın nasıl yapıldığını açıklayan bir paragrafı kopyalayacağız ve ardından metin bir dizi yönerge içeriyorsa, bu yönergeleri aşağıdaki biçimde yeniden yazın ve ardından adımı izleyen istemi kopyalayacağız. adım adım talimatlar. Metin bir dizi yönerge içermiyorsa, "Adım sağlanmadı" yazmanız yeterlidir.

**4) Küçük toplu ipuçları: modelden asıl görevi tamamlamasını istemeden önce, görevleri gerçekleştirmenin başarılı örneklerini sağlayın. **

Bu strateji basit ama önemlidir, yani istem sözcüğüne doğru bir örnek ekleyebiliriz. Örneğin, modelden tutarlı bir tonda yanıt vermesini istiyoruz, giriş görevi "soruları tutarlı bir tarzda yanıtla" ve ardından bir çocukla büyükbaba arasındaki bir konuşma örneğini veriyoruz, çocuk şöyle dedi: "Bana ne öğret sabır", dede benzetme ile cevap verir.

Şimdi modelden tutarlı bir tonla cevap vermesini istiyoruz, bir sonraki soru ise: "Bana dayanıklılığın ne olduğunu öğret". Model zaten bu birkaç örneğe sahip olduğu için, bir sonraki görevi benzer bir tonla yanıtlayacak, "Direniş, rüzgarla bükülebilen ama asla kırılmayan bir ağaç gibidir" yanıtını verecektir.

**İlke 2: Modele düşünmesi için yeterli zaman verin. **

Model, yanlış bir sonuca varmaya hevesli olduğu için bir akıl yürütme hatası yaparsa, istem sözcüklerini yeniden oluşturmaya çalışmalıdır.Temel fikir, modelin nihai yanıtı vermeden önce bir dizi ilgili akıl yürütme yapmasını istemektir. Bu prensip altında 2 strateji vardır:

1) Görevi tamamlama adımlarını belirtin:

Bir görevi tamamlamak için gereken adımları açıkça belirtmek, modelin görevi daha iyi anlamasına ve daha doğru çıktılar üretmesine yardımcı olabilir.

2) Modele (sonuçlara varmadan önce) kendi çözümünü formüle etmesi talimatını verin:

Bir sonuca varmadan önce modele çözüm hakkında kendi başına akıl yürütmesi talimatını açıkça vermek, modelin görevi daha doğru bir şekilde tamamlamasına yardımcı olabilir.

**Ek Tartışma: Modelin sınırlamaları nasıl görüntülenebilir? **

Şu anda, büyük dil modellerinin ticarileştirilmesiyle ilgili en büyük sorun "yanılsama" dır. Çünkü eğitim sürecinde büyük model çok fazla bilgiye maruz kalıyor ama gördüğü bilgiyi tam olarak hatırlamıyor ve bilgi sınırının nerede olduğu net değil. Bu, büyük modelin tüm soruları yanıtlamaya çalışabileceği, bazen akla yatkın görünen ama olmayan şeyler uydurabileceği anlamına gelir.

Halüsinasyonları azaltmak için bir strateji, önce büyük dil modelinden metindeki ilgili tüm bölümleri bulmasını istemek, ardından soruyu yanıtlamak için bu alıntıları kullanmasını istemek ve yanıtı kaynak belgeye kadar izlemektir. Bu strateji, oluşumu azaltabilir halüsinasyonlar.

Bugünün makalesi daha pratiktir.Mühendisliğin bazı derinlemesine uygulamalarını (hızlı mühendislik) iki vaka üzerinden açıklıyoruz (biri düz metin ve diğeri programlama aracılığıyla).

GPT-3.5 ve GPT-4 gibi büyük dil modelleri her şeyi anlar, ancak tam olarak çok geniş olduğu için, ona bir ipucu vermezseniz, aldığınız yanıt genellikle bir araba tekerleği olur.

Şu anda (sorunun) önemi aşikardır ve bu sadece bir kelime veya basit bir cümle değildir.Daha karmaşık işlevler elde etmek istiyorsanız, daha karmaşık komut istemlerine de ihtiyacınız vardır.

Aynı zamanda herkesin beyin fırtınası yapmasını ve daha yeni veya daha uygun oynanışlar bulmasını gerektirir. "Münhasırlığı" da çok güçlüdür. Örneğin, önceki ödüllü "Uzay Opera Binası"nın yazarı, bu işi ortaya çıkarmak için 80 saatten fazla ve 900'den fazla yineleme harcadığını iddia etti ve Midjourney'nin şu ana kadar kullandığı istemleri paylaşmayı reddetti.

** Tabii ki, kendi içinde, yalnızca aşamalı bir talep olabilir. Sam Altman bir keresinde şöyle demişti: Beş yıl sonra, artık mühendis pozisyonunu yönlendirmek gerekli olmayabilir, çünkü yapay zeka kendi kendine öğrenme yeteneğine sahip olacak. Ancak bu "aşamalı talep"in, yapay zekanın işin tüm yönlerini ele geçirmesine gerçekten yardımcı olacak önemli bir silah olduğu inkar edilemez. **

Şimdi sıfırdan başlamamıza gerek yok, yurt içinde ve yurt dışında pek çok iyi topluluk var, herkes hızlı sözcüklerin kullanımı konusunda deneyimlerini paylaşıyor ve hatta ekte listeleyeceğimiz güncel popüler yönlendirici sözcükleri bile listeliyor. makalenin sonu.

** Girişimcilik/yatırım açısından bakıldığında artık herkes uygulama katmanındaki fırsatların nerede olduğunu tartışıyor.Sık sık bu popüler prompt word sitelerini görmek için gidiyorum ve belki yeni çıkan popüler uygulama senaryolarından bazı yenilikler bulabilirim. hızlı kelimeler ilham. Ne kadar görmüş olursanız olun, denemek daha iyidir. **

Ek: Bazı Hızlı Kelime Tartışma Siteleri

  1. AI topluluğu:

(Popülerliğe göre sıralanabilen ve eksiksiz bir senaryo yelpazesini kapsayan, deniz aşırı popüler bir bilgi istemi web sitesi.)

2、 Reddit'te Yazma (r/Writings):

(Reddit'teki Yazılar alt dizini, kullanıcıların çeşitli yazma komutlarını gönderip yanıtladıkları çok aktif bir topluluktur.)

3. Listelenen 100 en iyi bilgi istemi kelimesi

(İş Akışınızı Güçlendirecek En İyi 100 ChatGPT Komut Sözü.)

4. Çince hızlı kelime web sitesi:

(Popülerliğe göre sıralanabilir ve kapsanan senaryolar, yazmadan programlamaya, finansa, tıbbi bakıma vb. kadar eksiksizdir.)

5. Başka bir Çince bilgi istemi web sitesi: İpucu Sihirbazı

(Xiaohongshu metin yazarlığı en üst sırada yer alır ve hızlı sözcükleri daha sezgisel bir şekilde görüntüler.)

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)