Pazarın Yapay Zeka Temsilcilerine yönelik beklentileri her zaman yüksek olmuştur. Çeşitli tek yönlü görevleri olan temsilcilere ek olarak, Stanford Üniversitesi ve Google tarafından yapılan önceki bir deneyde, kendi başlarına işbirliği içinde çalışan 25 Yapay Zeka Temsilcisinden oluşan sanal bir kasaba (Sanal Şehir) gösterilmiştir. Bu sanal kasabada günlük programlar, randevular yapın ve etkinlikler ve partiler planlayın.
Ancak yakın zamanda yapılan bir araştırma deneyi, **7 AI Temsilcisinden oluşan sanal bir şirketin, yaklaşık 1 ABD Doları tutarında bir maliyetle, tam bir geliştirme sürecini 7 dakikada tamamladığını gösterdi. **Bu deney, Tsinghua Üniversitesi, Pekin Posta ve Telekomünikasyon Üniversitesi, Dalian Teknoloji Üniversitesi, Brown Üniversitesi ve yerel AI startup şirketi Wall-Facing Intelligence'dan araştırmacılar tarafından yayınlanan en son makaleden alınmıştır.
Görevleri CEO, CTO, CPO, programcı, tasarımcı, test uzmanı ve kod incelemecisi olan 7 AI Agent'tan oluşan ChatDev adında bir sanal şirket kurdular.Bu Agent'lar ChatGPT 3.5 modeli tarafından destekleniyor.
Yazılım geliştirme sırasını temel alan Şelale modeli, tüm süreci 4 aşamaya ayırır: tasarım, programlama, test etme ve belgeleme. Araştırmacılar, her Temsilci için takip edilmesi gereken rolleri, atanan görevleri ve iletişim protokollerini tanımladılar. istem sözcükleri ve sonlandırma kriterleri ve kısıtlamaları.
Bundan sonra ChatDev şirketindeki her Agent, farklı aşamalarda geliştirme çalışmalarına katılacak. Örneğin, tasarım aşamasında CEO, CPO ve CTO birlikte çalışacak ve programlama aşaması esas olarak CTO, programcılar ve CTO'yu içerecektir. tasarımcılar.
Her aşamadaki spesifik rol tahsisi kabaca aşağıdaki şekilde gösterildiği gibidir.Yukarıdaki, yazılım geliştirme sürecine dayalı görev tahsisi rolüdür ve aşağıdaki Sohbet Zinciri, karar verme iletişim ve geri bildirim sürecidir:
Çeşitli roller atandıktan sonra ChatDev şirketi "Gomoku" oyununu geliştirme siparişi aldı. Hemen herkes ilk tasarım aşamasına girdi. CEO, CPO ve CTO ürün türü ve programlama dili hakkında basit bir görüşme yaptı. Karar şu şekilde verildi: karar verme süreci gerçektekine çok benzer:
CEO: Müşterilerin ihtiyaçlarını karşılamak amacıyla, ürünlere ve uygulamaya yönelik özel programlama dillerini tartışalım;
CPO: Bu oyunu masaüstü versiyonu olarak geliştirmenizi öneriyorum çünkü o zaman bilgisayarda oynanabilir ve çok kullanıcı dostu bir kullanıcı arayüzü ve etkileşimli bir deneyime sahip olur.Deneyimlerimiz ışığında Python dilini kullanmanızı öneririm.
CEO: Teklifinize katılıyorum. @CTO, bana programlama dili seçimi konusunda özel tavsiyeler vermek ister misiniz?
CTO: Python iyi bir uyum ve iyi bir seçim.
CEO: Python dilinin basitliği ve okunabilirliği onu hem yeni başlayanlar hem de deneyimli geliştiriciler için ilk tercih haline getirdi.
*CTO: Haydi başlayalım!
Daha sonra CEO ve CPO, ürünün belirli ayrıntılarını daha da belirlemek için birlikte beyin fırtınası yapmaya başladı:
Bu tamamlandıktan sonra programlama aşamasına geçilir, işin özü CTO, programcılar, tasarımcılar ve kod incelemeciler arasındaki geliştirme süreci ve diyalogdur ve iş birliği ile oyun geliştirme çalışması tamamlanır.
Çeşitli ürün geliştirme ve test süreçleri tamamlandıktan sonra CTO, programcılar, CEO ve CPO, müşterilerle etkileşim için yazılımın etkileşimi hakkında ayrıntılı bir belge yazmak üzere birlikte çalışacak.
Tüm süreç, görevleri 70'den fazla alt göreve böler.Görev bölme işlemi tamamlandıktan sonra, ürün geliştirme yaklaşık 7 dakikada (normal geliştirme döngüsü 2-4 hafta sürebilir) ve bellek * ve ** aracılığıyla tamamlanır. Bazı potansiyel güvenlik açıklarını tespit eden ve bunları düzelten öz değerlendirme* işlevleri.
Bu araştırmacılar, tüm geliştirme sürecinin her aşamasının maliyetine ilişkin istatistikler yapmışlar, tüm sürecin ortalama 7 dakikadan az sürmesinin yanı sıra, toplam maliyetin 1 ABD dolarından az** olması, çok yüksek bir yazılım olduğunu ortaya koyuyor. geliştirme verimliliği. Bu oyun ürününün basit bir uygulama süreci aşağıdadır:
Makaleye göre AI Agent'ın %86,66'sı tüm süreç boyunca mükemmel bir şekilde yürütüldü ve yürütmenin başarısız olduğu kısımda vakaların %50'si API'nin token uzunluğu sınırından kaynaklandı Bu tür bir başarısızlık Kısıtlama, kod üretimi için belirli bir uzunluk aralığı dahilinde kaynak kodunun tamamının elde edilmesini engeller. Bu zorluklar özellikle karmaşık yazılım sistemleriyle veya kapsamlı kod üretimi gerektiren durumlarla uğraşırken belirgindir.
Başarısızlıkların diğer %50'si esas olarak dış bağımlılık sorunlarından etkilenir. Bazı bağımlılıklar bulutta bulunamadığında veya yanlış sürüme sahip olduğunda sorunlar ortaya çıkacaktır. Ancak genel olarak bu deneyin sonuçları nispeten başarılıdır. Belki yakın gelecekte çoğu işimiz Yapay Zeka Aracılarına bağlı olabilir.
Makalenin tamamı burada görülebilir:
Genel kod GitHub'da görüntülenebilir:
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
7 temsilciden oluşan bir şirket, oyunun geliştirilmesini 7 dakikada tamamladı
Pazarın Yapay Zeka Temsilcilerine yönelik beklentileri her zaman yüksek olmuştur. Çeşitli tek yönlü görevleri olan temsilcilere ek olarak, Stanford Üniversitesi ve Google tarafından yapılan önceki bir deneyde, kendi başlarına işbirliği içinde çalışan 25 Yapay Zeka Temsilcisinden oluşan sanal bir kasaba (Sanal Şehir) gösterilmiştir. Bu sanal kasabada günlük programlar, randevular yapın ve etkinlikler ve partiler planlayın.
Ancak yakın zamanda yapılan bir araştırma deneyi, **7 AI Temsilcisinden oluşan sanal bir şirketin, yaklaşık 1 ABD Doları tutarında bir maliyetle, tam bir geliştirme sürecini 7 dakikada tamamladığını gösterdi. **Bu deney, Tsinghua Üniversitesi, Pekin Posta ve Telekomünikasyon Üniversitesi, Dalian Teknoloji Üniversitesi, Brown Üniversitesi ve yerel AI startup şirketi Wall-Facing Intelligence'dan araştırmacılar tarafından yayınlanan en son makaleden alınmıştır.
Görevleri CEO, CTO, CPO, programcı, tasarımcı, test uzmanı ve kod incelemecisi olan 7 AI Agent'tan oluşan ChatDev adında bir sanal şirket kurdular.Bu Agent'lar ChatGPT 3.5 modeli tarafından destekleniyor.
Yazılım geliştirme sırasını temel alan Şelale modeli, tüm süreci 4 aşamaya ayırır: tasarım, programlama, test etme ve belgeleme. Araştırmacılar, her Temsilci için takip edilmesi gereken rolleri, atanan görevleri ve iletişim protokollerini tanımladılar. istem sözcükleri ve sonlandırma kriterleri ve kısıtlamaları.
Bundan sonra ChatDev şirketindeki her Agent, farklı aşamalarda geliştirme çalışmalarına katılacak. Örneğin, tasarım aşamasında CEO, CPO ve CTO birlikte çalışacak ve programlama aşaması esas olarak CTO, programcılar ve CTO'yu içerecektir. tasarımcılar.
Her aşamadaki spesifik rol tahsisi kabaca aşağıdaki şekilde gösterildiği gibidir.Yukarıdaki, yazılım geliştirme sürecine dayalı görev tahsisi rolüdür ve aşağıdaki Sohbet Zinciri, karar verme iletişim ve geri bildirim sürecidir:
Çeşitli roller atandıktan sonra ChatDev şirketi "Gomoku" oyununu geliştirme siparişi aldı. Hemen herkes ilk tasarım aşamasına girdi. CEO, CPO ve CTO ürün türü ve programlama dili hakkında basit bir görüşme yaptı. Karar şu şekilde verildi: karar verme süreci gerçektekine çok benzer:
Daha sonra CEO ve CPO, ürünün belirli ayrıntılarını daha da belirlemek için birlikte beyin fırtınası yapmaya başladı:
Bu tamamlandıktan sonra programlama aşamasına geçilir, işin özü CTO, programcılar, tasarımcılar ve kod incelemeciler arasındaki geliştirme süreci ve diyalogdur ve iş birliği ile oyun geliştirme çalışması tamamlanır.
Çeşitli ürün geliştirme ve test süreçleri tamamlandıktan sonra CTO, programcılar, CEO ve CPO, müşterilerle etkileşim için yazılımın etkileşimi hakkında ayrıntılı bir belge yazmak üzere birlikte çalışacak.
Tüm süreç, görevleri 70'den fazla alt göreve böler.Görev bölme işlemi tamamlandıktan sonra, ürün geliştirme yaklaşık 7 dakikada (normal geliştirme döngüsü 2-4 hafta sürebilir) ve bellek * ve ** aracılığıyla tamamlanır. Bazı potansiyel güvenlik açıklarını tespit eden ve bunları düzelten öz değerlendirme* işlevleri.
Bu araştırmacılar, tüm geliştirme sürecinin her aşamasının maliyetine ilişkin istatistikler yapmışlar, tüm sürecin ortalama 7 dakikadan az sürmesinin yanı sıra, toplam maliyetin 1 ABD dolarından az** olması, çok yüksek bir yazılım olduğunu ortaya koyuyor. geliştirme verimliliği. Bu oyun ürününün basit bir uygulama süreci aşağıdadır:
Makaleye göre AI Agent'ın %86,66'sı tüm süreç boyunca mükemmel bir şekilde yürütüldü ve yürütmenin başarısız olduğu kısımda vakaların %50'si API'nin token uzunluğu sınırından kaynaklandı Bu tür bir başarısızlık Kısıtlama, kod üretimi için belirli bir uzunluk aralığı dahilinde kaynak kodunun tamamının elde edilmesini engeller. Bu zorluklar özellikle karmaşık yazılım sistemleriyle veya kapsamlı kod üretimi gerektiren durumlarla uğraşırken belirgindir.
Başarısızlıkların diğer %50'si esas olarak dış bağımlılık sorunlarından etkilenir. Bazı bağımlılıklar bulutta bulunamadığında veya yanlış sürüme sahip olduğunda sorunlar ortaya çıkacaktır. Ancak genel olarak bu deneyin sonuçları nispeten başarılıdır. Belki yakın gelecekte çoğu işimiz Yapay Zeka Aracılarına bağlı olabilir.
Makalenin tamamı burada görülebilir:
Genel kod GitHub'da görüntülenebilir: