Zephyrnet Logosu

Okumanız Gereken Üretken Ajan Araştırma Makaleleri – KDnuggets

Tarih:

Okumanız Gereken Üretken Ajan Araştırma Makaleleri
Image piki süperstar on Freepik
 

Üretken Aracılar, Stanford Üniversitesi ve Google araştırmacıları tarafından, başlıklı makalelerinde türetilen bir terimdir. Üretken Ajanlar: İnsan Davranışının Etkileşimli Simülakrları (Park ve diğerleri., 2023). Bu yazıda araştırma, Üretken Aracıların insan davranışını inandırıcı bir şekilde simüle eden hesaplamalı yazılım olduğunu açıklıyor. 

Makalede, üretken bir model, özellikle Büyük Dil Modeli (LLM) uygulayarak, etmenlerin nasıl insanların yapacağı gibi davranabileceğini tanıtıyorlar: yazma, yemek pişirme, konuşma, oy verme, uyuma vb. Etmenler, doğal dil modelini kullanarak kendileri, diğer etmenler ve çevreleri hakkında çıkarımlarda bulunma yeteneğini gösterebilirler.

Araştırmacı, büyük bir dil modeli kullanarak inandırıcı davranışlar oluşturmak amacıyla ilgili anıları depolamak, sentezlemek ve uygulamak için bir sistem mimarisi oluşturur ve üretken aracıları etkinleştirir. Bu sistem üç bileşenden oluşmuştur; bunlar:

  1. Bellek akışı. Sistem, temsilcinin deneyimlerini kaydeder ve temsilcinin gelecekteki eylemleri için bir referans oluşturur.
  2. yansıma. Sistem, bir temsilcinin öğrenmesi ve daha iyi performans göstermesi için deneyimi anılara sentezler.
  3. Planlama. Sistem, önceki sistemden elde edilen bilgileri üst düzey eylem planlarına dönüştürür ve aracının çevreye tepki vermesine olanak tanır. 

Bu yansımalar ve plan sistemleri, aracının gelecekteki davranışını etkilemek için bellek akışıyla sinerjik olarak çalışır. 

Yukarıdaki sistemi simüle etmek için araştırmacılar, Sims oyunundan ilham alan etkileşimli bir ajanlar topluluğu yaratmaya odaklanıyor. Yukarıdaki mimari ChatGPT'ye bağlıdır ve sanal alanlarında 25 aracı etkileşimini başarıyla gösterir. Gün boyunca temsilci etkinliğinin bir örneği aşağıdaki resimde gösterilmektedir.

 

Okumanız Gereken Üretken Ajan Araştırma Makaleleri
Gün boyunca Üretken Ajan etkinliği ve etkileşimi (Park ve diğerleri., 2023)
 

Üretken Aracılar oluşturmaya ve bunları sanal alanda simüle etmeye yönelik kodun tamamı araştırmacılar tarafından zaten açık kaynak haline getirildi ve bunu aşağıda bulabilirsiniz. Depo. Yön, onları fazla sorun yaşamadan takip edebileceğiniz kadar basittir.

Üretken Ajanların heyecan verici bir alan haline gelmesiyle birlikte, buna dayalı olarak pek çok araştırma yapılıyor. Bu makalede okumanız gereken çeşitli Üretken Ajanlar makalelerini inceleyeceğiz. Bunlar ne? Hadi konuya girelim.

1. Yazılım Geliştirme için İletişimsel Aracılar

The Yazılım Geliştirme için İletişim Aracıları makalesi (Kuan ve ark., 2023), Üretken Aracıları kullanarak yazılım geliştirmede devrim yaratmaya yönelik yeni bir yaklaşımdır. Araştırmacıların önerdiği önerme, tüm yazılım geliştirme sürecinin Büyük Dil Modellerinden (LLM) doğal dil iletişimi kullanılarak nasıl kolaylaştırılabileceği ve birleştirilebileceğidir. Görevler kod geliştirmeyi, belgeleri oluşturmayı, gereksinimleri analiz etmeyi ve daha fazlasını içerir.

Araştırmacılar, yüksek lisans kullanarak bir yazılımın tamamını oluşturmanın iki büyük zorluğa sahip olduğuna dikkat çekiyor: halüsinasyon ve karar vermede çapraz sorgulama eksikliği. Bu sorunları çözmek için araştırmacılar ChatDev adı verilen sohbet tabanlı bir yazılım geliştirme çerçevesi öneriyorlar.

ChatDev çerçevesi dört aşamayı takip eder: tasarlama, kodlama, test etme ve belgeleme. Her aşamada ChatDev, örneğin kod gözden geçirenler, yazılım programcıları vb. gibi çeşitli rollere sahip çeşitli aracılar kuracaktır. Aracılar arasındaki iletişimin sorunsuz bir şekilde ilerlemesini sağlamak için araştırmacılar, aşamaları sıralı atomik alt görevlere bölen bir sohbet zinciri geliştirdiler. Her alt görev, aracılar arasındaki işbirliğini ve etkileşimi uygulayacaktır.

ChatDev çerçevesi aşağıdaki resimde gösterilmektedir.

 

Okumanız Gereken Üretken Ajan Araştırma Makaleleri
Önerilen ChatDev Çerçevesi (Quan ve ark., 2023)
 

Araştırmacılar, ChatDev çerçevesinin yazılım geliştirmede nasıl performans gösterdiğini ölçmek için çeşitli deneyler gerçekleştiriyor. Kullanarak gpt3.5-turbo-16kAşağıda yazılım istatistikleri deney performansı verilmiştir.

 

Okumanız Gereken Üretken Ajan Araştırma Makaleleri
ChatDev Çerçeve Yazılım İstatistikleri (Quan ve ark., 2023)
 

Yukarıdaki sayı, ChatDev tarafından oluşturulan yazılım sistemlerine ilişkin istatistiksel analize ilişkin bir ölçümdür. Örneğin minimum 39 satır, maksimum 359 kod üretiliyor. Araştırmacılar ayrıca üretilen yazılım sistemlerinin %86.66'sının düzgün çalıştığını gösterdi.

Geliştiricilerin çalışma şeklini değiştirme potansiyelini gösteren harika bir makale. ChatDev'in tam olarak uygulanmasını anlamak için makalenin devamını okuyun. Kodun tamamı ChatDev'de de mevcuttur Depo.

2. AgentVerse: Çoklu Aracı İşbirliğini Kolaylaştırmak ve Aracılarda Acil Davranışları Keşfetmek

AgentVerse, makalede önerilen bir çerçevedir. Chen ve diğerleri., 2023 Büyük Dil Modeli aracılığıyla temsilci gruplarını grup içindeki dinamik problem çözme prosedürlerine ve ilerlemeye dayalı olarak grup üyelerinin ayarlanmasına simüle etmek. Bu çalışma, otonom aracının problem çözmede uyum sağlayamadığı ve gelişemediği statik grup dinamiği sorununu çözmek için mevcuttur.

AgentVerse çerçevesi, çerçeveyi aşağıdakiler de dahil olmak üzere dört adıma ayırmaya çalışır: 

  1. Uzman İşe Alımı: Temsilcilerin sorun ve çözüme uyum sağlaması için ayarlama aşaması
  2. İşbirliğine Dayalı Karar Verme: Temsilciler, sorunu çözmek için bir çözüm ve strateji formüle etmeyi tartışırlar. 
  3. Eylem Yürütme: Aracılar, karara göre ortamda eylem yürütür.
  4. Değerlendirme: Mevcut durum ve hedefler değerlendirilir. Hedefin hâlâ karşılanması gerekiyorsa geri bildirim ödülü ilk adıma geri dönecektir.

AgentVerse'in genel yapısı aşağıdaki resimde gösterilmektedir.

 

Okumanız Gereken Üretken Ajan Araştırma Makaleleri
AgentVerse Çerçevesi (Chen ve ark., 2023)
 

Araştırmacılar çerçeveyi denediler ve AgentVerse çerçevesini bireysel aracı çözümüyle karşılaştırdılar. Sonuç aşağıdaki resimde sunulmuştur.

 

Okumanız Gereken Üretken Ajan Araştırma Makaleleri
AgentVerse'in Performans Analizi (Chen ve ark., 2023)
 

AgentVerse çerçevesi, sunulan tüm görevlerde genel olarak bireysel aracılardan daha iyi performans gösterebilir. Bu, üretken etmenlerin sorunları çözmeye çalışan bireysel etmenlerden daha iyi performans gösterebileceğini kanıtlıyor. Çerçeveyi onların aracılığıyla deneyebilirsiniz Depo.

3. AgentSims: Büyük Dil Modeli Değerlendirmesi için Açık Kaynaklı Bir Sandbox

Yüksek Lisans'ın yeteneğini değerlendirmek topluluk ve alanlar içinde hala açık bir sorudur. LLM'yi doğru bir şekilde değerlendirme yeteneğini sınırlayan üç nokta, görevlere göre sınırlı değerlendirme yetenekleri, hassas kriterler ve objektif olmayan ölçümlerdir. Bu sorunların üstesinden gelmek için, Lin ve ark., 2023 makalelerinde LLM kriteri olarak göreve dayalı bir değerlendirme önerdiler. Bu yaklaşımın, ortaya çıkan tüm sorunları hafifletebileceği için Yüksek Lisans'ın çalışmalarının değerlendirilmesinde standart olmasını umuyordu. Bunu başarmak için araştırmacılar AgentSims adı verilen bir çerçeve sunuyor.

AgentSims, LLM'ler için değerlendirme görevlerini düzenlemek için etkileşimli ve görselleştirme altyapısına sahip bir programdır. AgentSims'in genel amacı araştırmacılara ve uzmanlara görev tasarım sürecini kolaylaştıracak ve bunları bir değerlendirme aracı olarak kullanacak bir platform sağlamaktır. AgentSims'in ön ucu aşağıdaki resimde gösterilmektedir.

 

Okumanız Gereken Üretken Ajan Araştırma Makaleleri
AgentSims Ön Uç (Lin ve ark., 2023)
 

AgentSims'in hedefi, LLM değerlendirmesini daha kolay bir şekilde gerektiren herkes olduğundan, araştırmacılar, kullanıcı arayüzü ile etkileşim kurabileceğimiz ön ucu geliştirdiler. Demonun tamamını kendi sitelerinde de deneyebilirsiniz. Web sitesi veya AgentSims'deki kodun tamamına erişin Depo.

Üretken Ajanlar, LLM'lerde insan davranışlarını simüle etmek için yeni bir yaklaşımdır. Park'ın son araştırması ve diğerleri., 2023, Üretken Ajanların neler yapabileceğine dair büyük bir olasılık gösterdi. Bu nedenle Üretken Ajanlara dayanan birçok araştırma türü ortaya çıktı ve birçok yeni kapı açtı.

Bu makalede, aşağıdakiler de dahil olmak üzere üç farklı Üretken Ajan araştırmasından bahsettik:

  1. Yazılım Geliştirme için İletişimsel Aracılar makalesi (Quan ve ark., 2023)
  2. AgentVerse: Çoklu Aracı İşbirliğini Kolaylaştırma ve Aracılarda Acil Davranışları Keşfetme (Chen ve diğerleri., 2023)

3. AgentSims: Büyük Dil Modeli Değerlendirmesi için Açık Kaynaklı Bir Korumalı Alan (Lin ve ark., 2023)
 
 
Cornellius Yudha Wijaya bir veri bilimi müdür yardımcısı ve veri yazarıdır. Allianz Endonezya'da tam zamanlı çalışırken, sosyal medya ve yazılı medya aracılığıyla Python ve Veri ipuçlarını paylaşmayı seviyor.
 

spot_img

En Son İstihbarat

spot_img