Zephyrnet Logosu

Üretken Yapay Zeka ile Roblox'ta Yaratılışta Devrim Yaratmak – Roblox Blogu

Tarih:

Bu yılın başında paylaşmıştık vizyonumuz Roblox'ta üretken yapay zeka (AI) ve her kullanıcının yaratıcı olmasını sağlayacak sezgisel yeni araçlar için. Bu araçlar sektörde hızla geliştikçe, kaydettiğimiz ilerleme, üretken yapay zeka yaratımını demokratikleştirmek için hâlâ önümüzde olan yol ve üretken yapay zekanın neden Roblox'un gittiği yer için kritik bir unsur olduğunu düşündüğümüz hakkında bazı güncellemeler sunmak istedim. 

Üretken yapay zeka ve büyük dil modellerindeki (LLM'ler) gelişmeler, güvenliği korurken ve büyük bilgi işlem kaynakları gerektirmeden daha kolay, daha hızlı oluşturma olanağı sağlayarak sürükleyici deneyimlerin geleceğinin kilidini açmak için inanılmaz bir fırsat sunuyor. Dahası, çok modlu yapay zeka modellerindeki ilerlemeler, yani birden fazla içerik türüyle (görüntüler, kod, metin, 3D modeller ve ses gibi) eğitildikleri anlamına geliyor; oluşturma araçlarında yeni ilerlemelerin kapısını açıyor. Aynı modeller, metni tamamlayan bazı görsellerin yanı sıra metin çıktısı oluşturabilen bir model gibi multimodal çıktılar da üretmeye başlıyor. Bu AI atılımlarını, daha deneyimli yaratıcıların verimliliğini aynı anda artırmak ve daha da fazla insanın Roblox'ta harika fikirleri hayata geçirmesini sağlamak için muazzam bir fırsat olarak görüyoruz. Bu yılki Roblox Geliştiriciler Konferansı (RDC)ile, Roblox'taki herkesin daha hızlı ölçeklenmesine, daha hızlı yinelenmesine ve daha da iyi içerik oluşturmak için becerilerini artırmasına yardımcı olmak amacıyla üretken yapay zekayı Roblox Studio'ya ve ötesine taşıyacak birkaç yeni aracı duyurduk. 

Roblox Asistanı

Roblox yaratıcılara her zaman gerekli araçları sağlamıştır. Hizmetler, ve destek sürükleyici 3D deneyimler oluşturmaları gerekiyor. Aynı zamanda içerik oluşturucularımızın, içerik oluşturmalarına yardımcı olmak için üçüncü taraf üretken ve konuşmaya dayalı yapay zekayı kullanmaya başladıklarını gördük. İçerik oluşturucunun iş yükünü azaltmaya yardımcı olmak açısından faydalı olsalar da bu kullanıma hazır sürümler, uçtan uca Roblox iş akışları için tasarlanmamıştır veya Roblox kodu, argo ve dil konusunda eğitilmemiştir. Bu, yaratıcıların Roblox için içerik oluşturmak amacıyla bu sürümleri kullanmak için önemli miktarda ek çalışmayla karşı karşıya oldukları anlamına geliyor. Bu araçların değerini Roblox Studio'ya getirmenin yolları üzerinde çalışıyoruz ve RDC'de Asistan'ın ilk örneğini paylaştık.

Asistan, tüm beceri seviyelerindeki yaratıcıların yaratmayla ilgili sıradan, tekrarlayan görevlere önemli ölçüde daha az, anlatım, oyun oynama ve deneyim tasarımı gibi yüksek değerli etkinliklere daha fazla zaman harcamasını sağlayan, konuşmaya dayalı yapay zekamızdır. Roblox, üzerinde eğitim yapılabilecek geniş bir genel 3D model kümesine erişimimiz, bir modeli platform API'lerimizle entegre etme yeteneğimiz ve büyüyen yenilikçi AI çözümleri paketimiz sayesinde, sürükleyici 3D dünyalar için bu etkileşimli AI modelini oluşturmak için benzersiz bir konuma sahiptir. . İçerik oluşturucular, sahneler oluşturmak, 3D modelleri düzenlemek ve nesnelere etkileşimli davranışlar uygulamak için doğal dildeki metin istemlerini kullanabilecek. Asistan, yaratımın üç aşamasını destekleyecektir: öğrenme, kodlama ve inşa etme:

  • Öğrenme: İster Roblox'ta geliştirme konusunda yeni olan ister deneyimli bir yaratıcı olsun, Roblox Assistant, doğal dili kullanarak çok çeşitli yüzeylerde soruları yanıtlamaya yardımcı olacaktır. 
  • Kodlama: Asistan son uygulamamızı genişletecek Kod Yardımı alet. Örneğin, geliştiriciler Asistan'dan kodlarını iyileştirmesini, kodun bir bölümünü açıklamasını veya hata ayıklamaya yardımcı olmasını ve düzgün çalışmayan kod için düzeltmeler önermesini isteyebilir.
  • bina: Asistan, yaratıcıların yeni fikirleri hızla prototiplemelerine yardımcı olacak. Örneğin, yeni bir yaratıcı, "Bu yol boyunca birkaç sokak lambası ekleyin" veya "Farklı ağaç türlerinden oluşan bir orman yapın" gibi bir komut yazarak tüm sahneleri oluşturabilir ve farklı versiyonları deneyebilir. Şimdi biraz çalı ve çiçek ekleyin.

Asistan'la çalışmak işbirlikçi, etkileşimli ve yinelemeli olacak ve içerik oluşturucuların geri bildirimde bulunmasına ve Asistan'ın doğru çözümü sağlamak için çalışmasını sağlamasına olanak tanıyacak. Bu, fikir alışverişinde bulunabileceğiniz ve doğru sonuca ulaşana kadar fikirleri deneyebileceğiniz uzman bir yaratıcının ortağınız olması gibi olacaktır.

frameborder=”0″ allow=”ivmeölçer; otomatik oynatma; panoya yazma; şifreli ortam; jiroskop; fotoğraf içinde fotoğraf; web paylaşımına izin veren tam ekran>

Asistan'ı olabilecek en iyi iş ortağı haline getirmek için RDC'de başka bir duyuru daha yaptık: Geliştiricileri, katılmak anonimleştirilmiş Luau komut dosyası verilerine katkıda bulunmak. Bu komut dosyası verileri, Code Assist ve Assistant gibi AI araçlarımızın, daha verimli kod önerme ve oluşturma konusunda önemli ölçüde daha iyi hale getirilmesine yardımcı olacak ve bunları kullanan Roblox geliştiricilerine geri dönüş yapacak. Ayrıca, geliştiriciler Roblox'un ötesinde paylaşım yapmayı tercih ederse, komut dosyası verileri, AI sohbet araçlarını Luau kodunu önerme konusunda daha iyi olacak şekilde eğitmek ve her yerdeki Luau geliştiricilerine geri vermek için üçüncü tarafların kullanımına sunulan bir veri kümesine eklenecektir.

Açıkça söylemek gerekirse, kapsamlı kullanıcı araştırması ve en iyi geliştiricilerle yapılan şeffaf görüşmeler yoluyla, bunu katılıma açık olacak şekilde tasarladık ve tüm katılımcıların programın neyi gerektirdiğini anlamasını ve kabul etmesini sağlamaya yardımcı olacağız. Roblox ile komut dosyası verilerinin paylaşılmasına katılmayı seçenlere bir teşekkür olarak, topluluk tarafından eğitilen bu model tarafından desteklenen Asistan ve Code Assist'in daha güçlü sürümlerine erişim vereceğiz. Kaydolmayanlar mevcut Asistan ve Code Assist sürümümüze erişmeye devam edecek.

Daha Kolay Avatar Oluşturma 

Sonuçta, günlük 65.5 milyon kullanıcımızın her birinin, kendilerini gerçekten temsil eden ve kim olduklarını ifade eden bir avatara sahip olmasını istiyoruz. Yakın zamanda UGC Programı üyelerimize yönelik şu özelliği kullanıma sunduk: hem avatar gövdeleri hem de bağımsız kafalar oluşturup satabilirsiniz. Bugün bu süreç, Studio'ya veya UGC Programımıza erişim, oldukça yüksek düzeyde beceri ve yüz ifadesi, vücut hareketi, 3D donanım vb.'yi etkinleştirmek için birkaç gün süren çalışmayı gerektiriyor. Bu, avatarların oluşturulmasını zaman alıcı hale getiriyor ve tarih, mevcut seçeneklerin sayısını sınırladı. Daha da ileri gitmek istiyoruz.

Roblox'taki herkesin kişiselleştirilmiş, etkileyici bir avatara sahip olmasını sağlamak için avatarları oluşturmayı ve özelleştirmeyi çok kolay hale getirmemiz gerekiyor. RDC'de, 2024'te yayınlayacağımız ve bir görüntüden veya birkaç görüntüden özel bir avatarın kolayca oluşturulmasını sağlayacak yeni bir aracı duyurduk. Bu araçla, Studio'ya veya UGC programımıza erişimi olan herhangi bir içerik oluşturucu, bir görsel yükleyebilecek, kendisi için bir avatar oluşturulabilecek ve daha sonra onu istediği gibi değiştirebilecek. Uzun vadede bunu doğrudan Roblox deneyimlerinde de kullanıma sunmayı planlıyoruz.

Bunu mümkün kılmak için yapay zeka modellerini Roblox'un avatar şeması ve Roblox'a ait bir dizi 3D avatar modeli üzerinde eğitiyoruz. Bir yaklaşım avantaj sağlar araştırma 3D görüntülerden 2D stilize avatarlar oluşturmak için. Ayrıca, sınırlı 3B eğitim verilerini 2B üretken tekniklerle genişletmek için önceden eğitilmiş metinden görüntüye yayılma modellerini kullanmayı ve eğitim için üretken bir rakip ağ (GAN) tabanlı 3B nesil ağ kullanmayı düşünüyoruz. Son olarak, kullanmaya çalışıyoruz Kontrol Ağı avatarların çoklu görünüm görüntülerini yönlendirmek için önceden tanımlanmış pozları katmanlamak. 

Bu işlem, avatar için bir 3 boyutlu ağ oluşturur. Daha sonra 3D'den yararlanıyoruz anlamsal segmentasyon araştırması3D avatar pozları konusunda eğitim almış, bu 3D ağı alıp uygun yüz özellikleri, kafesleme, donanım ve dokular ekleyecek şekilde ayarlamak, aslında statik 3D ağı bir Roblox avatarına dönüştürmek. Son olarak, bir ağ düzenleme aracı, kullanıcıların modeli hayal ettikleri versiyona daha çok benzeyecek şekilde değiştirmesine ve ayarlamasına olanak tanır. Ve tüm bunlar birkaç dakika içinde hızlı bir şekilde gerçekleşir ve Roblox'a aktarılabilen ve bir deneyimde kullanılabilen yeni bir avatar oluşturulur.

frameborder=”0″ allow=”ivmeölçer; otomatik oynatma; panoya yazma; şifreli ortam; jiroskop; fotoğraf içinde fotoğraf; web paylaşımına izin veren tam ekran>

Sesli İletişimi Yönetme

Bizim için yapay zeka sadece yaratımla ilgili değil, aynı zamanda geniş ölçekte çeşitliliğe sahip, güvenli ve sivil bir topluluk sağlamak için çok daha verimli bir sistem. Sesli sohbet ve Roblox Connect, avatarınız olarak yeni arama özelliği ve RDC'de duyurulan API'ler dahil olmak üzere yeni ses özelliklerini kullanıma sunmaya başladığımızda, yeni bir zorlukla karşı karşıyayız: konuşulan dili gerçek zamanlı olarak denetlemek. Bunun için geçerli endüstri standardı, Otomatik Konuşma Tanıma (ASR) olarak bilinen, esas olarak bir ses dosyasını alan, bunu metne dönüştürmek için yazıya döken ve ardından uygunsuz dil, anahtar kelimeler vb. aramak için metni analiz eden bir süreçtir. 

Bu, onu daha küçük ölçekte kullanan şirketler için işe yarar, ancak aynı ASR sürecini sesli iletişimi denetlemek için kullanmayı araştırdıkça, bunun bizim ölçeğimizde zor ve verimsiz olduğunu hemen fark ettik. Bu yaklaşım aynı zamanda, konuşmacının ses tonu ve ses tonunun yanı sıra konuşmanın daha geniş bağlamında kodlanmış inanılmaz derecede değerli bilgileri de kaybeder. Her gün farklı dillerde yazıya dökmek zorunda kalacağımız milyonlarca dakikalık konuşmanın yalnızca çok küçük bir yüzdesi muhtemelen uygunsuz bir şey gibi görünebilir. Ölçeklendirmeye devam ettikçe, bu sistemin buna ayak uydurmak için giderek daha fazla bilgi işlem gücüne ihtiyacı olacak. Bu nedenle, doğrudan canlı sesten içeriğin politikalarımızı ihlal edip etmediğini belirtmek üzere etiketlemeye giden bir boru hattı oluşturarak bunu nasıl daha verimli bir şekilde yapabileceğimize daha yakından baktık.

Sonuçta, şirket içi ses veri setlerimizi sınıflandırmak için ASR'yi kullanarak şirket içi özel bir ses algılama sistemi oluşturmayı ve ardından bu sınıflandırılmış ses verilerini sistemi eğitmek için kullanmayı başardık. Daha spesifik olarak, bu yeni sistemi eğitmek için sesle başlayıp bir transkript oluşturuyoruz. Daha sonra sesi sınıflandırmak için transkripti Roblox metin filtre sistemimiz aracılığıyla çalıştırıyoruz. Bu metin filtre sistemi, Roblox'ta politikayı ihlal eden dili tespit etmede mükemmeldir çünkü aynı filtre sistemini yıllardır Roblox'a özgü argo, kısaltmalar ve dil üzerinde optimize ediyoruz. Bu eğitim katmanlarının sonunda, politika ihlallerini gerçek zamanlı olarak doğrudan ses üzerinden tespit edebilen bir modele sahibiz.

Bu sistem küfür gibi belirli anahtar kelimeleri tespit etme yeteneğine sahip olsa da politika ihlalleri nadiren tek kelimeden oluşur. Bir kelime genellikle bir bağlamda sorunlu görünebilir ve farklı bir bağlamda gayet iyi görünebilir. Temel olarak bu tür ihlaller ne söylediğinizi, nasıl söylediğinizi ve açıklamaların yapıldığı bağlamı içerir.

Bağlamı daha iyi anlamak için dizi özetlemede çok iyi olan transformatör tabanlı mimarinin doğal gücünden yararlanıyoruz. Ses akışı gibi bir dizi veriyi alıp sizin için özetleyebilir. Bu mimari daha uzun bir ses dizisini korumamıza olanak tanır, böylece yalnızca kelimeleri değil aynı zamanda bağlamı ve tonlamaları da tespit edebiliriz. Tüm bu unsurlar bir araya geldiğinde, girdinin ses, çıktının ise politikayı ihlal edip etmediğine dair bir sınıflandırma olduğu son bir sistemimiz olur. Bu sistem, anahtar kelimeleri ve politikayı ihlal eden ifadeleri tespit edebildiği gibi aynı zamanda üslup, duygu ve niyeti belirlemek için önemli olan diğer bağlamları da tespit edebilir. Politikayı ihlal eden konuşmaları doğrudan sesten tespit eden bu yeni sistem, geleneksel bir ASR sistemine göre önemli ölçüde daha verimli bilgi işlem kapasitesine sahip ve bu da insanların nasıl bir araya geleceğini yeniden tasarlamaya devam ederken ölçeklendirmeyi çok daha kolay hale getirecek.

Ayrıca sesli iletişim araçlarımızdakileri bu tür bir dilin olası sonuçları konusunda uyarmanın yeni bir yoluna da ihtiyacımız vardı. Elimizdeki bu yenilikçi tespit sistemiyle, artık güvenli bir ortam sağlamak için çevrimiçi davranışı etkilemenin yollarını deniyoruz. İnsanların bazen politikalarımızı istemeden de olsa ihlal ettiğini biliyoruz ve ara sıra yapılan bir hatırlatmanın daha fazla suçun önlenmesine yardımcı olup olmayacağını anlamak istiyoruz. Buna yardımcı olmak için bildirimler aracılığıyla gerçek zamanlı kullanıcı geri bildirimleriyle denemeler yapıyoruz. Sistem, politikalarımızı birkaç kez ihlal eden bir şey söylediğinizi tespit ederse, ekranınızda dilinizin politikalarımızı ihlal ettiğini bildiren bir açılır bildirim görüntüler ve daha fazla bilgi için sizi politikalarımıza yönlendiririz.

Ancak ses akışı bildirimleri, denetleme sisteminin yalnızca bir öğesidir. Ayrıca genel denetleme kararlarımızı yönlendirmek için platformdaki davranış kalıplarına ve Roblox'taki diğer kişilerden gelen şikayetlere de bakıyoruz. Bu sinyallerin toplamı, ses özelliklerine erişimin iptal edilmesi veya daha ciddi ihlallerde platformdan tamamen yasaklanması gibi daha güçlü sonuçlara yol açabilir. Çok modlu yapay zeka modelleri, üretken yapay zeka ve LLM'lerdeki bu ilerlemeler yaratıcılar için inanılmaz yeni araçlar ve yetenekler sağlamak üzere bir araya geldiğinden topluluğumuzu güvenli ve sivil tutmak kritik önem taşıyor. 

Yaratıcılara bu araçları sağlamanın hem daha az deneyimli yaratıcıların giriş engelini azaltacağına hem de daha deneyimli yaratıcıları bu sürecin daha sıkıcı görevlerinden kurtaracağına inanıyoruz. Bu onların ince ayar ve fikir üretmenin yaratıcı yönlerine daha fazla zaman ayırmalarına olanak tanıyacaktır. Tüm bunlarla amacımız herkesin, her yerde fikirlerini hayata geçirmesini sağlamak ve Roblox'ta mevcut olan avatarların, öğelerin ve deneyimlerin çeşitliliğini büyük ölçüde artırmaktır. Biz de Yeni yaratımların korunmasına yardımcı olacak bilgi ve araçların paylaşılması

Şimdiden inanılmaz olasılıklar hayal ediyoruz: Birisinin doğrudan bir fotoğraftan bir avatar görseli oluşturabildiğini, daha sonra avatarını daha uzun hale getirecek şekilde özelleştirebileceğini veya anime tarzında oluşturabileceğini varsayalım. Ya da Asistan'dan araba, bina ve manzara eklemesini, aydınlatma veya rüzgar koşullarını ayarlamasını ya da araziyi değiştirmesini isteyerek bir deneyim oluşturabilirler. Oradan, yalnızca Asistan ile ileri geri yazarak işleri hassaslaştırabilirler. İnsanların bu araçlarla yarattıklarının gerçekliğinin, kullanıma sunuldukça hayal edebileceğimizin çok ötesine geçeceğini biliyoruz.

spot_img

En Son İstihbarat

spot_img