Zephyrnet Logosu

Google Yapay Zekası 30,000 Saatlik Video Oyununu İzledi - Artık Kendi Başına Geliyor

Tarih:

Yapay zeka bol miktarda ışık ve ısı üretmeye devam ediyor. Metin ve görsellerdeki en iyi modeller (şu anda abonelikleri yönetiyor ve tüketici ürünlerine dahil ediliyor) santimetreler için rekabet ediyor. OpenAI, Google ve Anthropic'in hepsi aşağı yukarı başa baş durumda.

O halde yapay zeka araştırmacılarının üretken modelleri yeni alanlara taşımaya çalışması şaşırtıcı değil. Yapay zeka çok büyük miktarda veri gerektirdiğinden, işlerin bundan sonra nereye gideceğini tahmin etmenin bir yolu, çevrimiçi olarak yaygın olarak bulunabilen ancak hâlâ büyük oranda kullanılmamış olan verilere bakmaktır.

Bol miktarda bulunan video, bariz bir sonraki adımdır. Gerçekten de geçen ay OpenAI'nin ön izlemesi yapıldı Sora adında yeni bir metinden videoya yapay zeka bu görenleri hayrete düşürdü.

Peki ya video...oyunlar?

Sor ve Al

Çevrimiçi olarak oldukça fazla sayıda oyun videosunun olduğu ortaya çıktı. Google DeepMind, yeni bir yapay zeka olan Genie'yi, oyuncuların basit platform oyunlarını (erken Nintendo oyunlarını düşünün) oynadığını gösteren 30,000 saatlik derlenmiş video görüntüleri üzerinde eğittiğini ve artık kendi örneklerini yaratabilir.

Genie, basit bir görüntüyü, fotoğrafı veya taslağı etkileşimli bir video oyununa dönüştürür.

Bir karakterin ve çevresinin çizimi gibi bir komut verildiğinde yapay zeka, bir karakteri kendi dünyasında hareket ettirmek için oyuncudan girdi alabilir. Bir blog yazısında DeepMind, Genie'nin 2 boyutlu manzaralarda gezindiğini, etrafta dolaştığını veya platformlar arasında atladığını gösterdi. Kuyruğunu yiyen bir yılan gibi, bu dünyalardan bazıları yapay zeka tarafından oluşturulan görüntülerden bile kaynaklandı.

Geleneksel video oyunlarının aksine Genie, bu etkileşimli dünyaları kare kare oluşturur. Hareket etme istemi ve komutu verildiğinde, en olası sonraki kareleri tahmin eder ve bunları anında oluşturur. Ön planın arka plandan daha hızlı hareket ettiği platform oyunlarında ortak bir özellik olan paralaks hissini bile eklemeyi öğrendi.

Özellikle yapay zekanın eğitiminde etiketler yer almıyordu. Bunun yerine Genie, eğitimindeki örnekleri gözlemleyerek giriş komutlarını (sola, sağa gitme veya atlama gibi) oyun içi hareketlerle ilişkilendirmeyi öğrendi. Yani, videodaki bir karakter sola doğru hareket ettiğinde komutu harekete bağlayan bir etiket yoktu. Genie bu kısmı kendi kendine çözdü. Bu, potansiyel olarak gelecekteki sürümlerin çevrimiçi olduğu kadar uygulanabilir videoyla eğitilebileceği anlamına gelir.

Yapay zeka, konseptin etkileyici bir kanıtıdır ancak henüz geliştirme aşamasındadır ve DeepMind henüz modeli halka açık hale getirmeyi planlamıyor.

Oyunların kendisi saniyede bir kare hızla akan pikselli dünyalardır. Karşılaştırıldığında, çağdaş video oyunları saniyede 60 veya 120 kareye ulaşabiliyor. Ayrıca tüm üretken algoritmalar gibi Genie de tuhaf veya tutarsız görsel eserler üretir. Aynı zamanda “gerçekçi olmayan gelecekler” halüsinasyonuna da eğilimlidir. ekip makalelerinde yapay zekayı tanımladı.

Bununla birlikte Genie'nin bundan sonra gelişeceğine inanmak için birkaç neden var.

Dünyaları Kamçılayan

Yapay zeka, etiketlenmemiş çevrimiçi videolardan öğrenebildiğinden ve hala küçük bir boyutta olduğundan (yalnızca 11 milyar parametre), ölçeği büyütmek için bolca fırsat var. Daha fazla bilgiyle eğitilen daha büyük modeller dramatik bir şekilde gelişme eğilimindedir. Ve bir Çıkarımlara odaklanan büyüyen endüstriEğitimli bir yapay zekanın resim veya metin oluşturmak gibi görevleri gerçekleştirdiği süreç, muhtemelen daha da hızlanacak.

DeepMind, Genie'nin profesyonel geliştiriciler gibi insanlara video oyunları yapma konusunda yardımcı olabileceğini söylüyor. Ancak Sora'nın videolardan daha fazlası olduğuna inanan OpenAI gibi ekip de daha büyük düşünüyor. Yaklaşım video oyunlarının çok ötesine geçebilir.

Bir örnek: Robotları kontrol edebilen yapay zeka. Ekip, çeşitli görevleri tamamlayan robotik kolların videosu üzerine ayrı bir model eğitti. Model, robotları manipüle etmeyi ve çeşitli nesneleri kullanmayı öğrendi.

DeepMind ayrıca Genie tarafından oluşturulan video oyunu ortamlarının yapay zeka ajanlarını eğitmek için kullanılabileceğini söyledi. Bu yeni bir strateji değil. 2021 tarihli bir makalede, başka bir DeepMind ekibi XLand adlı bir video oyununun ana hatlarını çizdi Burası yapay zeka ajanları ve onlara meydan okumak için görevler ve oyunlar üreten bir yapay zeka derebeyi tarafından dolduruluyordu. Yapay zekadaki bir sonraki büyük adımın, birbirini eğitebilen veya sentetik eğitim verileri üretebilen algoritmalar gerektireceği fikri, çekiş kazanıyor.

Tüm bunlar, OpenAI ile Google arasında yapay zekadaki ilerlemeyi göstermek için yapılan yoğun rekabetin son salvosu. Diğerleri sahadayken, Antropik gibi, GPT-4'e benzer çok modlu modeller geliştiriyor, Google ve OpenAI de dünyayı simüle eden algoritmalara odaklanmış görünüyor. Bu tür algoritmalar planlama ve etkileşimde daha iyi olabilir. Her ikisi de, her iki kuruluşun da üretmeye kararlı olduğu yapay zeka ajanları için çok önemli beceriler olacak.

Araştırmacılar, "Genie, gerçek dünya fotoğrafları veya eskizleri gibi daha önce hiç görmediği görüntülerle harekete geçirilebilir, bu da insanların hayal ettikleri sanal dünyalarla etkileşime girmesini sağlar ve esasen bir temel dünya modeli görevi görür" diye yazdı. Genie blog yazısı. “Biz odaklanıyoruz 2D platform oyunları ve robotik videoları ancak yöntemimiz geneldir ve her tür alan adı için çalışmalıdır ve giderek daha büyük internet veri kümelerine ölçeklenebilir."

Benzer şekilde OpenAI geçen ay Sora'nın ön izlemesini yaptığında araştırmacılar bunun daha temel bir şeyin habercisi olabileceğini öne sürdü: bir dünya simülatörü. Yani, her iki ekip de muazzam çevrimiçi video önbelleğini, yapay zekayı kendi videosunu oluşturması için eğitmenin bir yolu olarak görüyor, evet, ama aynı zamanda çevrimiçi veya çevrimdışı, dünyayı daha etkili bir şekilde anlamak ve faaliyet göstermek için.

Bunun temettü getirip getirmediği veya uzun vadede sürdürülebilir olup olmadığı açık bir sorudur. İnsan beyni bir ampulün gücüyle çalışır; Üretken yapay zeka tüm veri merkezlerini tüketiyor. Ancak şu anda sadece yapay zekayı geliştirmekle kalmayıp onu daha verimli hale getirmeyi amaçlayan yetenek, teknoloji, beyin ve nakit açısından mevcut güçleri hafife almamak en iyisidir.

Metin, görseller, ses ve bunların üçünde de etkileyici bir ilerleme gördük. Videolar tencereye atılacak bir sonraki malzemedir ve daha da güçlü bir demleme sağlayabilirler.

Resim Kredi: Google DeepMind

spot_img

En Son İstihbarat

spot_img