Zephyrnet Logosu

Bu Robot Ne Zaman Gülümseyeceğinizi Tahmin Ediyor, Sonra İşaret Sırasında Sırıtıyor

Tarih:

Komedi kulüpleri en sevdiğim hafta sonu gezileridir. Birkaç arkadaşınızı bir araya toplayın, birkaç içki alın ve hepimize bir şaka geldiğinde, gözlerimizin buluştuğu büyülü bir an olur ve arsız bir şekilde sırıtırız.

Gülümsemek yabancıları en yakın arkadaşlara dönüştürebilir. Teşvik eder tanış-sevimli Hollywood entrikalar çevirir, bozulan ilişkileri onarır ve belirsiz, sıcak neşe duygularıyla ayrılmaz bir şekilde bağlantılıdır.

En azından insanlar için. Robotların gerçek gülümseme çabaları genellikle tekinsiz vadiye düşüyor; insana benzeyecek kadar yakın ama biraz tedirginlik yaratıyor. Mantıksal olarak ne yapmaya çalıştıklarını biliyorsun. Ama içgüdüsel hisler sana bir şeylerin doğru olmadığını söylüyor.

Zamanlamadan dolayı olabilir. Robotlar, gülümsemenin yüz ifadesini taklit edecek şekilde eğitilmiştir. Ama sırıtmayı ne zaman açacaklarını bilmiyorlar. İnsanlar bağlantı kurduğunda, herhangi bir bilinçli planlama olmaksızın, gerçekten birlikte gülümseriz. Robotların, bir gülümsemeyi yeniden oluşturmak için kişinin yüz ifadelerini analiz etmesi zaman alır. Bir insanın milisaniyelik bir gecikme bile tüylerini diken diken eder; tıpkı bir korku filmi gibi, bir şeyler manipülatif ve yanlış gelir.

Geçen hafta Columbia Üniversitesi'nden bir ekip bir algoritma gösterdi robotlara insan operatörleriyle gülümsemeyi paylaşmayı öğretiyor. Yapay zeka, operatörlerin ifadelerini gerçekleşmeden yaklaşık 800 milisaniye önce tahmin etmek için yüzdeki hafif değişiklikleri analiz ediyor; bu, robotun sırıtmasına yetecek kadar bir süre.

Ekip, insan arkadaşının ifadelerini önceden tahmin edip eşleştirmek için Emo adı verilen yumuşak bir robotik insansı yüzü eğitti. Mavi renkli silikon yüzüyle Emo, 60'ların bilim kurgu uzaylısına benziyor. Ancak insan partneriyle birlikte aynı "duygusal" dalga boyunda kolayca sırıttı.

İnsansı robotlar, insanlarla iletişim kurarken genellikle hantal ve yapmacıktır. yazdı Araştırmada yer almayan Glasgow Üniversitesi'nden Dr. Rachael Jack. ChatGPT ve diğer büyük dil algoritmaları zaten bir yapay zekanın konuşmasını insani bir sese dönüştürebiliyor ancak sözlü olmayan iletişimlerin kopyalanması zor.

Sosyal becerilerin (en azından yüz ifadesi için) fiziksel robotlara programlanmasının, "sosyal robotların insanların sosyal dünyasına katılmasına" yardımcı olma yolunda ilk adım olduğunu yazdı.

Hood altında

Konum robotaksis size yiyecek ve içecek getiren robot sunuculara, otonom robotlar giderek hayatımıza giriyor.

Londra, New York, Münih ve Seul'de özerk robotlar Check-in yapma, kapı bulma veya kayıp bagajı alma gibi müşteri hizmetleri sunarak kaotik havalimanlarında hızla ilerleyin. Singapur'da 360 derecelik görüşe sahip iki metre uzunluğunda birkaç robot bir havaalanında dolaşmak Potansiyel güvenlik sorunlarını işaretleme. Pandemi sırasında, robot köpekler sosyal mesafeyi zorunlu kıldı.

Ancak robotlar daha fazlasını yapabilir. Yıkılan evlerin veya köprülerin enkazını temizlemek gibi tehlikeli işler için kurtarma çalışmalarına öncülük edebilir ve ilk müdahale ekiplerinin güvenliğini artırabilirler. Giderek yaşlanan küresel nüfusla birlikte hemşirelerin yaşlıları desteklemesine yardımcı olabilirler.

akım insansı robotlar karikatürize edilmiş derecede sevimliler. Ancak robotların dünyamıza girmesinin ana unsuru güvendir. Bilim insanları giderek insana benzeyen yüzlere sahip robotlar yaptıkça, onların ifadelerinin de beklentilerimizle eşleşmesini istiyoruz. Bu sadece bir yüz ifadesini taklit etmekle ilgili değil. Utanç verici bir şaka üzerine samimi bir şekilde paylaşılan "evet biliyorum" gülümsemesi bir bağ oluşturur.

Sözsüz iletişimler (ifadeler, el hareketleri, vücut duruşları) kendimizi ifade etmek için kullandığımız araçlardır. ChatGPT ve diğerleri ile üretken yapay zeka, makineler zaten "görüntülü ve sözlü olarak iletişim kurabiliyor" şuraya çalışmanın yazarı Dr. Hod Lipson Bilim.

Ancak iş, bir bakışın, bir göz kırpmanın ve bir gülümsemenin büyük fark yaratabileceği gerçek dünyaya gelince, "şu anda eksik olan bir kanal" dedi Lipson. “Yanlış zamanda gülümsemek geri tepebilir. [Birkaç milisaniye bile geç olsa bile], sanki dalkavukluk yapıyormuşsunuz gibi geliyor.”

Peynir Say

Ekip, robotları sözsüz eyleme geçirmek için tek bir noktaya odaklandı: ortak bir gülümseme. Önceki çalışmalarda bir gülümsemeyi taklit edecek şekilde önceden programlanmış robotlar vardı. Ancak kendiliğinden olmadıkları için hafif ama fark edilir bir gecikmeye neden olur ve sırıtışın sahte görünmesine neden olur.

Lipson, "Sözsüz iletişimde ölçülmesi zor pek çok şey var" dedi. "Fotoğraf çekerken 'peynir' demek zorunda kalmamızın nedeni, istendiğinde gülümsemenin aslında oldukça zor olmasıdır."

Yeni çalışma zamanlamaya odaklandı.

Ekip, bir kişinin gülümsemesini tahmin eden ve insan benzeri bir animatronik yüzün birlikte sırıtmasını sağlayan bir algoritma tasarladı. Emo adı verilen robotik yüz, esnek bir silikon "deri" ile sarılmış 26 dişliye (yapay kasları düşünün) sahiptir. Her dişli, kaşlarını, gözlerini, ağzını ve boynunu hareket ettirmek için ana robotik “iskelete” mıknatıslarla tutturulmuştur. Emo'nun gözleri, çevresini kaydetmek ve göz küresi hareketlerini ve göz kırpma hareketlerini kontrol etmek için yerleşik kameralara sahiptir.

Emo kendi yüz ifadelerini tek başına takip edebiliyor. Yeni çalışmanın amacı başkalarının duygularını yorumlamaya yardımcı olmaktı. Ekip, her içe dönük gencin bileceği bir numara kullandı: Emo'dan aynaya bakmasını ve dişlilerini nasıl kontrol edeceğini ve gülümseme gibi mükemmel bir yüz ifadesini nasıl oluşturacağını öğrenmesini istediler. Robot yavaş yavaş ifadelerini motor komutlarıyla eşleştirmeyi öğrendi; örneğin "yanakları kaldır." Ekip daha sonra yüzü çok fazla gerebilecek ve robotun silikon cildine zarar verebilecek tüm programları kaldırdı.

“Görünen o ki… gülümseyebilen bir robot yüzü yapmak, mekanik açıdan inanılmaz derecede zorlayıcıydı. Robotik bir el yapmaktan daha zor” dedi Lipson. “Gerçek olmayan gülümsemeleri tespit etmekte çok iyiyiz. Dolayısıyla bu konuda çok hassasız."

Ekip, tekinsiz vadiyi ortadan kaldırmak için Emo'yu, insanların gülen, şaşıran, kaşlarını çatan, ağlayan ve diğer ifadeleri gösteren videoları kullanarak yüz hareketlerini tahmin edecek şekilde eğitti. Duygular evrenseldir: Gülümsediğinizde ağzınızın köşeleri hilal şeklinde kıvrılır. Ağladığında kaşlar çatılır.

Yapay zeka, her sahnedeki yüz hareketlerini kare kare analiz etti. Gözler, ağız ve diğer "yüz işaretleri" arasındaki mesafeleri ölçerek belirli bir duyguya karşılık gelen işaretler buldu; örneğin, ağzınızın köşesinin yukarı kalkması bir gülümsemeye işaret ederken, aşağı doğru bir hareket gülümsemeye işaret edebilir. kaşlarını çatmak.

Yapay zekanın eğitildikten sonra bu yüz işaretlerini tanıması bir saniyeden kısa sürdü. Robotun yüzü, Emo'ya güç verirken insan etkileşimlerine dayalı bir gülümsemeyi bir saniye içinde tahmin edebildi ve böylece katılımcısıyla birlikte sırıttı.

Açık olmak gerekirse yapay zeka "hissetmiyor". Aksine, komik bir stand-up'a gerçek gibi görünen bir gülümsemeyle kıkırdayan bir insan gibi davranıyor.

İnsanlarla etkileşimde bulunurken fark ettiğimiz tek işaret yüz ifadeleri değildir. Hafif baş sallamalar, baş sallamalar, kaldırılmış kaşlar veya el hareketleri bir iz bırakır. Kültürlerden bağımsız olarak, "hımm", "ahh" ve "beğeniler" veya bunların eşdeğerleri günlük etkileşimlere entegre edilmiştir. Emo şimdilik gülümsemeyi öğrenen bir bebek gibi. Henüz diğer bağlamları anlamıyor.

"Daha gidilecek çok yer var" şuraya Lipson. Yapay zeka için sözsüz iletişimin sadece yüzeyini çiziyoruz. Ancak "ChatGPT ile etkileşime geçmenin ilginç olduğunu düşünüyorsanız, bu şeylerin fiziksel hale gelmesini ve tüm bahislerin kapanmasını bekleyin."

Resim Kredi: Yuhang Hu, Columbia Mühendisliği, YouTube aracılığıyla

spot_img

En Son İstihbarat

spot_img