Mona Lisa EMO Sayesinde Artık Konuşabiliyor

Alibaba Group Akıllı Bilgi İşlem Enstitüsü'ndeki araştırmacılar, portrelere hayat veren, EMO: Emote Portrait Alive olarak bilinen bir yapay zeka aracı geliştirdi.

Araç, kullanıcıların hareketsiz bir görüntüye ses ve video eklemesine olanak tanır. Bu aracı kullanarak, ünlü Leonardo da Vinci'nin, daha çok Mona Lisa olarak bilinen La Gioconda'sı gibi eski bir portreyle oynayabilir, kafa pozları, hareketler, yüz ifadeleri ve doğru dudak senkronizasyonu ile onun konuşmasını ve şarkı söylemesini sağlayabilirsiniz.

Etkileyici ses odaklı portre-video oluşturma aracı

"EMO: Canlı Portre Portresi: Zayıf Koşullar Altında Audio2Video Difüzyon Modeli ile Etkileyici Portre Videoları Oluşturmak" başlıklı raporlarında araştırmacılar yeni araçları, işlevleri ve mükemmel sonuçlar için nasıl kullanılacağı hakkında fikir verin.

Etkileyici ses odaklı portre oluşturma yapay zeka aracıyla kullanıcılar, yüz ifadeleriyle vokal avatar videoları oluşturabiliyor. Araştırmacılara göre araç, "giriş sesinin uzunluğuna bağlı olarak" herhangi bir uzunlukta video oluşturmalarına olanak tanıyor.

Araştırmacılar, "Tek bir karakter görüntüsü ve şarkı söylemek gibi bir vokal sesi girin; yöntemimiz, etkileyici yüz ifadeleri ve çeşitli kafa pozları ile vokal avatar videoları üretebilir" dedi.

"Metodumuz çeşitli dillerdeki şarkıları destekliyor ve çeşitli portre tarzlarına hayat veriyor. Sesteki ton değişimlerini sezgisel olarak algılayarak dinamik, ifade açısından zengin avatarların oluşturulmasını sağlıyor."

Ayrıca okuyun: OpenAI, New York Times'ın ChatGPT'yi Telif Hakkı Davası Geliştirmek İçin "Hacklediğini" İddia Ediyor

Bir portreden konuşmak, şarkı söylemek

Araştırmacılara göre yapay zeka destekli araç yalnızca müziği işlemekle kalmıyor, aynı zamanda farklı dillerdeki konuşma seslerini de barındırıyor.

Araştırmacılar, "Ayrıca, yöntemimiz geçmiş çağlardan portreleri, tabloları ve hem 3 boyutlu modelleri hem de yapay zeka tarafından oluşturulan içeriği canlandırarak bunlara gerçekçi hareket ve gerçekçilik katma yeteneğine sahip" dedi.

Ama bu burada bitmedi. Kullanıcılar ayrıca çeşitli tarzlarda ve dillerde monologlar veya performanslar sunan film yıldızlarının portreleri ve görüntüleri ile de oynayabilirler.

X platformunu benimseyen bazı yapay zeka meraklıları bunu "akıllara durgunluk veren" olarak nitelendirdi.

2. Mona Lisa Shakespeare'le konuşuyor pic.twitter.com/26k29aAz1P

— Min Choi (@minchoi) Şubat 28, 2024

Gerçek ve yapay zeka arasındaki sınır inceliyor

EMO aracıyla ilgili haberler Alibaba teknoloji firmaları yeni ürünler piyasaya sürdükçe diğer kullanıcılara yapay zeka ile gerçeklik arasındaki sınırın ortadan kalkmak üzere olduğunu düşündürdü.

"Yapay zeka ile gerçek arasındaki fark her zamankinden daha ince" Ruben gönderildi diğerleri düşünürken X hakkında Tik tak yakında kreasyonlarla dolup taşacak.

“İlk defa bu kadar kesin ve gerçekçi bir sonuç görüyorum. Video yapay zekası bu yıl güvenilir olacağa benziyor” dedi Paul Gizli.

Diğerleri bunun yaratıcılar için oyunun kurallarını değiştirebileceğini düşünürken Min Choi de bu konuda temkinli davranıyor.

“Umarım sadece yaratıcı şeyler için. Bu yanlış ellerde tehlikeli olabilir.”

Mona Lisa EMO Sayesinde Artık Konuşabiliyor

aracı kullanma

Süreci açıklayan araştırmacılar, EMO çerçevesinin iki aşaması olduğunu vurguladı; ilki Çerçeve Kodlaması olarak biliniyordu; burada ReferenceNet, referans görüntülerden ve hareket çerçevelerinden özellikler çıkarmak için kullanılıyordu.

Bir sonraki aşama, önceden eğitilmiş bir ses kodlayıcının "ses yerleştirmeyi işlediği" Difüzyon Süreci aşamasıdır. Mükemmel yüz görüntüleri oluşturmak için kullanıcılar yüz bölgesi maskelerini ve çoklu çerçeve gürültüsünü entegre ediyor.

Açıklamanın bir bölümünde "Bu mekanizmalar sırasıyla karakterin kimliğini korumak ve karakterin hareketlerini modüle etmek için gereklidir" deniyor.

"Ek olarak, Zamansal Modüller, zamansal boyutu değiştirmek ve hız hareketini ayarlamak için kullanılıyor."

SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
PlatoData.Network Dikey Üretken Yapay Zeka. Kendine güç ver. Buradan Erişin.
PlatoAiStream. Web3 Zekası. Bilgi Genişletildi. Buradan Erişin.
PlatoESG. karbon, temiz teknoloji, Enerji, Çevre, Güneş, Atık Yönetimi. Buradan Erişin.
PlatoSağlık. Biyoteknoloji ve Klinik Araştırmalar Zekası. Buradan Erişin.
Kaynak: https://metanews.com/the-mona-lisa-can-now-talk-thanks-to-emo/

Üretken Veri Zekası

Mona Lisa EMO Sayesinde Artık Konuşabiliyor

Etkileyici ses odaklı portre-video oluşturma aracı

Bir portreden konuşmak, şarkı söylemek

Gerçek ve yapay zeka arasındaki sınır inceliyor

aracı kullanma

Kripto Para Satın Almadan Önce Piyasa Duyarlılığı Nasıl Değerlendirilir?

Rainbet ve Kripto Kumarhaneleri: Grubun Liderleri

En Son İstihbarat

Bitcoin Kan Banyosu: Kripto Analisti %8 Fiyat Düşüşünden Sonra 'Ölüm Haçı'nı Tespit Etti

AIEMP Yenilikçi Yapay Zeka Güvenlik Projesinin Başlatıldığını Duyurdu

Binance'in SEC'e karşı savunmasına Mango Markets davası yardımcı olabilir

Birleşik Krallık kolluk kuvvetlerine suçlularla bağlantılı dijital varlıkları ele geçirme ve yok etme konusunda yeni yetkiler verildi

DOGE'nin listedeki konumu meme paralarına olan ilgiyi canlı tutuyor

Pantera Capital'in Fonu V, Çeşitli Blockchain Yatırımları İçin 1 Milyar Dolar Hedefliyor