Logo Zephyrnet

Ekspresi yang fleksibel dapat mengangkat wajah yang dihasilkan 3D dari lembah yang luar biasa

Tanggal:

Wajah yang dirender 3D adalah bagian besar dari film atau game utama mana pun sekarang, tetapi tugas untuk menangkap dan menganimasikannya secara alami bisa menjadi tugas yang sulit. Penelitian Disney sedang mencari cara untuk memuluskan proses ini, di antaranya adalah alat pembelajaran mesin yang membuatnya jauh lebih mudah untuk menghasilkan dan memanipulasi wajah 3D tanpa menyelam ke lembah yang luar biasa.

Tentu saja teknologi ini telah jauh dari ekspresi kayu dan detail terbatas di masa lalu. Wajah 3D dengan resolusi tinggi dan meyakinkan dapat dianimasikan dengan cepat dan baik, tetapi seluk-beluk ekspresi manusia bukan hanya variasi yang tidak terbatas, tetapi juga sangat mudah membuat kesalahan.

Pikirkan bagaimana seluruh wajah seseorang berubah saat mereka tersenyum - itu berbeda untuk setiap orang, tetapi ada cukup banyak kesamaan yang kita kira dapat kita ketahui ketika seseorang "benar-benar" tersenyum atau hanya berpura-pura. Bagaimana Anda bisa mencapai tingkat detail itu dalam wajah buatan?

Model "linier" yang ada menyederhanakan kehalusan ekspresi, membuat "kebahagiaan" atau "kemarahan" dapat disesuaikan dengan cermat, tetapi dengan mengorbankan keakuratannya - model tersebut tidak dapat mengekspresikan setiap kemungkinan wajah, tetapi dapat dengan mudah menghasilkan wajah yang mustahil. Model saraf yang lebih baru mempelajari kompleksitas dari mengamati keterkaitan ekspresi, tetapi seperti model lain cara kerjanya tidak jelas dan sulit dikendalikan, dan mungkin tidak dapat digeneralisasikan di luar wajah yang mereka pelajari. Mereka tidak memungkinkan tingkat kontrol yang dibutuhkan artis yang mengerjakan film atau game, atau menghasilkan wajah yang (manusia sangat pandai mendeteksi ini) hanya lepas entah bagaimana.

Sebuah tim di Disney Research mengusulkan model baru dengan yang terbaik dari kedua dunia - yang disebutnya "model wajah dalam semantik". Tanpa membahas eksekusi teknis yang tepat, peningkatan dasarnya adalah model saraf yang mempelajari bagaimana ekspresi wajah memengaruhi seluruh wajah, tetapi tidak spesifik untuk satu wajah - dan terlebih lagi nonlinier, memungkinkan fleksibilitas dalam cara ekspresi berinteraksi dengan geometri wajah dan satu sama lain.

Anggap saja seperti ini: Model linier memungkinkan Anda mengambil ekspresi (senyuman, atau ciuman, katakanlah) dari 0-100 pada wajah 3D apa pun, tetapi hasilnya mungkin tidak realistis. Model neural memungkinkan Anda mengambil ekspresi yang dipelajari dari 0-100 secara realistis, tetapi hanya pada bagian wajah yang mempelajarinya. Kredensial mikro model dapat mengambil ekspresi 0-100 dengan mulus pada semua wajah 3D. Itu adalah penyederhanaan yang berlebihan, tetapi Anda mengerti.

Semua wajah yang dihasilkan komputer mengasumsikan ekspresi serupa berturut-turut.

Gambar Kredit: Penelitian Disney

Hasilnya luar biasa: Anda dapat menghasilkan seribu wajah dengan berbagai bentuk dan nada, lalu menganimasikan semuanya dengan ekspresi yang sama tanpa usaha tambahan. Pikirkan bagaimana hal itu bisa menghasilkan kerumunan CG yang beragam yang bisa Anda panggil dengan beberapa klik, atau karakter dalam game yang memiliki ekspresi wajah yang realistis terlepas dari apakah itu dibuat dengan tangan atau tidak.

Ini bukan peluru perak, dan itu hanya bagian dari serangkaian perbaikan besar yang dilakukan seniman dan insinyur di berbagai industri tempat teknologi ini digunakan - pelacakan wajah tanpa penanda, deformasi kulit yang lebih baik, gerakan mata yang realistis, dan lusinan bidang minat lainnya juga. bagian penting dari proses ini.

Makalah Penelitian Disney dipresentasikan pada Konferensi Internasional tentang Visi 3D; Anda bisa membaca seluruhnya di sini.

Sumber: https://techcrunch.com/2020/11/25/flexible-expressions-could-lift-3d-generated-faces-out-of-the-uncanny-valley/

tempat_img

Intelijen Terbaru

tempat_img

Hubungi kami

Hai, yang di sana! Apa yang bisa saya bantu?