Logo Zephyrnet

Le espressioni flessibili potrebbero sollevare i volti generati in 3D fuori dalla valle misteriosa

Data:

I volti renderizzati in 3D sono una parte importante di qualsiasi film o gioco importante oggi, ma il compito di catturarli e animarli in modo naturale può essere difficile. Ricerca Disney sta lavorando su modi per semplificare questo processo, tra cui uno strumento di apprendimento automatico che lo rende possibile molto più semplice generare e manipolare volti 3D senza tuffarsi nella valle misteriosa.

Naturalmente questa tecnologia ha fatto molta strada dalle espressioni in legno e dai dettagli limitati dei tempi passati. I volti 3D convincenti e ad alta risoluzione possono essere animati rapidamente e bene, ma le sottigliezze dell'espressione umana non sono solo illimitate nella varietà, ma sono molto facili da sbagliare.

Pensa a come cambia l'intero viso di qualcuno quando sorride: è diverso per tutti, ma ci sono abbastanza somiglianze che immaginiamo di poter dire quando qualcuno sta "veramente" sorridendo o sta semplicemente fingendo. Come si può raggiungere quel livello di dettaglio in un volto artificiale?

I modelli “lineari” esistenti semplificano la sottigliezza dell’espressione, rendendo la “felicità” o la “rabbia” minuziosamente regolabili, ma a scapito della precisione: non possono esprimere ogni volto possibile, ma possono facilmente risultare in volti impossibili. I modelli neurali più recenti apprendono la complessità osservando l’interconnessione delle espressioni, ma come altri modelli simili il loro funzionamento è oscuro e difficile da controllare, e forse non generalizzabile al di là dei volti da cui hanno imparato. Non consentono il livello di controllo di cui ha bisogno un artista che lavora su un film o su un gioco, né danno origine a volti che (gli esseri umani sono straordinariamente bravi a rilevarlo) sono semplicemente MENO in qualche modo.

Un team della Disney Research propone un nuovo modello con il meglio di entrambi i mondi: quello che chiama un “modello semantico del volto profondo”. Senza entrare nell'esatta esecuzione tecnica, il miglioramento fondamentale è che si tratta di un modello neurale che apprende come un'espressione facciale influisce sull'intero viso, ma non è specifico per un singolo viso - e inoltre non è lineare, consentendo flessibilità nel modo in cui le espressioni interagiscono con un la geometria del viso e l'uno con l'altro.

Pensala in questo modo: un modello lineare ti consente di acquisire un'espressione (ad esempio un sorriso o un bacio) da 0 a 100 su qualsiasi volto 3D, ma i risultati potrebbero non essere realistici. Un modello neurale ti consente di acquisire realisticamente un'espressione appresa da 0 a 100, ma solo sul viso da cui l'ha appresa. La sezione il modello può assumere un'espressione compresa tra 0 e 100 senza problemi su qualsiasi volto 3D. È una semplificazione eccessiva, ma hai capito l'idea.

I volti generati dal computer assumono tutti espressioni simili di seguito.

Crediti immagine: Ricerca Disney

I risultati sono potenti: potresti generare migliaia di volti con forme e tonalità diverse e poi animarli tutti con le stesse espressioni senza alcun lavoro aggiuntivo. Pensa a come ciò potrebbe portare a diverse folle di CG che puoi evocare con un paio di clic o personaggi di giochi con espressioni facciali realistiche indipendentemente dal fatto che siano stati realizzati a mano o meno.

Non è una soluzione miracolosa, ma è solo una parte di un vasto insieme di miglioramenti che artisti e ingegneri stanno apportando nei vari settori in cui viene impiegata questa tecnologia: tracciamento del volto senza marcatori, migliore deformazione della pelle, movimenti oculari realistici e decine di altre aree di interesse sono anche parti importanti di questo processo.

Il documento della Disney Research è stato presentato alla Conferenza internazionale sulla visione 3D; puoi leggere tutto qui.

Fonte: https://techcrunch.com/2020/11/25/flexible-expressions-could-lift-3d-generated-faces-out-of-the-uncanny-valley/

spot_img

L'ultima intelligenza

spot_img