Logo Zephyrnet

Biểu cảm linh hoạt có thể nâng các khuôn mặt được tạo 3D ra khỏi thung lũng kỳ lạ

Ngày:

Khuôn mặt được kết xuất 3D là một phần quan trọng của bất kỳ bộ phim hoặc trò chơi lớn nào hiện nay, nhưng nhiệm vụ chụp và tạo hoạt ảnh cho chúng theo cách tự nhiên có thể là một nhiệm vụ khó khăn. Nghiên cứu của Disney đang nỗ lực tìm cách để thực hiện quá trình này suôn sẻ, trong số đó có một công cụ máy học giúp dễ dàng hơn nhiều để tạo và thao tác các khuôn mặt 3D mà không cần nhúng vào thung lũng kỳ lạ.

Tất nhiên, công nghệ này đã có một chặng đường dài so với những biểu hiện bằng gỗ và những chi tiết hạn chế của những ngày trước đó. Các khuôn mặt 3D có độ phân giải cao, thuyết phục có thể được làm hoạt hình nhanh chóng và tốt, nhưng sự tinh tế trong biểu cảm của con người không chỉ là vô hạn về sự đa dạng mà chúng rất dễ sai.

Hãy nghĩ xem toàn bộ khuôn mặt của ai đó thay đổi như thế nào khi họ cười - điều này là khác nhau đối với mọi người, nhưng có đủ điểm tương đồng mà chúng ta tưởng tượng rằng chúng ta có thể biết khi nào ai đó đang "thực sự" đang cười hay chỉ là giả. Làm thế nào bạn có thể đạt được mức độ chi tiết đó trong một khuôn mặt nhân tạo?

Các mô hình “tuyến tính” hiện tại đơn giản hóa sự tinh tế của biểu hiện, làm cho “hạnh phúc” hoặc “tức giận” có thể điều chỉnh một cách nhỏ nhất, nhưng với cái giá phải trả là độ chính xác - chúng không thể diễn tả mọi mặt có thể, nhưng có thể dễ dàng dẫn đến những mặt không thể. Các mô hình nơ-ron mới hơn học được sự phức tạp từ việc xem tính liên kết của các biểu thức, nhưng giống như các mô hình khác, hoạt động của chúng rất khó kiểm soát và khó kiểm soát, và có lẽ không thể khái quát được ngoài các mặt mà chúng đã học được. Chúng không kích hoạt mức độ kiểm soát mà một nghệ sĩ làm việc trên phim hoặc trò chơi cần, hoặc dẫn đến những khuôn mặt (con người rất giỏi trong việc phát hiện điều này). off bằng cách nào đó.

Một nhóm tại Disney Research đề xuất một mô hình mới với những gì tốt nhất của cả hai thế giới - cái mà nó gọi là “mô hình khuôn mặt sâu sắc về ngữ nghĩa”. Nếu không đi vào thực thi kỹ thuật chính xác, cải tiến cơ bản là đó là một mô hình thần kinh học cách biểu cảm khuôn mặt ảnh hưởng đến toàn bộ khuôn mặt, nhưng không cụ thể đối với một khuôn mặt - và hơn nữa là phi tuyến tính, cho phép sự linh hoạt trong cách biểu cảm tương tác với hình học của khuôn mặt và của nhau.

Hãy nghĩ về nó theo cách này: Mô hình tuyến tính cho phép bạn chụp một biểu cảm (nụ cười hoặc nụ hôn, nói) từ 0-100 trên bất kỳ khuôn mặt 3D nào, nhưng kết quả có thể không thực tế. Mô hình thần kinh cho phép bạn thực hiện một biểu thức đã học từ 0-100 một cách thực tế, nhưng chỉ trên mặt mà nó học được từ đó. T mô hình có thể thực hiện một cách mượt mà từ 0-100 trên bất kỳ khuôn mặt 3D nào. Đó là một cái gì đó của sự đơn giản hóa quá mức, nhưng bạn sẽ hiểu.

Tất cả các khuôn mặt do máy tính tạo ra đều giả định các biểu thức tương tự trong một hàng.

Tín dụng hình ảnh: Nghiên cứu của Disney

Kết quả rất mạnh mẽ: Bạn có thể tạo ra hàng nghìn khuôn mặt với các hình dạng và tông màu khác nhau, sau đó tạo hoạt ảnh cho tất cả chúng với các biểu cảm giống nhau mà không cần phải làm gì thêm. Hãy nghĩ xem điều đó có thể dẫn đến đám đông CG đa dạng như thế nào mà bạn có thể triệu tập chỉ bằng một vài cú nhấp chuột hoặc các nhân vật trong trò chơi có biểu cảm khuôn mặt thực tế bất kể họ có được làm thủ công hay không.

Nó không phải là một viên đạn bạc và nó chỉ là một phần của một loạt các cải tiến lớn mà các nghệ sĩ và kỹ sư đang thực hiện trong các ngành khác nhau nơi công nghệ này được sử dụng - theo dõi khuôn mặt không dấu, biến dạng da tốt hơn, chuyển động mắt thực tế và hàng chục lĩnh vực quan tâm khác cũng các phần quan trọng của quá trình này.

Bài báo Nghiên cứu của Disney đã được trình bày tại Hội nghị Quốc tế về Tầm nhìn 3D; bạn có thể đọc toàn bộ Ở đây.

Nguồn: https://techcrunch.com/2020/11/25/flexible-expressions-could-lift-3d-generated-faces-out-of-the-uncanny-valley/

tại chỗ_img

Tin tức mới nhất

tại chỗ_img

Trò chuyện trực tiếp với chúng tôi (chat)

Chào bạn! Làm thế nào để tôi giúp bạn?