Logo Zephyrnet

Một cuộc cách mạng về đồ họa máy tính đang đưa tính năng ghi hình thực tế 3D đến với đại chúng

Ngày:

Là một vũ khí chiến tranh, việc phá hủy các di sản văn hóa là một hành động phương pháp chung bởi những kẻ xâm lược có vũ trang nhằm tước đi bản sắc riêng biệt của một cộng đồng. Không có gì ngạc nhiên khi vào tháng 2022 năm XNUMX, khi quân đội Nga tràn vào Ukraine, các nhà sử học và chuyên gia di sản văn hóa đã chuẩn bị cho sự hủy diệt sắp tới. Cho đến nay trong Chiến tranh Nga-Ukraine, UNESCO đã xác nhận thiệt hại cho hàng trăm tòa nhà tôn giáo và lịch sử cũng như hàng chục di tích công cộng, thư viện và bảo tàng.

Trong khi các công nghệ mới như máy bay không người lái giá rẻ, 3D ininternet vệ tinh riêng có thể đang tạo ra một chiến trường rõ ràng của thế kỷ 21 xa lạ với quân đội thông thường, một bộ công nghệ khác đang tạo ra những khả năng mới cho các nhà lưu trữ công dân ở tuyến đầu để bảo tồn các di sản Ukraine.

Sao lưu Ukraine, một dự án hợp tác giữa Ủy ban Quốc gia UNESCO Đan Mạch và Polycam, một công cụ tạo 3D, cho phép bất kỳ ai chỉ trang bị điện thoại có thể quét và chụp các mô hình 3D chất lượng cao, chi tiết và chân thực về các di sản, một điều chỉ có thể thực hiện được với những địa điểm đắt tiền và nặng nề. thiết bị chỉ cách đây vài năm.

Theo Bilawal Sidhu, nhà công nghệ, nhà đầu tư thiên thần và cựu giám đốc sản phẩm của Google, người từng làm việc trên bản đồ 3D và AR/VR, Backup Ukraine là một biểu hiện đáng chú ý về tốc độ đáng kinh ngạc mà công nghệ đồ họa và chụp 3D đang phát triển.

“Các công nghệ nắm bắt thực tế đang trên một đường cong dân chủ hóa theo cấp số nhân đáng kinh ngạc,” anh ấy giải thích với tôi trong một cuộc phỏng vấn cho Trung tâm cá biệt.

Theo Sidhu, việc tạo nội dung 3D là có thể thực hiện được nhưng chỉ với các công cụ đắt tiền như máy ảnh DSLR, máy quét lidar và giấy phép phần mềm đắt tiền. Ông lấy ví dụ về công trình của CyArk, một tổ chức phi lợi nhuận được thành lập cách đây hai thập kỷ với mục đích sử dụng công nghệ chụp 3D chuyên nghiệp để bảo tồn di sản văn hóa trên toàn thế giới.

“Điều điên rồ và điều đã thay đổi là ngày nay tôi có thể làm tất cả những điều đó với chiếc iPhone trong túi của bạn,” anh nói.

Trong cuộc thảo luận của chúng tôi, Sidhu đã đặt ra ba xu hướng công nghệ riêng biệt nhưng có liên quan với nhau đang thúc đẩy sự phát triển này. Đầu tiên là giảm chi phí của các loại máy ảnh và cảm biến có thể chụp một vật thể hoặc không gian. Thứ hai là một loạt các kỹ thuật mới sử dụng trí tuệ nhân tạo để xây dựng nội dung 3D hoàn chỉnh. Và thứ ba là sự gia tăng sức mạnh tính toán, phần lớn được thúc đẩy bởi GPU, có khả năng hiển thị các đối tượng chuyên sâu về đồ họa trên các thiết bị được cung cấp rộng rãi cho người tiêu dùng.

Máy quét Lidar là một ví dụ về sự cải thiện hiệu suất giá cả của cảm biến. Lần đầu tiên được phổ biến rộng rãi dưới dạng cảm biến quay cồng kềnh trên xe tự lái và có giá ở mức hàng chục ngàn đô la, lidar đã ra mắt công nghệ tiêu dùng trên iPhone 12 Pro và Pro Max vào năm 2020. Khả năng quét không gian giống như cách những chiếc ô tô không người lái nhìn thế giới có nghĩa là đột nhiên bất kỳ ai cũng có thể nhanh chóng và rẻ tạo ra tài sản 3D chi tiết. Tuy nhiên, điều này vẫn chỉ dành cho những khách hàng giàu có nhất của Apple.

Một trong những bước ngoặt quan trọng nhất của ngành xảy ra cùng năm đó khi các nhà nghiên cứu tại Google giới thiệu trường bức xạ thần kinh, thường được gọi là NeRF.

Cách tiếp cận này sử dụng máy học để xây dựng mô hình 3D đáng tin cậy của một vật thể hoặc không gian từ hình ảnh hoặc video 2D. Theo Sidhu, mạng lưới thần kinh “gây ảo giác” về cách một cảnh 3D đầy đủ sẽ xuất hiện. Đó là một giải pháp để “tổng hợp chế độ xem”, một thách thức về đồ họa máy tính nhằm cho phép ai đó nhìn thấy không gian từ bất kỳ góc nhìn nào chỉ từ một vài hình ảnh nguồn.

“Vì vậy, thứ đó ra đời và mọi người nhận ra rằng giờ đây chúng tôi đã có được công nghệ tổng hợp chế độ xem hiện đại, hoạt động xuất sắc cho tất cả những thứ mà phép chụp ảnh đã gặp khó khăn như độ trong suốt, độ mờ và độ phản chiếu. Điều này thật điên rồ,” anh nói thêm.

Cộng đồng thị giác máy tính hướng sự phấn khích của họ vào các ứng dụng thương mại. Tại Google, Sidhu và nhóm của ông đã khám phá việc sử dụng công nghệ này để chế độ xem đắm chìm, phiên bản 3D của Google Maps. Đối với người dùng bình thường, sự phổ biến của các ứng dụng thân thiện với người tiêu dùng như độ sáng AI và những điều khác có nghĩa là bất kỳ ai chỉ có máy ảnh trên điện thoại thông minh đều có thể tạo ra nội dung 3D quang học. Việc tạo ra nội dung 3D chất lượng cao không còn bị giới hạn ở tầng lớp lidar của Apple.

Giờ đây, một phương pháp khác thậm chí còn hứa hẹn hơn để giải quyết tổng hợp khung nhìn đang thu hút sự chú ý cạnh tranh với sự phấn khích ban đầu của NeRF. Sự bắn tung tóe Gaussian là một kỹ thuật kết xuất bắt chước cách hình tam giác được sử dụng cho nội dung 3D truyền thống, nhưng thay vì hình tam giác, nó là một "dải" màu được biểu thị thông qua một hàm toán học được gọi là gaussian. Khi nhiều gaussian được xếp lớp với nhau, nội dung 3D có kết cấu và chi tiết cao sẽ hiển thị. Tốc độ áp dụng cho việc phân chia là đáng kinh ngạc để xem.

Chỉ mới được vài tháng nhưng demo đang tràn ngập X và cả Luma AI và Polycam đều đang cung cấp các công cụ để tạo ra các biểu tượng gaussian. Các nhà phát triển khác đang tìm cách tích hợp chúng vào các công cụ trò chơi truyền thống như Unity và Unreal. Các Splat cũng đang thu hút được sự chú ý từ ngành công nghiệp đồ họa máy tính truyền thống vì tốc độ kết xuất của chúng nhanh hơn NeRF và chúng có thể được chỉnh sửa theo những cách quen thuộc với các nghệ sĩ 3D. (NeRF không cho phép điều này vì chúng được tạo bởi mạng lưới thần kinh không thể giải mã được.)

Để có lời giải thích tuyệt vời về cách hoạt động của quá trình phân tách gaussian và lý do tại sao nó tạo ra tiếng vang, hãy xem video này từ Sidhu.

Bất kể chi tiết thế nào, đối với người tiêu dùng, chúng tôi quyết định rằng một chiếc điện thoại có thể tạo ra nội dung 3D tầm cỡ Hollywood mà cách đây không lâu chỉ có đội sản xuất được trang bị tốt mới có thể tạo ra.

Nhưng tại sao việc tạo ra 3D lại quan trọng?

Để đánh giá cao sự thay đổi hướng tới nội dung 3D, cần lưu ý rằng bối cảnh công nghệ đang hướng tới tương lai của “điện toán không gian”. Mặc dù các thuật ngữ được sử dụng quá mức như metaverse có thể khiến người xem phải đảo mắt, nhưng tinh thần cơ bản là sự thừa nhận rằng môi trường 3D, giống như những môi trường được sử dụng trong trò chơi điện tử, thế giới ảo và bản sao kỹ thuật số có vai trò to lớn trong tương lai của chúng ta. Nội dung 3D giống như nội dung do NeRF tạo ra và phân chia đã sẵn sàng trở thành nội dung mà chúng tôi sẽ tương tác trong tương lai.

Trong bối cảnh này, tham vọng quy mô lớn là niềm hy vọng về một Bản đồ 3D của thế giới. Mặc dù đã có sẵn các công cụ tạo bản đồ 3D tĩnh nhưng thách thức vẫn là tìm cách giữ cho những bản đồ đó luôn cập nhật với một thế giới luôn thay đổi.

“Có việc xây dựng mô hình thế giới và sau đó là việc duy trì mô hình thế giới đó. Với những phương pháp mà chúng ta đang nói đến, tôi nghĩ cuối cùng chúng ta có thể có công nghệ để giải quyết vấn đề 'duy trì mô hình' thông qua nguồn cung ứng từ cộng đồng,” Sidhu nói.

Các dự án như Chế độ xem chân thực của Google là những ví dụ điển hình ban đầu về tác động của việc này đối với người tiêu dùng. Mặc dù không suy đoán khi nào điều đó có thể xảy ra nhưng Sidhu đồng ý rằng đến một lúc nào đó, công nghệ sẽ tồn tại cho phép người dùng VR có thể đi bộ khắp mọi nơi trên Trái đất với trải nghiệm sống động, theo thời gian thực về những gì đang xảy ra ở đó. . Loại công nghệ này cũng sẽ tràn vào những nỗ lực trong dịch chuyển tức thời dựa trên hình đại diện”, các cuộc họp từ xa và các cuộc tụ họp xã hội khác.

Sidhu cho biết một lý do khác để phấn khích là khả năng ghi lại trí nhớ 3D. Ví dụ, Apple đang dựa rất nhiều vào ảnh và video 3D cho tai nghe thực tế hỗn hợp Vision Pro của họ. Ví dụ, Sidhu nói với tôi rằng gần đây anh ấy đã tạo ra một bản sao chất lượng cao của ngôi nhà của bố mẹ anh ấy trước khi họ chuyển đi. Sau đó, anh ấy có thể cho họ trải nghiệm đi bộ bên trong nó bằng thực tế ảo.

“Có cảm giác nội tạng khi được trở lại đó thật mạnh mẽ. Đây là lý do tại sao tôi rất lạc quan về Apple, bởi vì nếu họ thành công với định dạng phương tiện 3D này, đó sẽ là nơi mọi thứ có thể trở nên thú vị đối với những người bình thường.”

Từ nghệ thuật hang động đến tranh sơn dầu, động lực bảo tồn các khía cạnh của trải nghiệm giác quan của chúng ta mang tính nhân văn sâu sắc. Giống như nhiếp ảnh từng tập trung vào tĩnh vật như một phương tiện bảo tồn, các công cụ tạo 3D dường như sẵn sàng thay thế mối quan hệ lâu đời của chúng ta với hình ảnh và video 2D.

Tuy nhiên, cũng giống như nhiếp ảnh chỉ có thể hy vọng ghi lại được một phần nhỏ khoảnh khắc, các mô hình 3D không thể thay thế hoàn toàn mối quan hệ của chúng ta với thế giới vật chất. Tuy nhiên, đối với những người trải qua sự khủng khiếp của chiến tranh ở Ukraine, có lẽ đây là những bước phát triển đáng hoan nghênh mang đến một cách sống động hơn để bảo tồn những gì thực sự không bao giờ có thể thay thế được.

Ảnh: polycam

tại chỗ_img

Tin tức mới nhất

tại chỗ_img