제퍼넷 로고

컴퓨터 그래픽의 혁명으로 3D 현실 캡처가 대중화되고 있습니다.

시간

전쟁무기로서 문화유산을 파괴하는 것은 일반적인 방법 무장한 침략자들이 공동체의 고유한 정체성을 박탈합니다. 2022년 XNUMX월, 러시아군이 우크라이나를 휩쓸자 역사가들과 문화유산 전문가들이 다가올 파괴에 대비한 것은 놀라운 일이 아니었습니다. 지금까지 러시아-우크라이나 전쟁에서 유네스코는 확인 된 수백 개의 종교 및 역사적 건물과 수십 개의 공공 기념물, 도서관 및 박물관이 손상되었습니다.

다음과 같은 새로운 기술이 저가형 드론, 3D 인쇄개인 위성 인터넷 재래식 군대에 익숙하지 않은 뚜렷한 21세기 전장을 만들 수 있는 반면, 또 다른 일련의 기술은 우크라이나 문화유산을 보존하기 위해 최전선에 있는 시민 기록 보관인을 위한 새로운 가능성을 창출하고 있습니다.

백업 우크라이나덴마크 유네스코 국가 위원회와 3D 생성 도구인 Polycam의 공동 프로젝트를 통해 휴대전화만 있으면 누구든지 비싸고 부담스러운 작업을 통해서만 가능한 고품질의 상세하고 사실적인 유적지의 3D 모델을 스캔하고 캡처할 수 있습니다. 불과 몇년 전 장비.

기술 전문가이자 엔젤 투자자이자 3D 지도 및 AR/VR 분야에서 일했던 전 Google 제품 관리자인 Bilawal Sidhu에 따르면 Backup Ukraine는 3D 캡처 및 그래픽 기술이 발전하는 놀라운 속도를 눈에 띄게 표현한 것입니다.

"리얼리티 캡처 기술은 민주화의 엄청난 기하급수적 곡선 위에 있습니다."라고 그는 인터뷰에서 설명했습니다. 특이점 허브.

Sidhu에 따르면 3D 자산 생성은 가능했지만 DSLR 카메라, LiDAR 스캐너, 고가의 소프트웨어 라이센스와 같은 고가의 도구가 있어야만 가능했습니다. 그 예로 그는 다음과 같은 작품을 인용했다. 사이크는 전문가 수준의 3D 캡처 기술을 사용하여 전 세계 문화유산을 보존하려는 목적으로 XNUMX년 전에 설립된 비영리 단체입니다.

"미친 일이자 달라진 점은 이제 주머니에 있는 iPhone으로 모든 작업을 수행할 수 있다는 것입니다."라고 그는 말합니다.

토론에서 Sidhu는 이러한 발전을 주도하는 서로 다르지만 상호 연관된 세 가지 기술 동향을 제시했습니다. 첫째, 사물이나 공간을 포착할 수 있는 카메라와 센서 종류의 가격 하락이다. 두 번째는 완성된 3D 자산을 구성하기 위해 인공 지능을 활용하는 일련의 새로운 기술입니다. 세 번째는 소비자가 널리 사용할 수 있는 장치에서 그래픽 집약적인 개체를 렌더링할 수 있는 GPU에 의해 주로 구동되는 컴퓨팅 성능의 확산입니다.

Lidar 스캐너는 센서의 가격 대비 성능 향상을 보여주는 예입니다. 처음에는 자율주행차 위에 탑재되는 부피가 큰 회전 센서로 대중화되었으며, 수만 달러, LiDAR는 12년 iPhone 2020 Pro 및 Pro Max에서 소비자 기술 데뷔를 했습니다. 무인 자동차가 세상을 보는 것과 같은 방식으로 공간을 스캔하는 능력은 갑자기 누구나 빠르고 저렴하게 상세한 3D 자산을 생성합니다. 그러나 이는 여전히 가장 부유한 Apple 고객에게만 제공되었습니다.

업계에서 가장 중요한 전환점 중 하나는 같은 해에 Google의 연구원들이 발생했습니다. 소개 일반적으로 NeRF라고 불리는 신경 복사장.

이 접근 방식은 머신러닝을 사용하여 3D 사진이나 비디오에서 물체나 공간의 신뢰할 수 있는 2D 모델을 구축합니다.. Sidhu에 따르면 신경망은 전체 3D 장면이 어떻게 나타날지 "환각"합니다. 이는 단 몇 개의 소스 이미지만으로 어떤 관점에서든 공간을 볼 수 있도록 하는 컴퓨터 그래픽 문제인 "시점 합성"에 대한 솔루션입니다.

“그래서 그 작품이 나왔고 모두가 이제 사진 측량법이 투명성, 반투명도 및 반사율과 같이 어려움을 겪는 모든 항목에 훌륭하게 작동하는 최첨단 뷰 합성을 갖게 되었다는 것을 깨달았습니다. 이건 정말 미친 짓이다”고 덧붙였다.

컴퓨터 비전 커뮤니티는 그들의 흥분을 상용 애플리케이션에 집중시켰습니다. Google에서 Sidhu와 그의 팀은 다음과 같은 기술을 사용하여 탐색했습니다. 몰입형 뷰, Google 지도의 3D 버전입니다. 일반 사용자의 경우 다음과 같은 소비자 친화적인 애플리케이션이 확산되고 있습니다. 루마 AI 그리고 다른 사람들은 스마트폰 카메라만 있으면 누구나 사실적인 3D 자산을 만들 수 있다는 것을 의미했습니다. 고품질 3D 콘텐츠 제작은 더 이상 Apple의 LiDAR 엘리트에만 국한되지 않습니다.

이제 뷰 합성을 해결하는 잠재적으로 훨씬 더 유망한 또 다른 방법은 초기 NeRF의 흥분에 필적하는 관심을 끄는 것입니다. 가우스 스플래팅 방식을 모방하는 렌더링 기술입니다. 삼각형은 기존 3D 자산에 사용됩니다., 그러나 삼각형 대신 가우스라고 알려진 수학적 함수를 통해 표현된 색상의 "표시"입니다. 더 많은 가우스가 함께 계층화되면 매우 상세하고 질감이 있는 3D 자산이 표시됩니다. 스플래팅의 채택 속도는 놀라울 정도입니다.

몇달밖에 안됐지만 시민 X가 넘쳐나고 있으며 Luma AI와 Polycam은 모두 가우스 스플랫을 생성하는 도구를 제공하고 있습니다. 다른 개발자들은 이미 이를 Unity 및 Unreal과 같은 기존 게임 엔진에 통합하는 방법을 연구하고 있습니다. Splat은 NeRF보다 렌더링 속도가 빠르고 3D 아티스트에게 이미 익숙한 방식으로 편집할 수 있기 때문에 전통적인 컴퓨터 그래픽 산업에서도 주목을 받고 있습니다. (NeRF는 해독할 수 없는 신경망에 의해 생성되었기 때문에 이를 허용하지 않습니다.)

가우스 스플래팅의 작동 방식과 이것이 왜 화제를 불러일으키는지에 대한 자세한 설명은 다음을 참조하세요. Sidhu의 이 비디오.

세부 사항에 관계없이 소비자를 위해 우리는 얼마 전까지만 해도 잘 갖춰진 프로덕션 팀만이 제작할 수 있었던 헐리우드 수준의 3D 자산을 휴대폰으로 생성할 수 있는 순간에 확실히 와 있습니다.

그런데 3D 제작이 왜 중요한가요?

3D 콘텐츠로의 전환을 이해하려면 기술 환경이 "공간 컴퓨팅"의 미래를 지향하고 있다는 점에 주목할 필요가 있습니다. 메타버스와 같이 과도하게 사용되는 용어는 눈길을 끌 수 있지만, 기본 정신은 비디오 게임, 가상 세계 및 디지털 트윈에 사용되는 것과 같은 3D 환경이 미래에 큰 역할을 한다는 인식입니다. NeRFs 및 스플래팅에서 제작한 것과 같은 3D 자산은 미래에 우리가 접하게 될 콘텐츠가 될 준비가 되어 있습니다.

이러한 맥락에서 대규모 야망은 실시간 목표에 대한 희망입니다. 세계의 3D 지도. 정적 3D 지도를 생성하는 도구를 사용할 수 있지만, 끊임없이 변화하는 세계에 맞춰 이러한 지도를 최신 상태로 유지하는 방법을 찾는 것은 여전히 ​​과제입니다.

“세계의 모델을 구축하는 일이 있고, 그 다음에는 세계의 모델을 유지하는 일이 있습니다. 우리가 이야기하고 있는 이러한 방법을 통해 마침내 크라우드소싱을 통해 '모델 유지' 문제를 해결할 수 있는 기술을 갖게 될 것이라고 생각합니다.”라고 Sidhu는 말합니다.

Google의 Immersive View와 같은 프로젝트는 이것이 소비자에게 미치는 영향을 보여주는 좋은 초기 사례입니다. Sidhu는 이것이 언제 가능할지 추측하지는 않았지만 VR을 사용하는 사용자가 지구상 어느 곳이든 실시간으로 몰입감 넘치는 경험을 통해 그곳에서 일어나는 일을 경험할 수 있는 기술이 언젠가는 존재할 것이라는 데 동의했습니다. . 이러한 유형의 기술은 다음 분야의 노력에도 영향을 미칠 것입니다. 아바타 기반의 '순간이동',” 원격 회의 및 기타 사교 모임.

흥미로운 또 다른 이유는 3D 메모리 캡처라고 Sidhu는 말합니다. 예를 들어, Apple은 다음과 같은 방식으로 크게 기울고 있습니다. 3D 사진 및 비디오 Vision Pro 혼합 현실 헤드셋용입니다. 예를 들어 Sidhu는 최근 부모님이 이사하기 전에 부모님 집의 고품질 복제품을 만들었다고 말했습니다. 그런 다음 그는 가상 현실을 사용하여 그들에게 그 내부를 걷는 경험을 제공할 수 있었습니다.

“그곳으로 다시 돌아왔다는 본능적인 느낌을 갖는 것은 너무나 강력합니다. 이것이 바로 내가 Apple에 대해 매우 낙관적인 이유입니다. Apple이 이 3D 미디어 형식을 성공시킨다면 일반 사람들에게도 흥미를 불러일으킬 수 있기 때문입니다.”

동굴 예술에서 유화에 이르기까지 감각적 경험의 측면을 보존하려는 충동은 깊은 인간적입니다. 한때 사진이 보존 수단으로 정물화에 힘을 보탰던 것처럼, 3D 생성 도구는 우리의 오랜 관심을 2D 이미지와 비디오로 대체할 준비가 되어 있는 것처럼 보입니다.

그러나 사진이 시간의 극히 일부분만을 포착할 수 있는 것처럼 3D 모델은 실제 세계와 우리의 관계를 완전히 대체할 수 없습니다. 그럼에도 불구하고 우크라이나에서 전쟁의 공포를 경험하고 있는 사람들에게는 아마도 결코 대체될 수 없는 것을 보존할 수 있는 보다 몰입적인 방법을 제공하는 환영받는 발전일 것입니다.

이미지 신용 : 폴리 캠

spot_img

최신 인텔리전스

spot_img