모션에서 딥 가우시안: 가우시안 스플래팅을 위한 3D 기하학적 기초 모델 탐색 기여: • 포즈 없는 기초 모델 적응: 사전 계산된 포즈(부정확도의 영향을 받을 수 있음)에 의존하는 VGGT/MegaSAM과 달리, 본 파이프라인은 포즈 주석 없이 작동합니다. 이는 가우시안 기하 구조를 동적으로 개선하여 광도적 외관과 광선 일관성을 갖춘 새로운 뷰 합성을 일치시킴으로써 가능합니다. • 점진적이고 모듈화된 프레임워크 설계: 점진적인 설계는 반복적인 확장성을 가능하게 하여 VGGT 유사 파이프라인에서 나타나는 GPU 병목 현상을 해결합니다. 모듈화된 설계는 장면 다양성에 대한 견고성을 보장하여 고밀도 이미지 세트로 인한 메모리 제약에 관계없이 구성 요소를 개선할 수 있도록 합니다. • 장면별 가우시안 예측: 이 방법은 각 입력 장면에 대한 가우시안 기하학을 동적으로 예측하여 고품질 합성을 위해 고유한 광도 및 기하학적 특성에 적응합니다. 이러한 유연성은 입력을 덜 적응적으로 처리하는 VGGT/MegaSAM과 같은 피드포워드 방법에서는 덜 두드러집니다.
논문(pdf): https://t.co/YLwEAEIDqS



