Motion4D: 4D 장면 이해를 위한 3D 일관성 모션 및 의미론 학습 기여: • 본 연구에서는 기초 모델의 2D 사전 확률을 동적 3D 가우시안 스플래팅 표현으로 통합하는 모델인 Motion4D를 제안합니다. 이를 통해 단안 영상에서 일관된 동작 및 의미론적 모델링을 구현할 수 있습니다. • 우리는 다음으로 구성된 2부분으로 구성된 반복 최적화 프레임워크를 설계합니다. - 순차적 최적화는 로컬 일관성을 유지하기 위해 연속적인 단계로 동작 및 의미 필드를 업데이트합니다. - 모든 속성을 공동으로 개선하여 장기적인 일관성을 보장하는 글로벌 최적화. • 3D 신뢰도 맵과 적응형 리샘플링을 사용한 반복적 동작 개선을 도입하여 동적 장면 재구성을 향상시키고, SAM2를 통한 반복적 업데이트를 통해 2D 의미적 불일치를 수정하는 의미적 개선을 도입합니다. • Motion4D는 비디오 객체 분할, 포인트 기반 추적, 새로운 뷰 합성 등의 작업에서 2D 기초 모델과 기존 3D 방법보다 훨씬 뛰어난 성능을 발휘합니다.
논문: httarxiv.org/abs/2512.03601로젝트: https://t.co/SEmM7IIDB5



