와, 이거 정말 멋지네요! EgoX: 모든 3인칭 클립에서 몰입감 넘치는 1인칭 비디오를 생성합니다. 기여 내용: • 본 논문에서는 사전 학습된 비디오 확산 모델을 효과적으로 활용하여 단일 외향적 비디오로부터 고화질의 자기중심적 비디오를 합성하는 새로운 프레임워크인 EgoX를 제안합니다. • 본 연구에서는 폭 방향 및 채널 방향 통합을 통해 외심적 비디오와 자기심적 사전 정보를 결합하는 통합 조건화 전략을 설계하여 견고한 기하학적 일관성과 고품질 생성을 달성합니다. • 본 연구에서는 시점과 관련된 영역에 선택적으로 초점을 맞추고 정확한 재구성을 향상시켜 더욱 일관성 있는 자기중심적 이미지 합성을 가능하게 하는 기하학적 기반의 자기주의적 주의 메커니즘과 깔끔한 잠재 표현을 도입합니다. • 광범위한 정성적 및 정량적 실험을 통해 EgoX가 기존 접근 방식을 크게 능가하며, 다양하고 까다로운 외인성-자신성 비디오 생성 벤치마크에서 최첨단 성능을 달성함을 입증했습니다.
논문 링크: arxiv.org/pdf/2512.08269 프로젝트: https://t.co/TthGwqAgBT



