¡Está bien, esto es realmente genial! EgoX: Genera videos inmersivos en primera persona a partir de cualquier clip en tercera persona Contribuciones: • Proponemos un nuevo marco, EgoX, para sintetizar video egocéntrico de alta fidelidad a partir de un único video exocéntrico explotando de manera efectiva modelos de difusión de video preentrenados. • Diseñamos una estrategia de condicionamiento unificado que combina video exocéntrico y priores egocéntricos a través de la integración a lo ancho y a lo ancho del canal, logrando una consistencia geométrica robusta y una generación de alta calidad. • Introducimos autoatención guiada por geometría y representaciones latentes limpias que se centran selectivamente en regiones relevantes para la vista y mejoran la reconstrucción precisa, lo que conduce a una síntesis egocéntrica más coherente. • Amplios experimentos cualitativos y cuantitativos demuestran que EgoX supera los enfoques anteriores por un amplio margen, logrando un rendimiento de última generación en diversos y desafiantes puntos de referencia de generación de video exo-a-ego.
Documenarxiv.org/pdf/2512.0826981nu Proykeh0t0.github.io/EgoX/wqAgBT



