Nvidia acaba de lanzar ChronoEdit-14B en Hugging Face Permite la edición de imágenes con reconocimiento de la física y la simulación del mundo condicionada a la acción mediante razonamiento temporal. Extrae información previa de un modelo generativo de vídeo preentrenado de 14 mil millones de parámetros y separa la inferencia en (i) una etapa de razonamiento de vídeo para la eliminación de ruido de trayectorias latentes y (ii) una etapa de edición en contexto para la poda de tokens de trayectoria. ChronoEdit-14B fue desarrollado por NVIDIA como parte de la familia de modelos fundamentales multimodales ChronoEdit.
Modelo:huggingface.co/nvidia/ChronoE…u
Aplichuggingface.co/spaces/nvidia/…cOA5Ecj
