La versión de NVIDIA de "Banana": NVIDIA ha liberado como código abierto un modelo de edición de imágenes basado en la física: ChronoEdit-14B. Genera una imagen físicamente precisa en 4 segundos utilizando una imagen estática y una frase. ChronoEdit posee un "sentido del tiempo" y un "sentido común físico". Puede comprender acciones, como "empujar" o "recoger", y puede dibujar cómo debería verse el mundo después de que ocurra la acción, basándose en su conocimiento físico aprendido. Un proceso de edición de imágenes se completa en 8 pasos, con aproximadamente una imagen tomada cada 4 segundos en una pantalla H100. A juzgar por los resultados, el dispositivo tiene una gran capacidad para predecir el resultado de las acciones. Tras el cambio de postura, la coherencia del personaje, la vestimenta y el estilo del fondo se mantiene intacta, y los efectos de iluminación y reflejo se gestionan de forma lógica. Puede utilizarse en el desarrollo de videojuegos, efectos especiales cinematográficos, entrenamiento de robots y otros escenarios. #ChronoEdit #EdiciónDeImágenesConIA
github:github.com/nv-tlabs/Chron… HF:huggingface.co/nvidia/ChronoE…