La version « Banana » de NVIDIA : NVIDIA a publié en open source un modèle de retouche d'images basé sur la physique : ChronoEdit-14B. Il génère une image physiquement précise en 4 secondes à partir d'une image statique et d'une phrase. ChronoEdit possède un « sens du temps » et un « bon sens physique ». Il peut comprendre des actions, comme « pousser » ou « ramasser », et peut dessiner à quoi le monde devrait ressembler après l'action, en se basant sur ses connaissances physiques acquises. Le processus de retouche d'image se déroule en 8 étapes, avec environ une image prise toutes les 4 secondes sur un écran H100. D'après les résultats, l'appareil possède une excellente capacité à prédire les conséquences des actions. Après un changement de posture, la cohérence du personnage, de ses vêtements et du style de l'arrière-plan est bien préservée, et les effets de lumière et de reflet sont gérés de manière logique. Il peut être utilisé dans le développement de jeux vidéo, les effets spéciaux de films, la formation de robots et d'autres domaines. #ChronoEdit #Retouche d'images par IA
github:github.com/nv-tlabs/Chron… HF:huggingface.co/nvidia/ChronoE…