Nvidia vient de publier ChronoEdit-14B sur Hugging Face ChronoEdit-14B permet l'édition d'images prenant en compte la physique et la simulation du monde conditionnée par l'action grâce au raisonnement temporel. Il extrait des informations a priori d'un modèle génératif vidéo pré-entraîné à 14 milliards de paramètres et sépare l'inférence en (i) une étape de raisonnement vidéo pour le débruitage des trajectoires latentes et (ii) une étape d'édition contextuelle pour l'élagage des éléments de trajectoire superflus. ChronoEdit-14B a été développé par NVIDIA et fait partie de la famille de modèles multimodaux de base ChronoEdit.
Modèle huggingface.co/nvidia/ChronoE…lu
applihuggingface.co/spaces/nvidia/…7OcOA5Ecj
