NVIDIA版「バナナ」:NVIDIAは物理ベースの画像編集モデル「ChronoEdit-14B」をオープンソース化しました。静止画像と文章を追加するだけで、わずか4秒で物理的に正確な画像を生成します。 クロノエディットは「時間感覚」と「物理的な常識」を持ちます。「倒す」「拾う」といった動作を理解し、学習した物理的な知識に基づいて、動作後の世界の姿を描写することができます。 画像編集プロセスは 8 つのステップで完了し、H100 画面では約 4 秒ごとに 1 枚の画像が撮影されます。 結果から判断すると、このデバイスは行動の結果を予測する能力が非常に高いことが分かります。姿勢を変えた後も、キャラクター、服装、背景のスタイルの一貫性が良好に保たれ、照明や反射効果も論理的に処理されています。 ゲーム開発、映画の特殊効果、ロボットのトレーニングなどのシナリオで使用できます。 #ChronoEdit #AI画像編集
github:github.com/nv-tlabs/Chron… HF:huggingface.co/nvidia/ChronoE…