엔비디아의 "바나나" 버전: 엔비디아는 물리 기반 이미지 편집 모델인 ChronoEdit-14B를 오픈소스로 공개했습니다. 이 모델은 정적 이미지와 문장을 추가하여 4초 만에 물리적으로 정확한 이미지를 생성합니다. 크로노에딧은 "시간 감각"과 "물리적 상식"을 가지고 있습니다. "밀어 넘기기"나 "줍기"와 같은 동작을 이해하고, 습득한 물리적 지식을 바탕으로 동작 후 세상이 어떻게 보일지 그려낼 수 있습니다. 이미지 편집 과정은 8단계로 완료되며, H100 화면에서 약 4초마다 한 장의 이미지가 촬영됩니다. 결과를 보면, 이 장치는 동작의 결과를 예측하는 능력이 뛰어납니다. 자세가 변경된 후에도 캐릭터, 의상, 배경 스타일의 일관성이 잘 유지되고, 조명 및 반사 효과도 논리적으로 처리됩니다. 게임 개발, 영화 특수 효과, 로봇 훈련 등 다양한 시나리오에 활용할 수 있습니다. #크로노에딧 #AI 이미지 편집
깃허브: htgithub.com/nv-tlabs/Chron…HF: huggingface.co/nvidia/ChronoE…