대화형 비디오는 저에게 마법같은 경험이었고, 세계 최고의 팀 중 하나가 그것에 대해 어떻게 생각하는지에 대한 정말 멋진 연습이었습니다. LLM/VLM을 넘어서는 모달리티의 실제 디자인 패턴(Distribution Transformer는 좋은 읽을거리라고 언급됨) 또한 저는 박사 학위를 취득하면서 비전에 대한 관심이 늘 있었고, 다음과 같은 매우 흥미로운 비전 연구 질문이 많이 나왔습니다. - 대화형 동안 동적으로/조건부로 동작 정의 - 장기적인 관점에서의 일관성 - 결정론적 객체를 대화형 비디오 세계로 가져오는 방법
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.