샤오홍슈는 DeepEyesV2라는 멀티모달 모델을 출시했는데, 이 모델은 도구를 호출하는 기능을 갖추고 있습니다. 스스로 도구를 찾고, 이미지를 보고, 코드를 작성하고, 웹 페이지를 검색하고, 도구를 결합하여 복잡한 문제를 해결할 수 있습니다. 업무 적응형으로, 현재 업무의 특성에 따라 가장 적합한 도구를 지능적으로 선택할 수 있습니다. 또한 여러 도구를 결합하여 복잡한 문제를 해결할 수도 있습니다. 현재의 상황 정보를 토대로 도구를 호출할지 여부와 어떤 도구를 호출할지 선택적으로 결정할 수 있습니다. FVQA-test, MMSearch, SimpleVQA 및 기타 검색 모델에서 GPT-4o, Gemini 2.5 Pro 및 기타 검색 모델보다 우수한 성능을 보입니다. #딥아이즈V2 #에이전틱MLLM
깃허브: https://t.co/zoGLnLMTHo
