小紅書發的一款具備工具呼叫能力的多模態模型:DeepEyesV2,會自己找工具用,能看圖、寫程式碼、搜尋網頁、組合工具解決複雜問題 任務自適應,可以根據當前任務性質智慧選擇最合適的工具;也可以組合多個工具進行解決複雜問題 可以根據當前上下文訊息,選擇性的決定是否需要呼叫工具以及呼叫哪個工具 在FVQA-test、MMSearch、SimpleVQA上超GPT-4o、Gemini 2.5 Pro,以及其他搜尋模型 #DeepEyesV2 #AgenticMLLM
github:github.com/Visual-Agent/D…
