阿里新開源了主打超長上下文+記憶管理的模型:QwenLong-L1.5,表現較Qwen3-30B-A3B-Thinking平均提升9.9分 相當於可以把整本手冊、整本財報、法律條文一次丟進去,讓它跨章節問答、寫總結、抽條款 QwenLong-L1.5基於Qwen3-30B-A3B-Thinking構建,在此基礎上引入了記憶機制,使其可以處理遠超物理上下文視窗長度的任務 L1.5模型+長上下文推理與記憶管理的後訓練方案全套開源,這套方案統一了資料合成、訓練方法和智能體架構 #QwenLongL15 #長上下文模型
github:github.com/Tongyi-Zhiwen/…

