X (Twitter)

阿里新開源了主打超長上下文+記憶管理的模型：QwenLong-L1.5，表現較Qwen3-30B-A3B-Thinking平均提升9.9分相當於可以把整本手冊、整本財報、法律條文一次丟進去，讓它跨章節問答、寫總結、抽條款 QwenLong-L1.5基於Qwen3-30B-A3B-Thinking構建，在此基礎上引入了記憶機制，使其可以處理遠超物理上下文視窗長度的任務 L1.5模型+長上下文推理與記憶管理的後訓練方案全套開源，這套方案統一了資料合成、訓練方法和智能體架構 #QwenLongL15 #長上下文模型

github：github.com/Tongyi-Zhiwen/…

來自 AIGCLINK（@aigclink）的推文串

作者資訊

推文串內容