Alibabaは、超ロングコンテキストとメモリ管理を特徴とする新しいオープンソースモデルQwenLong-L1.5をリリースしました。そのパフォーマンスは、Qwen3-30B-A3B-Thinkingと比較して平均9.9ポイント向上しています。 まるで、マニュアル全体、完全な財務報告書、法的条項をすべて一度に入れて、章間の Q&A を処理し、要約を作成し、条項を抽出できるようなものです。 QwenLong-L1.5 は Qwen3-30B-A3B-Thinking をベースに構築されており、物理的なコンテキスト ウィンドウの長さをはるかに超えるタスクを処理できるようにするメモリ メカニズムを導入しています。 長期コンテキスト推論とメモリ管理、データ合成、トレーニング方法、エージェント アーキテクチャの統合を備えた、トレーニング後の L1.5 モデル向けの完全なオープン ソース ソリューションです。 #QwenLongL15 #LongContextModel
ギットハブ: github.com/Tongyi-Zhiwen/…

