新影片上線-256K上下文+超低價格!小米MiMo-V2-Flash技術解讀+實測 MiMo V2 Flash 主打:混合注意力(SWA + GA 5:1) 專門為了長文檔、Agent、多步驟推理去做極致“又快又省” DeepSeek V3.2 已經夠便宜了,但MiMo-V2-Flash 在價格上還能再往下捲一層。 在我簡單體驗: 純粹知識問答和程式碼能力,它不如體量更大的開源SOTA 模型; 但在長上下文、輕量任務、工具呼叫這些場景裡,加上價格和速度因素,整體性價比非常能打。 完整影片🧵
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
