美團剛剛開源了一款低延遲全模態大模型:LongCat-Flash-Omni,128K上下文+支援超8分鐘實時音視頻交互 能聽能看能說,毫秒級延遲,可以拿來搭建即時語音助理、直播彈幕機器人、影音質檢等 在OmniBench上超Gemini-2.5-Flash、Qwen3-Omni,接近Gemini 2.5 Pro;在MMBench與Gemini、GPT-4o、Qwen-VL相當;MVBench上超Gemini 2.5 Pro和GPT-4o 通用知識接近DeepSeek V3.1、Qwen3等 總參數560B,啟動27B,基於其LongCat-Flash的ScMoE 架構 #大模型#LongCatFlashOmni
github:github.com/meituan-longca… HF:huggingface.co/meituan-longca…
