阿里剛剛又發布了新模型Qwen3-Omni-Flash-20251201 這是Qwen3-Omni-Flash 的更新版本, 這個模型是個所謂的"全模態"模型, 可以接受文本,語音,圖片,視頻輸入, 然後可以輸出文本和語音. 特別適合用在端側設備上, 輔助通用任務的執行. 我能想到的比如各種無人場景都可以, 比如無人導購, 無人前台等等. 具體性能提升的話, 看官方評測各個方向的benchmark都有2%-10%的提升, 也算不小了. 在用舊版本的同學可以考慮直接無縫遷移了. 目前官方還沒放出這個模型的文件. 可能需要等等.
核心特性
更新總結








