Meta剛剛最新開源了一個統一音訊分割模型:SAM Audio,主打一個可以像剪視訊一樣剪聲音 它可以透過文字、視覺和時間跨度提示,從音訊混合中分割出特定聲音,延續了Segment Anything的統一可提示分割的思想 比如說,用文字提示,敲個「狗叫聲」即可一鍵抽離;用視覺提示,在影片畫面裡點誰,就單獨提取誰的聲音 它有一個創新點是時間跨度提示,就是說可以只處理指定片段內的某個聲音 這三種提示可以單獨或疊加使用 SAM Audio對於音訊剪輯是個加持工具,凡是需要乾淨聲音或單獨聲軌的地方都能用,做短視頻/播客、音樂創作、影視後期、野生動物監測的等等 #AI音訊分割#SAMAudio
部落格about.fb.com/news/2025/12/o…o githugithub.com/facebookresear…1t