X (Twitter)

Meta剛剛最新開源了一個統一音訊分割模型：SAM Audio，主打一個可以像剪視訊一樣剪聲音它可以透過文字、視覺和時間跨度提示，從音訊混合中分割出特定聲音，延續了Segment Anything的統一可提示分割的思想比如說，用文字提示，敲個「狗叫聲」即可一鍵抽離；用視覺提示，在影片畫面裡點誰，就單獨提取誰的聲音它有一個創新點是時間跨度提示，就是說可以只處理指定片段內的某個聲音這三種提示可以單獨或疊加使用 SAM Audio對於音訊剪輯是個加持工具，凡是需要乾淨聲音或單獨聲軌的地方都能用，做短視頻/播客、音樂創作、影視後期、野生動物監測的等等 #AI音訊分割 #SAMAudio

部落格about.fb.com/news/2025/12/o…o githugithub.com/facebookresear…1t

來自 AIGCLINK（@aigclink）的推文串

作者資訊

推文串內容