Meta は、ビデオのようにオーディオをカットすることを目的とした新しい統合オーディオ セグメンテーション モデル、SAM Audio をオープンソース化しました。 Segment Anything の統合されたキューベースのセグメンテーション哲学を継承し、テキスト、ビジュアル、および時間的なキューを使用してオーディオ ミックスから特定のサウンドをセグメント化できます。 たとえば、テキスト プロンプトでは、「犬の吠え声」と入力するとワンクリックで抽出できます。ビジュアル プロンプトでは、ビデオ フレーム内の文字をクリックするとその音声が抽出されます。 その革新的な機能の 1 つは、指定されたセグメント内の特定のサウンドのみを処理できることを意味するタイムスパン キューです。 これら 3 つのプロンプトは、個別に使用することも、組み合わせて使用することもできます。 SAM Audio は、短いビデオやポッドキャスト、音楽制作、映画やテレビのポストプロダクション、野生生物のモニタリングなど、クリーンなサウンドや個別のオーディオ トラックを必要とするあらゆる用途に役立つ、強力なオーディオ編集ツールです。 #AIオーディオセグメンテーション#SAMAudio
ブログabout.fb.com/news/2025/12/o…fo ギットハブgithub.com/facebookresear…1t