X (Twitter)

Meta は、ビデオのようにオーディオをカットすることを目的とした新しい統合オーディオセグメンテーションモデル、SAM Audio をオープンソース化しました。 Segment Anything の統合されたキューベースのセグメンテーション哲学を継承し、テキスト、ビジュアル、および時間的なキューを使用してオーディオミックスから特定のサウンドをセグメント化できます。たとえば、テキストプロンプトでは、「犬の吠え声」と入力するとワンクリックで抽出できます。ビジュアルプロンプトでは、ビデオフレーム内の文字をクリックするとその音声が抽出されます。その革新的な機能の 1 つは、指定されたセグメント内の特定のサウンドのみを処理できることを意味するタイムスパンキューです。これら 3 つのプロンプトは、個別に使用することも、組み合わせて使用することもできます。 SAM Audio は、短いビデオやポッドキャスト、音楽制作、映画やテレビのポストプロダクション、野生生物のモニタリングなど、クリーンなサウンドや個別のオーディオトラックを必要とするあらゆる用途に役立つ、強力なオーディオ編集ツールです。 #AIオーディオセグメンテーション #SAMAudio

ブログabout.fb.com/news/2025/12/o…fo ギットハブgithub.com/facebookresear…1t

AIGCLINK（@aigclink）のスレッド

作者情報

スレッド内容