X (Twitter)

Meta acaba de publicar el código abierto de un nuevo modelo unificado de segmentación de audio: SAM Audio, que tiene como objetivo cortar el audio como si fuera vídeo. Puede segmentar sonidos específicos de mezclas de audio utilizando señales textuales, visuales y temporales, continuando la filosofía de segmentación unificada basada en señales de Segment Anything. Por ejemplo, con indicaciones de texto, escribir "ladrido de perro" permite la extracción con un solo clic; con indicaciones visuales, hacer clic en un personaje en el cuadro de video extrae su voz. Una de sus características innovadoras son las señales de lapso de tiempo, lo que significa que puede procesar solo un sonido específico dentro de un segmento designado. Estas tres indicaciones se pueden utilizar individualmente o en combinación. SAM Audio es una poderosa herramienta para la edición de audio, útil para cualquier cosa que requiera un sonido limpio o una pista de audio separada, como videos/podcasts cortos, creación de música, posproducción de películas y televisión, monitoreo de vida silvestre y más. Segmentación de audio con IA #SAMAudio

Bloabout.fb.com/news/2025/12/o…6fo gitgithub.com/facebookresear…7iE1t

Hilo de AIGCLINK (@aigclink)

Información del autor

Contenido del hilo