Meta vient de publier en open source un nouveau modèle unifié de segmentation audio : SAM Audio, qui vise à découper l’audio comme on découpe la vidéo. Il peut segmenter des sons spécifiques à partir de mixages audio en utilisant des indices textuels, visuels et temporels, perpétuant ainsi la philosophie de segmentation unifiée basée sur des indices de Segment Anything. Par exemple, avec des invites textuelles, taper « aboiement de chien » permet une extraction en un clic ; avec des invites visuelles, cliquer sur un personnage dans le cadre vidéo extrait sa voix. L'une de ses caractéristiques innovantes réside dans les repères temporels, ce qui lui permet de traiter uniquement un son spécifique au sein d'un segment désigné. Ces trois invites peuvent être utilisées individuellement ou en combinaison. SAM Audio est un outil puissant de montage audio, utile pour tout ce qui nécessite un son clair ou une piste audio séparée, comme les courtes vidéos/podcasts, la création musicale, la post-production cinématographique et télévisuelle, la surveillance de la faune sauvage, et bien plus encore. #Segmentation audio par IA #SAMAudio
Bloabout.fb.com/news/2025/12/o…K6fo gigithub.com/facebookresear…Fz7iE1t