O modelo em grande escala da Sam Audio com faixas de áudio separadas foi testado! Esta análise apresenta o novo modelo de áudio Sam da Meta. Este modelo de grande porte consegue segmentar faixas de áudio e está disponível nas versões 10B e 30B. Testei a versão 10B, que apresenta bom desempenho na segmentação de música pop, mas tem dificuldades com músicas complexas, como sinfonias ou peças com muitos harmônicos. A qualidade do áudio separado também é mediana. O modelo só consegue separar duas faixas por vez; portanto, para áudio multitrack, você pode enviar a primeira faixa separada de volta para o modelo para processamento adicional. Além disso, a versão 30B tem um desempenho muito melhor, mas requer 90 GB de memória de vídeo no pico para processar 30 segundos de música; uma quantidade menor seria melhor. #SAMAudio #Meta
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.