X (Twitter)

Tencent acaba de lanzar una versión mejorada de su modelo de generación de canciones, SongBloom-2B, llamada songbloom_full_240s. Ahora admite la generación de música de hasta 4 minutos de duración. También lanzaron un marco de generación actualizado llamado SongBloom, que, según la introducción, es un modelo de difusión autorregresivo. La descripción oficial indica que posee tanto la precisión de un modelo de difusión como la escalabilidad de un modelo de lenguaje, y que su generación interna se expandirá gradualmente desde breves fragmentos musicales hasta piezas musicales completas. Este modelo requiere que la letra y el audio de referencia se introduzcan en un formato específico para replicar el estilo de la canción. También está publicado en mi espacio personal de Hugging Face. No hay espacio para demos, así que no tengo una forma sencilla de grabar una demo para todos. Quienes estén interesados pueden descargar el modelo y probarlo; al fin y al cabo, solo pesa 2 bytes y se puede ejecutar en una CPU. DIRECCIÓN:

Hilo de karminski-牙医 (@karminski3)

Información del autor

Contenido del hilo