X (Twitter)

Tencent vient de publier une version améliorée de son modèle de génération de chansons, SongBloom-2B, appelée songbloom_full_240s ! Elle prend désormais en charge la génération de musique d'une durée maximale de 4 minutes. Ils ont également publié une version mise à jour de son framework de génération, SongBloom, qui, d'après l'introduction, est un modèle de diffusion autorégressif. La description officielle indique qu'il combine la précision d'un modèle de diffusion et l'évolutivité d'un modèle de langage, et que sa génération interne s'étendra progressivement de courts fragments musicaux à des œuvres complètes. Ce modèle nécessite l'entrée des paroles et d'un fichier audio de référence dans un format spécifique afin de reproduire le style de la chanson. Il est également disponible sur mon espace personnel Huggingface. N'ayant pas d'espace de démonstration, il m'est difficile d'en enregistrer une pour tous. Les personnes intéressées peuvent télécharger le modèle et l'essayer elles-mêmes ; après tout, il ne pèse que 2 octets et fonctionne sur un processeur. adresse:

Fil de karminski-牙医 (@karminski3)

Informations sur l'auteur

Contenu du fil