RT @FeitengLi : Face au mur, le modèle #VoxCPM 1.5B TTS est excellent, prenant en charge une sortie audio de 44,1 kHz avec une qualité sonore de qualité professionnelle ; L'architecture globale du modèle fait également référence à DiTAR de ByteDance et constitue une variante standard GPT + FlowMatching/DiT, utilisant des représentations de codec continues pour compresser jusqu'à 6…
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.