RT @FeitengLi: De frente para a parede, o modelo #VoxCPM 1.5B TTS é excelente, suportando saída de áudio de 44,1kHz com qualidade de som de nível comercial; A arquitetura geral do modelo também faz referência ao DiTAR da ByteDance e é uma variante padrão de GPT + FlowMatching/DiT, usando representações de codecs contínuos para comprimir até 6…
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.