RT @FeitengLi: El modelo TTS #VoxCPM 1.5B de cara a la pared es excelente y admite una salida de audio de 44,1 kHz con una calidad de sonido de nivel comercial; La arquitectura general del modelo también hace referencia a DiTAR de ByteDance y es una variante estándar de GPT + FlowMatching/DiT, que utiliza representaciones de códecs continuos para comprimir hasta 6…
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.