X (Twitter)

Crear audiolibros o podcasts requiere dar voz a diferentes personajes, pero pedir ayuda a amigos es demasiado engorroso, y hacerlo uno mismo dificulta transmitir la sensación de varios personajes. Casualmente, encontré en GitHub la herramienta de código abierto VibeVoiceFusion, que puede generar aplicaciones web de síntesis de voz para varias personas con un solo clic. Basado en el modelo Microsoft VibeVoice, proporciona una interfaz visual intuitiva para gestionar locutores, editar diálogos y generar voz. GitHub: https://t.co/1sJTCY7Stg Además, permite cargar audio de referencia, clonar voces con un solo clic, conservar el timbre único de diferentes hablantes y admite flujos de trabajo en chino/inglés. Al mismo tiempo, se ha optimizado profundamente para la memoria de vídeo, con un mínimo de 6 GB de memoria de vídeo, lo que permite ejecutarlo y utilizarlo en la mayoría de los ordenadores de la gente. Ofrece una opción de despliegue de Docker con un solo clic, o bien, puedes instalarlo manualmente en tu máquina local. Es fácil de configurar y usar, y además incluye una guía de usuario detallada.

Hilo de GitHubDaily (@GitHub_Daily)

Información del autor

Contenido del hilo