Criar audiolivros ou podcasts exige dar voz a diferentes personagens, mas pedir ajuda aos amigos é muito trabalhoso, e fazer tudo sozinho dificulta transmitir as emoções de vários personagens. Por coincidência, encontrei a ferramenta de código aberto VibeVoiceFusion no GitHub, que consegue gerar aplicações web de síntese de voz para várias pessoas com um único clique. Baseado no modelo Microsoft VibeVoice, ele fornece uma interface visual intuitiva para gerenciar falantes, editar diálogos e gerar fala. GitHub: https://t.co/1sJTCY7Stg Além disso, permite o carregamento de áudio de referência, a clonagem de vozes com um clique, a preservação do timbre único de diferentes falantes e oferece suporte a fluxos de trabalho em chinês e inglês. Ao mesmo tempo, foi profundamente otimizado para memória de vídeo, com um mínimo de 6 GB de memória de vídeo, o que permite que seja executado e usado na maioria dos computadores. Oferece uma opção de implantação do Docker com um clique, ou você pode instalá-lo manualmente em sua máquina local. É fácil de configurar e usar, e também inclui um guia do usuário detalhado.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.



