O novo modelo Gemini TTS do Google é incrível! Você pode controlar diretamente o gênero, o tom, a entonação, a pronúncia de uma palavra e a idade do locutor por meio de comandos. Você pode controlar tudo o que imaginar, sem precisar trocar para um modelo de voz diferente! Meu aplicativo de quadrinhos interativos com IA está finalmente concluído! Use o Nano Banana Pro para gerar imagens dinamicamente para cada cena e um novo sistema de síntese de voz (TTS) para gerar vozes exclusivas para cada personagem.
Mesmo ao falar chinês, ainda existem alguns problemas antigos, como certos sotaques estrangeiros. Mas é muito melhor do que o TTS anterior para falar chinês. Espero que consigam corrigir esse problema estranho de tom com o mandarim.
Ajustei as instruções; tx.com/op7418/status/…estranho antes: