Novo vídeo lançado – superando o TTS tradicional?! Experiência de TTS com falantes nativos de chinês da Gemini + modelos de palavras de sugestão Se você produz podcasts, audiolivros ou dublagens de vídeos curtos, o sintetizador de voz Gemini 2.5 é praticamente um divisor de águas. Testei em diversos cenários: Canções de ninar para crianças, com emoções tão delicadas que parecem estar contando uma história. O monólogo dramático e cheio de suspense, especialmente a frase "Você terá pesadelos com isso por uma semana" — é tão vívido! Os comentários sobre esports, os gritos de triunfo em viradas incríveis com vitórias do tipo 1 contra 4, o ritmo estava perfeitamente sincronizado. Um restaurante aberto até tarde da noite, repleto do calor da vida cotidiana, com senhores idosos jogando xadrez e trocando brincadeiras espirituosas. Eu desmontei o aparelho no vídeo: Como escrever prompts, como controlar emoções/ritmo/personagens e os efeitos práticos em chinês. Para quem cria conteúdo de áudio, vale a pena dedicar 10 minutos para dar uma olhada. Vídeo completo: 🧵
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
