Le nouveau modèle Gemini TTS de Google est incroyable ! Vous pouvez contrôler directement le sexe, le ton, l'intonation, la prononciation des mots et l'âge de l'orateur grâce à des instructions. Vous pouvez contrôler tout ce que vous pouvez imaginer, sans avoir besoin de passer à un modèle vocal différent ! Mon application de bande dessinée interactive basée sur l'IA est enfin terminée ! Utilisez Nano Banana Pro pour générer dynamiquement des images pour chaque scène, et la nouvelle synthèse vocale pour générer des voix uniques pour chaque personnage.
Même en parlant chinois, certains problèmes anciens persistent, comme certains accents étrangers. Mais c'est bien mieux que la synthèse vocale précédente pour le chinois. Espérons qu'ils pourront corriger ce problème de tonalité étrange avec le mandarin.
J'ai modifié les invitesx.com/op7418/status/…us semblait incorrect auparavant :