¡El nuevo modelo Gemini TTS de Google es increíble! Puede controlar directamente el género, el tono, la entonación, la pronunciación de una palabra y la edad del hablante a través de indicaciones. ¡Puedes controlar todo lo que se te ocurra, sin necesidad de cambiar a un modelo de voz independiente! ¡Mi aplicación de cómic interactivo con inteligencia artificial finalmente está completa! Utilice Nano Banana Pro para generar imágenes dinámicamente para cada escena y nuevos TTS para generar voces únicas para cada personaje.
Incluso cuando hablamos chino, todavía hay algunos viejos problemas, como algunos acentos extranjeros. Pero es mucho mejor que el TTS anterior para hablar chino. Ojalá puedan solucionar este extraño problema de tono con el mandarín.
He ajustado las indicacix.com/op7418/status/…o si antes sonaba mal: