谷歌新的Gemini TTS 模型太屌了! 直接可以透過提示詞控制說話者的性別、語調、語調、某個字的發音、年齡。 你能想到的都能控制,根本不需要切換單獨的語音模型! 我的AI 互動漫劇應用終於完全體了! 使用Nano Banana Pro動態地產生每個場景的圖片,以及新的TTS來產生每個角色的獨特的語音。
是說中文的時候,還是有一些老問題,就是有些外國口音。 但是比以前的TTS說中文好多了。希望他們能把普通話這個詭異的音調問題修復一下。
透過提示詞調整了一下,剛才聽著有問題的再試試:
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 3 条推文 · 2025年12月12日 14:07
谷歌新的Gemini TTS 模型太屌了! 直接可以透過提示詞控制說話者的性別、語調、語調、某個字的發音、年齡。 你能想到的都能控制,根本不需要切換單獨的語音模型! 我的AI 互動漫劇應用終於完全體了! 使用Nano Banana Pro動態地產生每個場景的圖片,以及新的TTS來產生每個角色的獨特的語音。
是說中文的時候,還是有一些老問題,就是有些外國口音。 但是比以前的TTS說中文好多了。希望他們能把普通話這個詭異的音調問題修復一下。
透過提示詞調整了一下,剛才聽著有問題的再試試: