製作有聲書或播客,需要為不同角色配上不同的聲音,找朋友又怕麻煩人家,自己配又很難演出多個角色的感覺。 無獨有偶,在GitHub 上找到了VibeVoiceFusion 這個開源工具,可以一鍵產生多人說話語音合成的Web 應用。 基於微軟VibeVoice 模型,提供了直覺的視覺化介面來管理說話者、編輯對話和生成語音。 GitHub:https://t.co/1sJTCY7Stg 除此之外,也支援上傳參考音頻,一鍵複製聲音,保留不同說話者的獨特音色,支援中/英工作流程。 同時針對顯存做了深度優化,最低6GB 顯存,大部分人的電腦都能運作使用。 提供了Docker 一鍵部署方式,也可以在本機手動安裝,簡單配置即可使用,還有詳細的使用指南。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。



