RT @FeitengLi: 面壁#VoxCPM 1.5B TTS 模型是極佳的,支援輸出44.1kHZ 音訊達到商用等級音質; 整體模型架構也參考了位元組DiTAR,也是標準GPT + FlowMatching/DiT 變體,使用連續Codec 表徵壓縮到低至6…
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年12月11日 清晨7:19
RT @FeitengLi: 面壁#VoxCPM 1.5B TTS 模型是極佳的,支援輸出44.1kHZ 音訊達到商用等級音質; 整體模型架構也參考了位元組DiTAR,也是標準GPT + FlowMatching/DiT 變體,使用連續Codec 表徵壓縮到低至6…