[開源推薦] MLX-Audio Studio: 開源UI 工具,專為音訊生成和處理設計。基於MLX-Audio 庫開發,支援Apple Silicon 設備,允許用戶在本地輕鬆生成和轉錄音頻,支援多種後端選項,包括MLX-Audio、Transformers 或其他如OpenAI 的服務。 核心功能· 音頻生成與轉錄:提供TTS 和STT 功能,使用者可以透過簡單介面輸入文字產生音頻,或上傳音頻檔案進行轉錄。 · 多後端支援:靈活整合不同框架,使用者可選擇本地MLX-Audio 模型或其他外部API,實現自訂音訊處理。 · 使用者介面設計:現代化的Web 介面,支援暗黑模式,包含模型選擇、速度/音調/音量調節、長文字處理和音訊播放器。介面直觀,包括歷史記錄、設定和API 存取入口。 · 擴展性:未來將增加更多任務,如語音複製或高級編輯,增強音訊應用的多樣性。 再看看MLX-Audio 核心功能· 高效推理:利用MLX 框架在Apple Silicon 上原生運行,提供快速生成和處理,支援8 位元量化以減少記憶體佔用和提升速度。 · 多語言支援:預設支援美式英語和英式英語,可透過可選依賴擴展到日語和普通話。 · 語音客製化:內建多種語音預設(如af_heart、af_nova、bf_emma),並支援速度調節(0.5x 到2.0x)。 · 使用者介面與API:包含現代Web UI(搭配3D 音訊視覺化、檔案上傳和回放),以及基於FastAPI 的REST API(相容於OpenAI 風格的TTS 和STT 介面)。 · 檔案管理:產生的檔案預設儲存到~/.mlx_audio/outputs 目錄,支援直接在Finder 或Explorer 中開啟。 · Swift 整合:提供mlx-swift-audio 套件,用於macOS 和iOS 上的原生TTS,支援串流產生和原始PCM 輸出。 · 其他特性:支援語音克隆(透過參考音訊)、即時音訊區塊生成,以及可選的串流處理和量化選項。 開源位址
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
![[開源推薦] MLX-Audio Studio: 開源UI 工具,專為音訊生成和處理設計。基於MLX-Audio 庫開發,支援Apple Silicon 設備,允許用戶在本地輕鬆生成和轉錄音頻,支援多種後端選項,包括MLX-Audio、Tr](https://pbs.twimg.com/media/G5NDzALbIAElcQB.jpg)