Meta開源了一款支援1600種語言的ASR:Omnilingual ASR,幾個語音文字配對樣本即可零樣本擴展新語種 提供了SSL、CTC、LLM 三種架構,每種架構都給了300M到7B不等型號 CTC:速度快,最高96倍實時,適合批量轉寫 LLM:可零樣本識別,準確率高,78%的語言錯誤率低於10% SSL自監督模型:用於預訓練或特徵提取 #ASR #MetaOmnilingualASR
github:github.com/facebookresear…
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 2 則推文 · 2025年11月11日 凌晨1:37
Meta開源了一款支援1600種語言的ASR:Omnilingual ASR,幾個語音文字配對樣本即可零樣本擴展新語種 提供了SSL、CTC、LLM 三種架構,每種架構都給了300M到7B不等型號 CTC:速度快,最高96倍實時,適合批量轉寫 LLM:可零樣本識別,準確率高,78%的語言錯誤率低於10% SSL自監督模型:用於預訓練或特徵提取 #ASR #MetaOmnilingualASR
github:github.com/facebookresear…