Meta開源了一款支援1600種語言的ASR:Omnilingual ASR,幾個語音文字配對樣本即可零樣本擴展新語種 提供了SSL、CTC、LLM 三種架構,每種架構都給了300M到7B不等型號 CTC:速度快,最高96倍實時,適合批量轉寫 LLM:可零樣本識別,準確率高,78%的語言錯誤率低於10% SSL自監督模型:用於預訓練或特徵提取 #ASR #MetaOmnilingualASR
github:github.com/facebookresear…
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 2 条推文 · 2025年11月11日 01:37
Meta開源了一款支援1600種語言的ASR:Omnilingual ASR,幾個語音文字配對樣本即可零樣本擴展新語種 提供了SSL、CTC、LLM 三種架構,每種架構都給了300M到7B不等型號 CTC:速度快,最高96倍實時,適合批量轉寫 LLM:可零樣本識別,準確率高,78%的語言錯誤率低於10% SSL自監督模型:用於預訓練或特徵提取 #ASR #MetaOmnilingualASR
github:github.com/facebookresear…