11Labs 推出Scribe v2 Realtime 即時AI語音模型 - 小於150毫秒延遲全球最高精度 - 支援90多種語言 - 在即時性+ 多語言準確度上領先目前頂尖模型 - 自動辨識說話的起止,精準分段,減少空白噪音 - 斷線續寫,即使連線中斷,也能繼續轉錄不中斷 - 預測式轉錄,模型會預判接下來的字詞與標點,實現流暢輸出 - 複雜詞彙識別,內建專業術語庫,支援技術、醫學、金融等專用領域
Scribe v2 在即時性+ 多語言準確度上處於領先位置 準確率超過GPT-4o、Deepgram 等同類型產品
在有背景噪音和複雜語料的「困難樣本」中表現優於所有其他模型 可用於建立自然、人類語音風格的AI 代理,服務於客服、銷售、產品互動等場景 詳細介紹:https://t.co/oMJqxAK14i
