O mais recente modelo de transcrição de fala em tempo real da ElevenLabs, o Scribe v2 Realtime, transcreve mais de 90 idiomas em 150 milissegundos. Pode ser usado para assistentes de voz, gravação de reuniões ou aplicações em tempo real, etc. WER para inglês, japonês, etc. ≤ 5%, chinês mandarim > 5% ≤ 10% #ASR #STT
Docelevenlabs.io/docs/capabilit…/vmFUTyD44Z