El último modelo de conversión de voz a texto en tiempo real de ElevenLabs: Scribe v2 Realtime, transcribe más de 90 idiomas en 150 milisegundos. Puede utilizarse para asistentes de voz, grabación de reuniones o aplicaciones en tiempo real, etc. WER para inglés, japonés, etc. ≤ 5%, chino mandarín > 5% ≤ 10% #ASR #STT
Docelevenlabs.io/docs/capabilit…o/vmFUTyD44Z