A ElevenLabs apresenta o Scribe v2 Realtime: um modelo de conversão de fala em texto em tempo real com altíssima precisão, velocidade ultrarrápida e suporte a vários idiomas, projetado especificamente para agentes de voz, anotações de reuniões e aplicações em tempo real. Principais destaques: Precisão e velocidade excepcionais: O Scribe v2 Realtime apresenta uma latência de apenas 150 ms na transcrição em tempo real e supera todos os principais modelos de reconhecimento automático de fala (ASR) de baixa latência em precisão. Seu desempenho é particularmente notável em amostras ruidosas ou complexas, tornando-o adequado para cenários desafiadores em tempo real. • Suporte multilíngue: Abrange mais de 90 idiomas, incluindo inglês, francês, alemão, italiano, espanhol, português, hindi e japonês. Isso o torna adequado para aplicações de voz globais, evitando as limitações dos modelos tradicionais em ambientes que não falam inglês. • Segurança e Conformidade: O modelo está em conformidade com padrões internacionais como SOC 2, ISO 27001, PCI DSS L1, HIPAA e GDPR, e oferece opções de residência de dados na UE e na Índia, bem como um modo de retenção de dados zero para garantir a proteção da privacidade. Os cenários de aplicação e o modelo de usabilidade são especificamente otimizados para casos de uso do Agentic, como a criação de agentes de voz com IA para diálogos naturais em suporte ao cliente, vendas ou interações com produtos. A ElevenLabs enfatiza que a solução não apenas aprimora a precisão da transcrição, mas também se integra perfeitamente a sistemas em tempo real. Ela já está integrada à plataforma ElevenLabs Agents, permitindo que os usuários implementem agentes de voz com sonoridade humana diretamente. Blog oficial da ElevenLabs:
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
