ElevenLabs에서 Scribe v2 Realtime을 출시했습니다. 매우 높은 정확도, 매우 빠른 속도, 다국어 지원을 갖춘 실시간 음성-텍스트 변환 모델로, 음성 에이전트, 회의 노트 작성, 실시간 애플리케이션에 특별히 설계되었습니다. 주요 특징: 탁월한 정확도와 속도: Scribe v2 Realtime은 실시간 텍스트 변환 시 단 150ms의 지연 시간을 자랑하며, 정확도 면에서 모든 주류 저지연 ASR 모델을 능가합니다. 특히 노이즈가 많거나 복잡한 샘플에서 탁월한 성능을 발휘하여 까다로운 실시간 시나리오에 적합합니다. • 다국어 지원: 영어, 프랑스어, 독일어, 이탈리아어, 스페인어, 포르투갈어, 힌디어, 일본어 등 90개 이상의 언어를 지원합니다. 따라서 영어가 아닌 환경에서 기존 모델의 한계를 벗어나 글로벌 음성 애플리케이션에 적합합니다. • 보안 및 규정 준수: 이 모델은 SOC 2, ISO 27001, PCI DSS L1, HIPAA 및 GDPR과 같은 국제 표준을 준수하며 EU 및 인도의 데이터 상주 옵션은 물론, 개인 정보 보호를 보장하기 위한 제로 데이터 보존 모드를 제공합니다. 애플리케이션 시나리오와 사용성 모델은 고객 지원, 영업 또는 제품 상호작용에서 자연스러운 대화를 위한 AI 음성 에이전트 구축과 같은 Agentic 사용 사례에 특별히 최적화되어 있습니다. ElevenLabs는 이 솔루션이 텍스트 변환 정확도를 향상시킬 뿐만 아니라 실시간 시스템과 완벽하게 통합된다고 강조합니다. 이미 ElevenLabs Agents 플랫폼에 통합되어 있어 사용자가 인간과 유사한 음성 에이전트를 직접 배포할 수 있습니다. ElevenLabs 공식 블로그:
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
