ElevenLabs は、音声エージェント、会議メモ作成、リアルタイム アプリケーション向けに特別に設計された、超高精度、超高速、多言語サポートを備えたリアルタイム音声テキスト変換モデルである Scribe v2 Realtime を発表しました。 主な特長:卓越した精度と速度:Scribe v2 Realtimeは、リアルタイム文字起こしにおいてわずか150ミリ秒のレイテンシを誇り、精度においては主流の低レイテンシASRモデルを凌駕します。特にノイズの多いサンプルや複雑なサンプルにおいて優れたパフォーマンスを発揮し、高度なリアルタイム処理が求められるシナリオにも最適です。 • 多言語サポート:英語、フランス語、ドイツ語、イタリア語、スペイン語、ポルトガル語、ヒンディー語、日本語を含む90以上の言語をカバーしています。これにより、英語以外の環境における従来のモデルの制限を回避し、グローバルな音声アプリケーションに適しています。 • セキュリティとコンプライアンス: このモデルは、SOC 2、ISO 27001、PCI DSS L1、HIPAA、GDPR などの国際標準に準拠しており、EU およびインドのデータ保存オプションと、プライバシー保護を保証するゼロデータ保持モードを提供します。 アプリケーションシナリオとユーザビリティモデルは、顧客サポート、営業、製品インタラクションにおける自然な対話を実現するAI音声エージェントの構築など、Agenticのユースケースに特化して最適化されています。ElevenLabsは、文字起こしの精度向上だけでなく、リアルタイムシステムへのシームレスな統合も重視しています。ElevenLabs Agentsプラットフォームに既に統合されており、ユーザーは人間のような音声エージェントを直接導入できます。 ElevenLabs公式ブログ:
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
