ElevenLabs の最新のリアルタイム音声テキスト変換モデル Scribe v2 Realtime は、150 ミリ秒で 90 以上の言語を書き起こします。 音声アシスタント、会議の録音、リアルタイムアプリケーションなどに使用できます。 英語、日本語などのWER ≤ 5%、中国語(北京語)> 5% ≤ 10% #ASR #STT
ドキュelevenlabs.io/docs/capabilit…yD44Z
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
2 件のツイート · 2025/11/11 23:32
ElevenLabs の最新のリアルタイム音声テキスト変換モデル Scribe v2 Realtime は、150 ミリ秒で 90 以上の言語を書き起こします。 音声アシスタント、会議の録音、リアルタイムアプリケーションなどに使用できます。 英語、日本語などのWER ≤ 5%、中国語(北京語)> 5% ≤ 10% #ASR #STT
ドキュelevenlabs.io/docs/capabilit…yD44Z