xAIがGrok Voice Agent APIを正式にリリース 料金は1分あたりわずか0.05ドルです。 オーディオ推論ベンチマークで1位を獲得 主な機能は次のとおりです。 - リアルタイム音声入出力(双方向音声通信) - 中国語を含む数十の言語をサポートします。 - ユーザーの言語を自動で認識し、会話中に自由に切り替えることができます。 - 外部ツールの呼び出しをサポート - リアルタイムのオンライン検索と推論 - 感情キューによる音声制御をサポート - 多様な音声オプションを提供 - OpenAI Realtime API仕様と互換性あり
Grok は次のようなさまざまな音声オプションを提供します。 アラ(優しい、自然) イブ(温かみのある、女性的な) レオ(明晰、プロフェッショナル)
現在、世界中の何百万台ものテスラ車の音声アシスタントは Grok を搭載しています。 車内では、Grok はユーザーの話す内容を理解するだけでなく、車両のシステムを直接操作することもできます。 バッテリーの状態、バッテリーレベル、車両の状態を確認し、ルートを計画し、X の検索結果から旅行プランを自動的に生成します (ルート + 停車地 + 途中の推奨事項)。
Big Bench Audio Smart Benchmarks: Grok はオーディオ推論ベンチマークで 1 位にランクされました。 スマートスコア:95%(すべての競合他社を上回る) 応答速度: 最初の音声までの平均時間は 1 秒未満で、最console.x.ai/team/default/v…ラインで体験しxiaohu.ai/c/xiaohu-ai/xa…skmXvhu 詳しい紹介:https://t.co/yzASWYOgSs
