xAI正式發表Grok Voice Agent API 價格僅每分鐘$0.05 在音頻推理基準測試中排名第1 其核心能力包括: - 即時語音輸入與輸出(雙向語音通訊) - 支援包括中文在內數十種語言 - 能自動辨識使用者語言,在對話中自由切換 - 支援呼叫外部工具 - 即時連網搜尋與推理 - 支持情緒提示控制語音 - 提供多種人聲選擇 - 相容OpenAI Realtime API 規範
Grok 提供多種人聲選擇,例如: Ara(柔和、自然) Eve(溫暖、女性化) Leo(清晰、專業)
現在,全球數百萬輛Tesla 汽車的語音助理都是Grok 驅動的。 在車上,Grok 不僅聽懂你說什麼,還能直接操作車輛系統: 查詢電池、電量、車況規劃路線從X 上搜尋內容自動產生旅行計畫(路線+ 停靠點+ 沿途推薦)
Big Bench Audio 智慧基準測試:在音訊推理基準測試中,Grok 排名第1。 智慧得分: 95%(領先所有競爭對手) 反應速度: 平均time-to-first-audio < 1 秒,比最近的競爭對手快約5倍。 線上體驗:httpconsole.x.ai/team/default/v…介紹:https://t.co/yzASWYOgSs
