xAI publie officiellement l'API Grok Voice Agent Le prix est de seulement 0,05 $ par minute. Classé n°1 aux tests de performance d'inférence audio Ses principales capacités comprennent : - Entrée et sortie vocales en temps réel (communication vocale bidirectionnelle) - Prend en charge des dizaines de langues, dont le chinois. - Il peut reconnaître automatiquement la langue de l'utilisateur et passer librement d'une langue à l'autre au cours des conversations. - Prend en charge l'appel d'outils externes - Recherche et raisonnement en ligne en temps réel - Prend en charge la commande vocale avec des indications émotionnelles - Offre une variété d'options vocales - Compatible avec la spécification de l'API temps réel d'OpenAI
Grok propose diverses options vocales, telles que : Ara (doux, naturel) Ève (chaleureuse, féminine) Lion (Clair, Professionnel)
Actuellement, les assistants vocaux de millions de voitures Tesla dans le monde entier sont alimentés par Grok. À l'intérieur de la voiture, Grok peut non seulement comprendre ce que vous dites, mais aussi commander directement les systèmes du véhicule : Vérifier l'état de la batterie, son niveau et l'état du véhicule ; planifier des itinéraires ; générer automatiquement des plans de voyage à partir des résultats de recherche sur X (itinéraire + arrêts + recommandations en cours de route).
Tests de performance audio intelligents de Big Bench : Grok classé n° 1 aux tests d’inférence audio. Score Smart : 95 % (suconsole.x.ai/team/default/v…rrents)xiaohu.ai/c/xiaohu-ai/xa… Délai moyen d’émission du premier signal audio < 1 seconde, environ 5 fois plus rapide que les concurrents récents. Découvrez-le en ligne : https://t.co/AbSskmXvhu Présentation détaillée : https://t.co/yzASWYOgSs
