xAI lanza oficialmente la API Grok Voice Agent El precio es sólo $0,05 por minuto. Puesto n.° 1 en puntos de referencia de inferencia de audio Sus principales capacidades incluyen: - Entrada y salida de voz en tiempo real (comunicación de voz bidireccional) - Admite docenas de idiomas, incluido el chino. - Puede reconocer automáticamente el idioma del usuario y cambiar libremente durante las conversaciones. - Admite llamadas a herramientas externas - Búsqueda y razonamiento en línea en tiempo real - Admite control de voz con señales de emoción. - Ofrece una variedad de opciones de voz. - Compatible con la especificación API en tiempo real de OpenAI
Grok ofrece una variedad de opciones de voz, como: Ara (suave, natural) Eva (cálida, femenina) Leo (Claro, Profesional)
Actualmente, los asistentes de voz de millones de coches Tesla en todo el mundo funcionan con Grok. Dentro del coche, Grok no solo puede entender lo que dices, sino también operar directamente los sistemas del vehículo: Verifique el estado de la batería, el nivel de batería y el estado del vehículo; planifique rutas; genere automáticamente planes de viaje a partir de los resultados de búsqueda en X (ruta + paradas + recomendaciones en el camino).
Puntos de referencia inteligentes de audio de Big Bench: Grok ocupa el puesto número 1 en puntos de referencia de inferencia console.x.ai/team/default/v…inteligxiaohu.ai/c/xiaohu-ai/xa…todos los competidores) Velocidad de respuesta: tiempo promedio hasta el primer audio < 1 segundo, aproximadamente 5 veces más rápido que los competidores recientes. Vívelo en línea: https://t.co/AbSskmXvhu Introducción detallada: https://t.co/yzASWYOgSs
