X (Twitter)

xAI lanza oficialmente Grok-4.1 Fast y la API de herramientas para agentes. Grok-4.1 Fast es un modelo de vanguardia optimizado para la invocación de herramientas y tareas de agentes. @xai lo ha posicionado como el mejor modelo de invocación de herramientas en la API actual y está principalmente dirigido a aplicaciones empresariales reales. Aspectos destacados: Capacidades de invocación de herramientas y agentes significativamente superiores: Mediante entrenamiento de aprendizaje por refuerzo a gran escala en entornos simulados, el modelo se familiariza con diversas herramientas en docenas de dominios, demostrando capacidades excepcionales de razonamiento, planificación y ejecución en escenarios complejos del mundo real con múltiples rondas (como atención al cliente y servicios financieros). Gracias a la nueva API de herramientas para agentes, los desarrolladores pueden crear fácilmente agentes autónomos de nivel de producción, compatibles con la planificación a largo plazo, la invocación de herramientas en paralelo y el logro independiente de objetivos. • Amplia ventana de contexto: Admite 2 millones de tokens, manteniendo un rendimiento estable y elevado en conversaciones muy largas. • Precisión factual significativamente mejorada: La tasa de alucinaciones se reduce a la mitad en comparación con la generación anterior de Grok-4 Fast, y ahora está a la par con Grok-4 en pruebas de precisión factual como FActScore. • Equilibrio entre velocidad e inteligencia: Ofrece dos variantes: • grok-4-1-razonamiento rápido: Maximiza la capacidad de razonamiento. • grok-4-1-razonamiento rápido sin razonamiento: Busca la máxima velocidad de respuesta. Rendimiento de referencia clave: • τ²-bench Telecom (escenario real de servicio al cliente de telecomunicaciones): puntuación perfecta del 100%, coste total de solo 105 dólares • Berkeley Function Calling v4: 72% de precisión, coste total de 400 dólares • Research-Eval (capacidad de investigación del agente): 63,9 puntos, superando con creces a GPT-5 (45,5) y Claude Sonnet 4.5 (41,2) • R20 FRAMES (Evaluación de Framework): 87,6 puntos, la mayor eficiencia de costos • X Browse (Tarea de búsqueda multihop en la plataforma X): 56,3 puntos, superando significativamente a GPT-5 (24,2) y Claude (14,6) API de herramientas para agentes: Simplificando como nunca antes el desarrollo de agentes de nivel de producción. Los desarrolladores pueden acceder a las siguientes herramientas de nivel de producción, todas gestionadas por xAI, con tan solo unas pocas líneas de código (sin necesidad de gestionar ellos mismos las claves, los límites de velocidad ni los entornos de seguridad aislados): • Búsqueda X en tiempo real + Búsqueda en páginas web de Internet • Recuperación inteligente de documentos (citación precisa tras la carga del documento) • Entorno aislado seguro para la ejecución de código Python • Herramienta MCP remota (se puede integrar con herramientas personalizadas de terceros) Precios y disponibilidad · Entrada: 0,20 $/M token (la entrada en caché es de solo 0,05 $) Salida: $0.50/M token • Invocación de herramienta: $5 por cada 1000 invocaciones exitosas • Por tiempo limitado, completamente gratis: Desde ahora hasta el 3 de diciembre de 2025, el modelo + todas las herramientas del agente son gratuitas; también se puede experimentar gratis a través de OpenRouter.

Hilo de meng shao (@shao__meng)

Información del autor

Contenido del hilo