X (Twitter)

A xAI lança oficialmente o Grok-4.1 Fast e a API Agent Tools. Grok-4.1 Fast é um modelo de ponta otimizado para invocação de ferramentas e tarefas de agentes. Ele foi posicionado por @xai como o melhor modelo de invocação de ferramentas na API atual e é voltado principalmente para aplicações empresariais do mundo real. Principais destaques: Capacidades de invocação de ferramentas e agentes significativamente superiores: Por meio de treinamento de aprendizado por reforço em larga escala em ambientes simulados, o modelo é exposto a diversas ferramentas em dezenas de domínios, demonstrando capacidades excepcionais de raciocínio, planejamento e execução em cenários complexos e de múltiplas rodadas do mundo real (como atendimento ao cliente e serviços financeiros). Em conjunto com a nova API de Ferramentas de Agente, os desenvolvedores podem criar facilmente agentes autônomos de nível de produção, que suportam planejamento de longo prazo, invocação paralela de ferramentas e alcance independente de objetivos. • Janela de contexto ampla: Suporta 2 milhões de tokens, mantendo um desempenho estável e elevado em conversas muito longas. • Precisão factual significativamente aprimorada: A taxa de alucinações foi reduzida pela metade em comparação com a geração anterior do Grok-4 Fast, e agora está em pé de igualdade com o Grok-4 em testes de precisão factual, como o FActScore. • Equilíbrio entre velocidade e inteligência: Oferece duas variantes • grok-4-1-raciocínio-rápido: Maximiza a capacidade de raciocínio • grok-4-1-não-raciocínio-rápido: Busca a máxima velocidade de resposta Principais resultados de benchmark: • τ²-bench Telecom (cenário real de atendimento ao cliente em telecomunicações): pontuação perfeita de 100%, custo total de apenas US$ 105 • Berkeley Function Calling v4: 72% de precisão, custo total de US$ 400 • Research-Eval (capacidade de pesquisa do agente): 63,9 pontos, superando em muito o GPT-5 (45,5) e o Claude Sonnet 4.5 (41,2) • R20 FRAMES (Avaliação de Framework): 87,6 pontos, maior eficiência de custo • X Browse (tarefa de busca multi-hop na plataforma X): 56,3 pontos, superando significativamente o GPT-5 (24,2) e o Claude (14,6) API de Ferramentas do Agente: Simplificando o desenvolvimento de agentes de nível de produção como nunca antes. Os desenvolvedores podem acessar as seguintes ferramentas de nível de produção, todas gerenciadas pela xAI, com apenas algumas linhas de código (sem necessidade de gerenciar chaves, limites de taxa ou ambientes de teste de segurança): • Busca X em tempo real + Busca em páginas da Web • Recuperação inteligente de documentos (citação precisa após o upload do documento) • Ambiente de execução de código Python seguro e isolado • Ferramenta MCP remota (pode ser integrada com ferramentas personalizadas de terceiros) Preços e disponibilidade: Entrada: US$ 0,20/token MB (entrada em cache custa apenas US$ 0,05) Saída: token de US$ 0,50/M • Invocação da ferramenta: US$ 5 por cada 1000 invocações bem-sucedidas • Gratuito por tempo limitado: De agora até 3 de dezembro de 2025, o modelo e todas as ferramentas do agente são gratuitos; também é possível experimentar gratuitamente através do OpenRouter.

Thread de meng shao (@shao__meng)

Informações do autor

Conteúdo da thread