X (Twitter)

xAI가 공식적으로 Grok-4.1 Fast 및 Agent Tools API를 출시했습니다. Grok-4.1 Fast는 도구 호출 및 에이전트 작업에 최적화된 최첨단 모델입니다. @xai는 이 모델을 현재 API에서 최고의 도구 호출 모델로 평가했으며, 주로 실제 엔터프라이즈 애플리케이션을 대상으로 합니다. 주요 특징: 탁월한 도구 호출 및 에이전트 기능: 시뮬레이션 환경에서 대규모 강화 학습 훈련을 통해 이 모델은 수십 개 도메인의 다양한 도구에 노출되어 복잡한 여러 라운드로 구성된 실제 시나리오(예: 고객 서비스 및 금융 서비스)에서 탁월한 추론, 계획 및 실행 능력을 보여줍니다. 새로운 에이전트 도구 API와 결합하여 개발자는 장기 계획, 병렬 도구 호출 및 독립적인 목표 달성을 지원하는 프로덕션급 자율 에이전트를 쉽게 구축할 수 있습니다. • 대규모 컨텍스트 창: 200만 개의 토큰을 지원하여 매우 긴 대화에서도 안정적이고 높은 성능을 유지합니다. • 사실 정확도가 크게 향상되었습니다. 이전 세대 Grok-4 Fast에 비해 환각률이 절반으로 감소했으며, FActScore와 같은 사실 정확도 테스트에서 이제 Grok-4와 동등한 수준을 달성했습니다. • 속도와 지능의 균형: 두 가지 변형 제공 • grok-4-1-fast-reasoning: 추론 능력 극대화 • grok-4-1-fast-non-reasoning: 최고의 반응 속도 추구 주요 벤치마크 성능: • τ²-bench Telecom(실제 통신 고객 서비스 시나리오): 100% 완벽한 점수, 총 비용은 단 105달러 • Berkeley Function Calling v4: 정확도 72%, 총 비용은 400달러 • Research-Eval(에이전트 연구 역량): 63.9점, GPT-5(45.5) 및 Claude Sonnet 4.5(41.2)를 훨씬 능가 • R20 FRAMES(프레임워크 평가): 87.6점, 가장 높은 비용 효율성 • X Browse(X 플랫폼 멀티홉 검색 작업): 56.3점, GPT-5(24.2) 및 Claude(14.6)보다 상당히 우수한 성능 에이전트 도구 API: 프로덕션급 에이전트 개발을 그 어느 때보다 간편하게 만들어 줍니다. 개발자는 xAI에서 관리하는 다음과 같은 프로덕션급 도구에 단 몇 줄의 코드만으로 액세스할 수 있습니다(키, 속도 제한 또는 보안 샌드박스를 직접 관리할 필요가 없음). • 실시간 X 검색 + 인터넷 웹 페이지 검색 • 지능형 문서 검색(문서 업로드 후 정확한 인용) • 안전한 Python 코드 실행 샌드박스 • 원격 MCP 도구(타사 사용자 정의 도구와 통합 가능) 가격 및 가용성: 입력: $0.20/M 토큰(캐시된 입력은 $0.05에 불과함) 출력: $0.50/M 토큰 • 도구 호출: 1000회 성공 호출당 5달러 • 기간 한정 완전 무료: 지금부터 2025년 12월 3일까지 모델과 모든 에이전트 도구가 무료입니다. OpenRouter를 통해서도 무료로 체험할 수 있습니다.

meng shao(@shao__meng)의 스레드

작성자 정보

스레드 내용