X (Twitter)

Zhipu는 최근 최신 모델인 GLM-4.7을 오픈소스로 공개했는데, 이 모델의 툴링 기능은 Claude Sonnet 4.5를 능가합니다. 이 제품은 BrowseComp 웹 작업 평가에서 67.5점, τ²-Bench 대화형 도구 호출 평가에서 87.4점을 기록하여 Claude Sonnet보다 4.5점 높았습니다. HLE에서 42.8%의 정확도를 달성했으며, 이는 GLM-4.6보다 41% 향상된 수치이고 GPT-5.1을 능가하는 결과입니다. 코드 아레나의 슈퍼 GPT-5.2 GLM-4.7의 기능은 프로그래밍, 추론, 지능형 에이전트의 세 가지 수준에서 나타납니다. 프론트엔드/백엔드 프로그래밍 기술 및 지침 준수 측면에서, 실제 프로젝트에서 100개 과제를 대상으로 한 블라인드 테스트에서 4.6점을 받았던 것과 비교해 성능이 크게 향상되었습니다. 또한 다국어 프로그래밍 및 엣지 지능형 에이전트의 성능을 향상시켜 Claude Code와 같은 프로그래밍 프레임워크 내에서 "행동하기 전에 생각하기"를 가능하게 합니다. 장기적인 작업 계획과 안정적인 도구 호출 덕분에 캐시 가능한 암묵적 사고가 가능합니다. 복잡한 요구 사항은 자동으로 단계별로 분해되고, 검색/터미널/파일 시스템/브라우저가 호출됩니다. 오류는 롤백됩니다. τ²-Bench에서 87.4점을 달성했는데, 이는 여러 단계로 구성된 툴체인이 거의 충돌하지 않음을 의미합니다. zai 풀스택 개발 모드에서 스킬 모듈이 출시되어 멀티모달 작업의 통합 일정 관리를 지원합니다. #ZhipuGLM47

GitHub:github.com/zai-org/GLM-4.5V 껴안는 얼굴: htthuggingface.co/zai-org/GLM-4.7oda 커뮤modelscope.cn/models/ZhipuAI…UXbc

GitHub: https://t.co/aYWGL89UJV
껴안는 얼굴: https://t.co/dBs3IqU4ij
Moda 커뮤니티: https://t.co/ELPQoNUXbc

AIGCLINK(@aigclink)의 스레드

작성자 정보

스레드 내용