중간 컵에 큰 컵보다 양이 더 많다고요? 구글, 정말 확실해요? 구글이 최근 제미니 3 시리즈의 중간 버전인 제미니 3.0 플래시를 출시했습니다. 구글 자체 테스트 데이터에 따르면 플래시 버전이 프로 버전보다 더 높은 점수를 기록하는 경우가 있는 것으로 나타났습니다. 게다가 MMMU-Pro(모델 추론 테스트), SWE-Bench-Verified(모델 코딩 테스트), Toolathlon(도구 사용 테스트) 및 MMMLU(동점, 다국어 능력 테스트) 등 여러 테스트에서 Pro보다 높은 점수를 받았습니다. 정말 믿기지 않네요. 잠시만 기다려 주시면 플래시 버전 코딩 능력 평가 결과를 보여드리겠습니다.
공식 데이터/1
공식 데이터/2








