야망의 엄청난 규모 🐳: LLM은 자명하지 않은 정리를 증명할 수 있습니다. PutnamBench를 사용해 보겠습니다. 우리의 최고 시스템은 7.4%입니다. 아직 해야 할 일이 많습니다. 모두: 😮 오오오오, 이제 언덕 오르기 시작! "문제 분해"라는 우리의 참신한 아이디어… 15%! 35%! 70%! - 🐋: 충분해요. 118/120, 포화상태
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.