RT @a_karvonen: 저는 기본적으로 벤치마크를 더 이상 믿지 않습니다. "인간 수준에 가까운 공간 추론"을 갖춘 모델의 정확도는 0%입니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
트윗 1개 · 2025. 11. 19. 오전 9:26
RT @a_karvonen: 저는 기본적으로 벤치마크를 더 이상 믿지 않습니다. "인간 수준에 가까운 공간 추론"을 갖춘 모델의 정확도는 0%입니다.