이건 진지하지 않습니다. 가장 강력한 LLM 중 하나인 V3.2-thinking은 상대적으로 약한 모델과 V3.1, V3.2-exp, R1-0528과 같은 이전 버전보다 훨씬 아래에 있습니다. lmarena가 제대로 작동하지 않는다는 가장 명백한 사례일지도 모릅니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
트윗 1개 · 2025. 12. 5. 오전 4:40
이건 진지하지 않습니다. 가장 강력한 LLM 중 하나인 V3.2-thinking은 상대적으로 약한 모델과 V3.1, V3.2-exp, R1-0528과 같은 이전 버전보다 훨씬 아래에 있습니다. lmarena가 제대로 작동하지 않는다는 가장 명백한 사례일지도 모릅니다.