RT @xeophon_: 벤치프레스는 힘들어요 그들의 GPT-OSS 점수는 최대 10포인트(GPQA-D)가 낮았고, GPQA-D는 참조 점수에 비해 2-3포인트가 낮았습니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
트윗 1개 · 2025. 11. 27. 오후 7:31
RT @xeophon_: 벤치프레스는 힘들어요 그들의 GPT-OSS 점수는 최대 10포인트(GPQA-D)가 낮았고, GPQA-D는 참조 점수에 비해 2-3포인트가 낮았습니다.