> 커뮤니티의 추가적인 전문화를 위해 사후 학습을 의도적으로 제한했습니다. 모델의 미활용 잠재력을 보여주는 지표로서, 하드 코드 생성, 에이전트 및 수학 벤치마크에서 pass@{1,2,4,8}을 보고합니다. 멋지네요! 신나는 출시네요.
훈련 후 모델은 "덜 익혀진" 상태여야 합니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
트윗 2개 · 2025. 12. 6. 오전 4:15
> 커뮤니티의 추가적인 전문화를 위해 사후 학습을 의도적으로 제한했습니다. 모델의 미활용 잠재력을 보여주는 지표로서, 하드 코드 생성, 에이전트 및 수학 벤치마크에서 pass@{1,2,4,8}을 보고합니다. 멋지네요! 신나는 출시네요.
훈련 후 모델은 "덜 익혀진" 상태여야 합니다.