“RLVR의 무작위 개선 속성은 적절한 데이터 오염 제거로 사라집니다.” 말이 된다 @natolambert와 Olmo 팀의 나머지 구성원들에게 감사드립니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
트윗 1개 · 2025. 12. 9. 오전 8:03
“RLVR의 무작위 개선 속성은 적절한 데이터 오염 제거로 사라집니다.” 말이 된다 @natolambert와 Olmo 팀의 나머지 구성원들에게 감사드립니다.