RT @srush_nlp: 학술 문헌에서는 강화 학습이 모델을 첫 번째 시도(pass@1)에서는 더 좋게 만들고, 네 번째 시도(pass@N)에서는 *더 나쁘게* 만든다는 상당한 논의가 있습니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
트윗 1개 · 2025. 12. 20. 오전 1:02
RT @srush_nlp: 학술 문헌에서는 강화 학습이 모델을 첫 번째 시도(pass@1)에서는 더 좋게 만들고, 네 번째 시도(pass@N)에서는 *더 나쁘게* 만든다는 상당한 논의가 있습니다.