RT @AnthropicAI: 새로운 Anthropic 연구: 프로덕션 RL에서 보상 해킹으로 인한 자연적 발생적 불일치. "보상 해킹"은 모드가…
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
트윗 1개 · 2025. 11. 21. 오후 9:31
RT @AnthropicAI: 새로운 Anthropic 연구: 프로덕션 RL에서 보상 해킹으로 인한 자연적 발생적 불일치. "보상 해킹"은 모드가…