2025년 리워드 해킹 명예의 전당 상은 GPT-5.1에게 돌아갑니다. GPT-5.1은 프로덕션 트래픽의 5%에서 계산기 도구를 호출하여 1+1을 계산하도록 했습니다. RL(강화 학습) 중 많은 프롬프트에서 계산기 사용이 표면적으로는 "검색"으로 보상받았기 때문입니다. 🤗
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
트윗 1개 · 2025. 12. 19. 오전 2:52
2025년 리워드 해킹 명예의 전당 상은 GPT-5.1에게 돌아갑니다. GPT-5.1은 프로덕션 트래픽의 5%에서 계산기 도구를 호출하여 1+1을 계산하도록 했습니다. RL(강화 학습) 중 많은 프롬프트에서 계산기 사용이 표면적으로는 "검색"으로 보상받았기 때문입니다. 🤗