Agent RFT와 Coding Agent RL은 AI Code Summit NYC에서 볼 수 있듯이 업계 전체가 옳은 결정이라는 데 동의했습니다. 하지만 RL의 문제는 선택지가 너무 많다는 것입니다. 이처럼 보편적인 프로토콜이 있다면 큰 도움이 될 것입니다. 게다가 퇴비화도 가능하므로 타협할 필요가 없습니다. 이는 RL을 민주화하는 데 큰 도움이 될 것입니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.