OlmoRL에서 우리가 한 일이 특별히 새로운 것은 아니라는 점을 밝혀두고 싶습니다. 우리는 기본적으로 기존 문헌에서 최적의 조합이 무엇인지 확인하기 위해 여러 가지 실험을 했습니다.