제가 직접 확인해본 결과, 일본에 있는 동안에는 귀찮아서 아무것도 제출하지 못했지만, 오차 범위 내에서 충분히 달성 가능한 결과입니다. 아마 정제 방식은 크게 바뀌지 않았을 거라고 생각합니다. Poetiq님, 축하드립니다! 몇 가지 실험:
제출하는 수고를 덜어줄 만큼 덜 게으른 사람들을 위해, 모델들을 앙상블하면 Opus가 몇 가지 독창적인 해결책을 제시하여 점수를 80% 이상으로 끌어올릴 수 있습니다. 강력 추천합니다! (학점 따려고 하는 게 아니라, 관련된 다른 프로젝트를 진행 중입니다.)
앙상블 방법을 제출하지 않은 이유는 그럴 만한 가치가 없다고 생각했기 때문입니다. arc-agi-2 문제를 조금 더 잘 해결하긴 하지만, 거기서 얻을 수 있는 중요한 통찰이 있는지 확신이 서지 않습니다.
