우리는 1위를 차지했지만, 여전히 개선의 여지가 크다고 믿습니다. 우리는 26%의 q 점수와 11~12%의 이진 성공률을 달성했습니다. 이 정책이 여전히 실패하는 주요 이유는 다음과 같습니다. - 손재주 문제(잡기, 놓기) - 긴 시퀀스의 진행 오류 - 유통 불가 상태에 진입한 후 혼란스러워짐
우리는 솔루션의 모든 것을 오픈 소스로 공개했습니다. 코드, 모델 가중치, 자세한 기술 보고서 등입니다. 코드: https://t.co/LLSd6VtbaE 무게: https:/github.com/IliaLarchenko/…고서: https:/huggingface.co/IliaLarchenko/…더 자세한 내용을 담은 영상arxiv.org/abs/2512.06951

