獨立驗證過!我在日本的時候太懶了,沒提交任何東西,但肯定能在誤差範圍內實現。我猜他們的優化方法應該沒怎麼變。 恭喜 Poetiq! 一些實驗:
對於那些不那麼懶惰、願意花時間提交題目的人來說,如果你們把模型組合起來,Opus 可以做出一些獨特的解,把分數提高到 80% 以上。強烈推薦! (不是為了獲得榮譽;我正在做其他相關的項目)
我沒有提交整合方法,因為我覺得它不夠好。它確實能更好地解決 arc-agi-2 問題,但我並不確定從中能獲得什麼重要的啟示。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 3 則推文 · 2025年12月23日 晚上7:37
獨立驗證過!我在日本的時候太懶了,沒提交任何東西,但肯定能在誤差範圍內實現。我猜他們的優化方法應該沒怎麼變。 恭喜 Poetiq! 一些實驗:
對於那些不那麼懶惰、願意花時間提交題目的人來說,如果你們把模型組合起來,Opus 可以做出一些獨特的解,把分數提高到 80% 以上。強烈推薦! (不是為了獲得榮譽;我正在做其他相關的項目)
我沒有提交整合方法,因為我覺得它不夠好。它確實能更好地解決 arc-agi-2 問題,但我並不確定從中能獲得什麼重要的啟示。