正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年7月31日 凌晨1:24
這似乎非常重要: 完全有可能,在給定一個精心設計的提示的情況下,一個模型無需任何強化學習就能獲得IMO金獎。 我們對此一無所知,也缺乏有效搜尋提示空間的工具。很高興看到至少有人在嘗試。