我們特意限制了訓練後的訓練,以便社區能夠進一步進行專業化研究。為了體現模型的未開發潛力,我們報告了在硬程式碼生成、智能體和數學基準測試中通過率達到 pass@{1,2,4,8} 的結果。 太棒了!令人興奮的發布。
你訓練後的模型應該是「未完全成熟」的…
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 2 則推文 · 2025年12月6日 凌晨4:15
我們特意限制了訓練後的訓練,以便社區能夠進一步進行專業化研究。為了體現模型的未開發潛力,我們報告了在硬程式碼生成、智能體和數學基準測試中通過率達到 pass@{1,2,4,8} 的結果。 太棒了!令人興奮的發布。
你訓練後的模型應該是「未完全成熟」的…