在 @aidotengineer CODE 大會上,關於編碼評估的過去、現在和未來,演講非常精彩。基本上可以按階段追蹤: 秒:副駕駛競技場 分鐘:LiveCodeBench 多分鐘:RepoChat ~小時:GSO 數小時:合朔 天: ? ? ? https://t.co/exTyCakFxe 當我邀請 @StringChaos 來演講時,我什至不知道他已經全職加入 @Cursor_ai;我當時只是期待他能分享 LiveCodeBeyoutube.com/watch?v=tHN44y…他全面回顧了過去三年代碼評估工具的演變歷程,以及社區從中汲取的經驗,包括 o3 的獎勵機制優化,以及用於遷移海量代碼的基準測試和在線評估,以應對延遲和實際應用的限制。最後,他也為正在建立程式碼評估工具的開發者提供了一些切實可行的建議。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。


