OpenAI 發布GPT-5.2-Codex:在智能體程式設計方面,特別是應對複雜長期任務、網路安全和視覺互動理解三個方向全面提升 核心定位:最強智能體程式設計模型 OpenAI 於2025 年12 月18 日正式發布了GPT-5.2-Codex,定義為Agentic Coding Model 的系統。它不僅是回答程式碼問題,還能像一個自主的工程師一樣,在真實的終端環境中執行任務、編寫程式碼、偵錯錯誤,並能長時間保持對任務的專注。 三大核心能力升級 1. 應對複雜長期任務: · 上下文壓縮技術:模型現在能透過「原生壓縮」技術處理極長的上下文。在進行大規模程式碼重構或遷移時,它不會像以前的模型那樣「忘記」先前的設定或遺失進度。 · 穩定性:即使規劃變更或嘗試失敗,它也能持續迭代,直到完成任務。 2. 防禦性網路安全: · GPT-5.2-Codex 擁有迄今為止最強的網路安全能力。 · 實戰案例:甚至在上一代模型(GPT-5.1-Codex-Max)的輔助下,安全研究員就已經發現了React 框架中的關鍵漏洞。 GPT-5.2-Codex 在此基礎上進一步強化,能協助安全專家進行漏洞挖掘與系統防禦。 · 安全護欄:鑑於其強大的能力帶來的「雙面刃」風險,OpenAI 雖然尚未將其評為「高」風險等級,但已在部署時增加了額外的安全措施。 3. 視覺與互動能力: · 模型能更精準解讀螢幕截圖、技術架構圖和UI 介面。 · 從設計到程式碼:它能直接讀取設計草圖並快速轉換為功能性的原型程式碼。 性能基準(用數據說話) 該模型在衡量AI 程式設計智能體能力的兩個權威基準測試中均達到了SOTA水準: · SWE-Bench Pro:準確率達56.4%(相較於GPT-5.1 提升顯著)。 · Terminal-Bench 2.0:準確率達64.0%。 · 此外,它在Windows 環境下的原生操作能力也大幅優化。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
