X (Twitter)

OpenAI 發布GPT-5.2-Codex：在智能體程式設計方面，特別是應對複雜長期任務、網路安全和視覺互動理解三個方向全面提升核心定位：最強智能體程式設計模型 OpenAI 於2025 年12 月18 日正式發布了GPT-5.2-Codex，定義為Agentic Coding Model 的系統。它不僅是回答程式碼問題，還能像一個自主的工程師一樣，在真實的終端環境中執行任務、編寫程式碼、偵錯錯誤，並能長時間保持對任務的專注。三大核心能力升級 1. 應對複雜長期任務： · 上下文壓縮技術：模型現在能透過「原生壓縮」技術處理極長的上下文。在進行大規模程式碼重構或遷移時，它不會像以前的模型那樣「忘記」先前的設定或遺失進度。 · 穩定性：即使規劃變更或嘗試失敗，它也能持續迭代，直到完成任務。 2. 防禦性網路安全： · GPT-5.2-Codex 擁有迄今為止最強的網路安全能力。 · 實戰案例：甚至在上一代模型（GPT-5.1-Codex-Max）的輔助下，安全研究員就已經發現了React 框架中的關鍵漏洞。 GPT-5.2-Codex 在此基礎上進一步強化，能協助安全專家進行漏洞挖掘與系統防禦。 · 安全護欄：鑑於其強大的能力帶來的「雙面刃」風險，OpenAI 雖然尚未將其評為「高」風險等級，但已在部署時增加了額外的安全措施。 3. 視覺與互動能力： · 模型能更精準解讀螢幕截圖、技術架構圖和UI 介面。 · 從設計到程式碼：它能直接讀取設計草圖並快速轉換為功能性的原型程式碼。性能基準（用數據說話）該模型在衡量AI 程式設計智能體能力的兩個權威基準測試中均達到了SOTA水準： · SWE-Bench Pro：準確率達56.4%（相較於GPT-5.1 提升顯著）。 · Terminal-Bench 2.0：準確率達64.0%。 · 此外，它在Windows 環境下的原生操作能力也大幅優化。

來自 meng shao（@shao__meng）的推文串

作者資訊

推文串內容