X (Twitter)

OpenAI 官方指南：建構AI 原生工程團隊 2025年軟體開發已正式進入「智能體主導執行、人類負責審閱與決策」的時代。整個軟體開發生命週期的80% 重複性工作都可以也應該交給編碼智能體完成，工程師的價值正在快速從「寫入程式碼」遷移到「定義問題、設計系統、掌握方向」。能力演進時間表· 早期：只能補全幾行程式碼，推理時間僅30秒左右。 · 現在：領先模型已能持續推理2小時以上，每7個月左右能力翻倍，可一次理解整個程式碼庫、呼叫工具、自動跑測試、自我糾錯。 · 結果：從規劃到部署的完整特性，智能體已能獨立交付，人類只需要審閱和做最終決策。 · OpenAI 內部真實資料：原本需要幾週的任務，現在幾天即可完成，工程師把大量文件、依賴維護、特性旗標清理等重複性工作完全交給Codex 智能體。軟體開發五大階段的徹底重構 1. Plan（規劃階段） · 傳統痛點：需求模糊、依賴、重複開會對齊。 · 現在做法：把產品規格、票據丟給智能體，它會自動拆解成子任務、標記模糊點、找出所有依賴文件、預估實現難度、指出潛在風險。 · 工程師真正要做的事：決定優先順序、取捨範圍、最終拍板故事點數。 · 立刻可做：找出團隊裡最常需要「程式碼對齊」的場景（如新特性範圍討論），先讓智能體自動補充上下文和依賴分析。 2. Design（設計階段） · 傳統痛點：Figma 轉程式碼慢、反覆重工、難以快速試多個方案。 · 現在做法：多模態智能體直接把設計稿（Figma/圖片）轉換成100%符合現有設計系統的高保真React/Vue/SwiftUI 元件，10秒內出3-5個不同實作方案。 · 工程師真正要做的事：決定整體設計語言、互動模式、元件重複使用策略。 · 立刻可做：把組件庫透過MCP 暴露給智能體，建立「設計圖→組件→程式碼」一鍵連結。 3. Build（編碼階段） · 傳統痛點：大量樣板程式碼、找舊實作、上下文頻繁切換、編譯錯來回修。 · 現在做法：智能體一次產生完整特性，包括後端API、資料庫遷移、前端頁、錯誤處理、日誌、單元測試、README，全程跨數十個檔案保持一致，邊寫邊自動修復編譯錯誤。 · 工程師真正要做的事：只專注於架構影響、安全、效能、可維護性等高階問題。 · 立刻可做：從小而規格明確的任務開始；要求智能體先輸出PLAN. md 再動手；建立AGENTS. md 文件教它團隊的獨特規範和測試流程。 4. Test（測試階段） · 傳統痛點：測驗永遠寫不完、覆蓋率被犧牲、邊緣case 容易漏。 · 現在做法：智能體會根據產品規格自動產生測試案例，尤其擅長找出人類容易忽略的極端情況；程式碼變更後會自動更新測試。 · 工程師真正要做的事：確保測試真實反映產品意圖，杜絕「假測試」（看起來通過但沒測到點）。 · 立刻可做：讓智能體在獨立會話中專門產生測試；人類嚴格審查；確保智能體有權限完整運行測試套件。 5. Review & Deploy（程式碼審查與部署階段） · 傳統痛點：審查量龐大、容易漏氣或效能問題。 · 現在做法：智能體作為第一輪審查者，檢查風格、一致性、基本安全漏洞；部署管線中自動修復小問題。 · 工程師真正要做的事：只看高層設計、跨團隊影響力、最終上線決策。 · 趨勢：人類程式碼審查量將持續下降到現在的10%-20%。新的核心工作流程：Delegate → Review → Own · Delegate（委託）：所有明確、可驗證、重複性高的任務全部丟給智能體。 · Review（審閱）：人類快速檢查輸出，修正微妙錯誤，確保符合團隊規範。 · Own（擁有）：人類永遠保留三件事－系統層級洞察、創意決策、策略方向。工程師每天的時間分配正在發生巨變· 過去：70%寫代碼+ 20%開會+ 10%思考· 現在：10%寫代碼+ 20%審閱智能體輸出+ 70%定義需求、設計系統、思考長期方向給工程Leader 的5 項立即可執行建議 1. 從團隊最痛苦的階段開始（大多數團隊是Build 和Test） 2. 先用現成工具（GitHub Copilot 最新版、Cursor、Codex CLI、o3/o4 等）跑小任務，快速累積信任 3. 立刻建立兩份神器文件： · AGENTS. md（教導智能體了解你們程式碼庫的獨特習慣） · 每張票據強制要求先寫PLAN. md（智能體最愛清楚的計畫） 4. 把測驗覆蓋率當作「給智能體下指令的語言」－測驗越好，智能體越可靠。 5. 最重要：完成文化升級－把「親自寫程式」視為可以外包的機械勞動，把「清楚定義要什麼、為什麼、做到多好」視為工程師的真正核心競爭力。 OpenAI 官方指南：

来自 meng shao（@shao__meng）的推文线程

作者信息

线程正文