OpenAI 官方指南:建構AI 原生工程團隊 2025年軟體開發已正式進入「智能體主導執行、人類負責審閱與決策」的時代。整個軟體開發生命週期的80% 重複性工作都可以也應該交給編碼智能體完成,工程師的價值正在快速從「寫入程式碼」遷移到「定義問題、設計系統、掌握方向」。 能力演進時間表· 早期:只能補全幾行程式碼,推理時間僅30秒左右。 · 現在:領先模型已能持續推理2小時以上,每7個月左右能力翻倍,可一次理解整個程式碼庫、呼叫工具、自動跑測試、自我糾錯。 · 結果:從規劃到部署的完整特性,智能體已能獨立交付,人類只需要審閱和做最終決策。 · OpenAI 內部真實資料:原本需要幾週的任務,現在幾天即可完成,工程師把大量文件、依賴維護、特性旗標清理等重複性工作完全交給Codex 智能體。 軟體開發五大階段的徹底重構 1. Plan(規劃階段) · 傳統痛點:需求模糊、依賴、重複開會對齊。 · 現在做法:把產品規格、票據丟給智能體,它會自動拆解成子任務、標記模糊點、找出所有依賴文件、預估實現難度、指出潛在風險。 · 工程師真正要做的事:決定優先順序、取捨範圍、最終拍板故事點數。 · 立刻可做:找出團隊裡最常需要「程式碼對齊」的場景(如新特性範圍討論),先讓智能體自動補充上下文和依賴分析。 2. Design(設計階段) · 傳統痛點:Figma 轉程式碼慢、反覆重工、難以快速試多個方案。 · 現在做法:多模態智能體直接把設計稿(Figma/圖片)轉換成100%符合現有設計系統的高保真React/Vue/SwiftUI 元件,10秒內出3-5個不同實作方案。 · 工程師真正要做的事:決定整體設計語言、互動模式、元件重複使用策略。 · 立刻可做:把組件庫透過MCP 暴露給智能體,建立「設計圖→組件→程式碼」一鍵連結。 3. Build(編碼階段) · 傳統痛點:大量樣板程式碼、找舊實作、上下文頻繁切換、編譯錯來回修。 · 現在做法:智能體一次產生完整特性,包括後端API、資料庫遷移、前端頁、錯誤處理、日誌、單元測試、README,全程跨數十個檔案保持一致,邊寫邊自動修復編譯錯誤。 · 工程師真正要做的事:只專注於架構影響、安全、效能、可維護性等高階問題。 · 立刻可做:從小而規格明確的任務開始;要求智能體先輸出PLAN. md 再動手;建立AGENTS. md 文件教它團隊的獨特規範和測試流程。 4. Test(測試階段) · 傳統痛點:測驗永遠寫不完、覆蓋率被犧牲、邊緣case 容易漏。 · 現在做法:智能體會根據產品規格自動產生測試案例,尤其擅長找出人類容易忽略的極端情況;程式碼變更後會自動更新測試。 · 工程師真正要做的事:確保測試真實反映產品意圖,杜絕「假測試」(看起來通過但沒測到點)。 · 立刻可做:讓智能體在獨立會話中專門產生測試;人類嚴格審查;確保智能體有權限完整運行測試套件。 5. Review & Deploy(程式碼審查與部署階段) · 傳統痛點:審查量龐大、容易漏氣或效能問題。 · 現在做法:智能體作為第一輪審查者,檢查風格、一致性、基本安全漏洞;部署管線中自動修復小問題。 · 工程師真正要做的事:只看高層設計、跨團隊影響力、最終上線決策。 · 趨勢:人類程式碼審查量將持續下降到現在的10%-20%。 新的核心工作流程:Delegate → Review → Own · Delegate(委託):所有明確、可驗證、重複性高的任務全部丟給智能體。 · Review(審閱):人類快速檢查輸出,修正微妙錯誤,確保符合團隊規範。 · Own(擁有):人類永遠保留三件事-系統層級洞察、創意決策、策略方向。 工程師每天的時間分配正在發生巨變· 過去:70%寫代碼+ 20%開會+ 10%思考· 現在:10%寫代碼+ 20%審閱智能體輸出+ 70%定義需求、設計系統、思考長期方向 給工程Leader 的5 項立即可執行建議 1. 從團隊最痛苦的階段開始(大多數團隊是Build 和Test) 2. 先用現成工具(GitHub Copilot 最新版、Cursor、Codex CLI、o3/o4 等)跑小任務,快速累積信任 3. 立刻建立兩份神器文件: · AGENTS. md(教導智能體了解你們程式碼庫的獨特習慣) · 每張票據強制要求先寫PLAN. md(智能體最愛清楚的計畫) 4. 把測驗覆蓋率當作「給智能體下指令的語言」-測驗越好,智能體越可靠。 5. 最重要:完成文化升級-把「親自寫程式」視為可以外包的機械勞動,把「清楚定義要什麼、為什麼、做到多好」視為工程師的真正核心競爭力。 OpenAI 官方指南:
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
