X (Twitter)

Google 11月最新白皮書「Introduction to Agents」— 作為「Google x Kaggle 5天AI 智能體強化課程」的開篇，提供從概念驗證到生產級智能體系統的指導架構。 Google 這本最新白皮書，聚焦於AI 智能體的核心架構、分類、構建實踐、生產部署、安全治理以及演化學習，客觀分析了生成式AI 從被動預測向自主問題解決的轉變，強調智能體是語言模型在軟體中的自然延伸，能夠透過循環推理、行動和觀察來實現目標。白皮書的核心觀點是：建立智能體並非簡單整合語言模型，而是設計一個完整的應用系統，需要平衡靈活性和可靠性。 1. 從預測AI 到自治智能體 AI 正從被動任務（如翻譯或生成圖像）轉向自主智能體，這些系統能獨立規劃和執行多步驟任務，而不是依賴人類每個步驟指導。智能體結合語言模型的推理能力與實際行動工具，使其成為「語言模型的自然演化，在軟體中變得實用」。白皮書強調，從原型到生產級的挑戰在於確保安全性、品質和可靠性。 2. 智能體介紹智能體定義為模型、工具、編排層和運行服務的組合，透過語言模型循環來達成目標。核心組件包括： · 模型（大腦）：核心推理引擎，如一般模型、微調模型或多模態模型，負責處理資訊、評估選項和決策。 · 工具（雙手）：連接外部世界的機制，包括API、程式碼函數和資料存儲，用於獲取即時資訊或執行行動。 · 編排層（神經系統）：管理操作循環，處理規劃、記憶和推理策略（如鍊式思考或ReAct）。 · 部署（身體和腿部）：從本地原型到安全、可擴展伺服器的託管，確保透過UI 或API 存取。開發智能體類似導演角色：設定指導提示、選擇工具並提供上下文。白皮書指出，語言模型的彈性是雙面刃，需要「情境工程」來引導可靠輸出。智能體本質上是上下文視窗的策展者，能適應新情境解決問題。 3. 智能體問題解決製程智能體透過連續循環達成目標，分為五個步驟： 1. 取得任務：從使用者或觸發器接收高水準目標。 2. 掃描場景：感知環境，收集情境（如使用者請求、記憶、工具）。 3. 思考：模型分析任務並制定計畫。 4. 行動：執行計畫的第一步，如呼叫工具。 5. 觀察與迭代：評估結果，更新上下文並循環。範例：當客戶支援智能體處理「我的訂單#12345在哪裡？」時，先規劃多步驟（尋找訂單、查詢追蹤、合成回應），然後逐一執行。這種「思考-行動-觀察」循環使智能體處理複雜任務。 4. 智能體系統分類白皮書將智能體分為五個級別，每級以前一級擴展為基礎： · 0級：核心推理系統：孤立語言模型，僅依賴預訓練知識，無法即時互動。 · 1級：連線問題解決者：新增工具，能存取外部資料（如搜尋API）。 · 2級：策略問題解決者：支援複雜規劃與情境工程，能主動管理資訊。 · 3級：協作多智能體系統：如人類團隊，智能體將其他智能體視為工具，實現分工。 · 4級：自演化系統：辨識能力差距，動態創造新工具或智慧體。 5. 核心智能體架構：模型、工具和編排· 模型選擇：優先考慮特定任務的推理和工具使用能力，而非通用基準。建議多模型路由（如大模型規劃、小模型執行）以最佳化成本和速度。多模態模型處理影像/音頻，或使用專用工具轉換資料。 · 工具：分為資訊檢索（如RAG、NL2SQL）和行動執行（如API 呼叫、程式碼沙箱）。函數呼叫透過OpenAPI 或MCP 連接，確保可靠互動。包括人類互動工具（如HITL 確認）。 · 編排層：管理循環，決定何時思考或行動。核心選擇包括自主程度（確定性vs. 動態）、實作方法（無程式碼vs. 程式碼優先，如ADK）和框架（開放、可觀測）。 6. 核心設計選擇、多智能體系統和設計模式· 指令與上下文：使用系統提示注入領域知識和角色（如“友好支持智能體”）。增強上下文包括短期記憶（當前會話）和長期記憶（RAG 查詢歷史）。 · 多智能體：採用「專家團隊」模式，避免單一超級智能體。常見模式：協調器（路由子任務）、順序（流水線）、迭代精煉（產生-批評循環）和HITL（人類審批）。 · 部署與服務：從本地到雲端託管（如Vertex AI Agent Engine 或Cloud Run）。需處理會話歷史、安全日誌和合規。 7. Agent Ops：結構化處理不確定性 Agent Ops 是DevOps 和MLOps 的演化，針對智能體的隨機性。關鍵實踐： · 度量重要指標：如目標完成率、使用者滿意度、延遲和業務影響。 · 品質評估：使用「語言模型作為評判者」對輸出評分，基於黃金資料集。 · 指標驅動開發：自動化測試變化，A/B 部署驗證。 · 調試：OpenTelemetry 追蹤記錄執行路徑。 · 人類回饋：將報告轉化為新測試案例，關閉循環。 8. 智慧體互通性· 智慧體與人類：透過聊天UI、電腦使用工具（控制介面）、動態UI 產生或即時多模態（如Gemini Live API）互動。 · 智能體與智能體：A2A 協定標準化發現與通訊（非同步任務）。 · 智能體與金錢：AP2 和x402 協議處理交易，確保授權和微支付。 9. 安全與擴展· 單一智能體安全：平衡效用與風險，使用混合防護（確定性護欄+ AI 守衛）。智能體身分作為新主體，使用SPIFFE 驗證。 ADK 範例：回呼、外掛程式和Model Armor 偵測注入。 · 擴展到企業艦隊：處理“智能體蔓延”，透過控制平面（網關+ 註冊表）強制政策。專注於安全（提示注入、資料外洩）和基礎設施（可靠性和成本，如預置吞吐量）。 10. 智能體如何演化學習智能體需適應變化，避免「老化」。學習來源：運作經驗（日誌、HITL 回饋）和外部訊號（政策更新）。優化包括上下文工程和工具創建。範例：多智能體工作流程學習合規指南。 Agent Gym 是前沿：離線模擬平台，使用合成數據和專家諮詢優化。 11. 高階智能體範例· Google Co-Scientist：虛擬研究夥伴，產生並評估假設。透過監督智能體管理專家團隊，運行循環改進想法。 · AlphaEvolve：發現演算法，結合Gemini 產生程式碼和演化評估。人類指導定義問題，確保透明實用。 12. 結論智能體將AI 從工具轉變為夥伴，透過模型、工具和編排的整合來實現自主性。開發者需從“磚瓦工”轉向“導演”，強調評價和治理。這個框架指導建構可靠系統，推動智能體成為團隊成員。 Google x Kaggle 5天AI 智能體強化課程： https://t.co/0REUoVY2EN Google 11月最新白皮書「Introduction to Agents」：

来自 meng shao（@shao__meng）的推文线程

作者信息

线程正文