Google 11月最新白皮書「Introduction to Agents」— 作為「Google x Kaggle 5天AI 智能體強化課程」的開篇,提供從概念驗證到生產級智能體系統的指導架構。 Google 這本最新白皮書,聚焦於AI 智能體的核心架構、分類、構建實踐、生產部署、安全治理以及演化學習,客觀分析了生成式AI 從被動預測向自主問題解決的轉變,強調智能體是語言模型在軟體中的自然延伸,能夠透過循環推理、行動和觀察來實現目標。 白皮書的核心觀點是:建立智能體並非簡單整合語言模型,而是設計一個完整的應用系統,需要平衡靈活性和可靠性。 1. 從預測AI 到自治智能體 AI 正從被動任務(如翻譯或生成圖像)轉向自主智能體,這些系統能獨立規劃和執行多步驟任務,而不是依賴人類每個步驟指導。智能體結合語言模型的推理能力與實際行動工具,使其成為「語言模型的自然演化,在軟體中變得實用」。白皮書強調,從原型到生產級的挑戰在於確保安全性、品質和可靠性。 2. 智能體介紹智能體定義為模型、工具、編排層和運行服務的組合,透過語言模型循環來達成目標。核心組件包括: · 模型(大腦):核心推理引擎,如一般模型、微調模型或多模態模型,負責處理資訊、評估選項和決策。 · 工具(雙手):連接外部世界的機制,包括API、程式碼函數和資料存儲,用於獲取即時資訊或執行行動。 · 編排層(神經系統):管理操作循環,處理規劃、記憶和推理策略(如鍊式思考或ReAct)。 · 部署(身體和腿部):從本地原型到安全、可擴展伺服器的託管,確保透過UI 或API 存取。 開發智能體類似導演角色:設定指導提示、選擇工具並提供上下文。白皮書指出,語言模型的彈性是雙面刃,需要「情境工程」來引導可靠輸出。智能體本質上是上下文視窗的策展者,能適應新情境解決問題。 3. 智能體問題解決製程智能體透過連續循環達成目標,分為五個步驟: 1. 取得任務:從使用者或觸發器接收高水準目標。 2. 掃描場景:感知環境,收集情境(如使用者請求、記憶、工具)。 3. 思考:模型分析任務並制定計畫。 4. 行動:執行計畫的第一步,如呼叫工具。 5. 觀察與迭代:評估結果,更新上下文並循環。 範例:當客戶支援智能體處理「我的訂單#12345在哪裡?」時,先規劃多步驟(尋找訂單、查詢追蹤、合成回應),然後逐一執行。這種「思考-行動-觀察」循環使智能體處理複雜任務。 4. 智能體系統分類白皮書將智能體分為五個級別,每級以前一級擴展為基礎: · 0級:核心推理系統:孤立語言模型,僅依賴預訓練知識,無法即時互動。 · 1級:連線問題解決者:新增工具,能存取外部資料(如搜尋API)。 · 2級:策略問題解決者:支援複雜規劃與情境工程,能主動管理資訊。 · 3級:協作多智能體系統:如人類團隊,智能體將其他智能體視為工具,實現分工。 · 4級:自演化系統:辨識能力差距,動態創造新工具或智慧體。 5. 核心智能體架構:模型、工具和編排· 模型選擇:優先考慮特定任務的推理和工具使用能力,而非通用基準。建議多模型路由(如大模型規劃、小模型執行)以最佳化成本和速度。多模態模型處理影像/音頻,或使用專用工具轉換資料。 · 工具:分為資訊檢索(如RAG、NL2SQL)和行動執行(如API 呼叫、程式碼沙箱)。函數呼叫透過OpenAPI 或MCP 連接,確保可靠互動。包括人類互動工具(如HITL 確認)。 · 編排層:管理循環,決定何時思考或行動。核心選擇包括自主程度(確定性vs. 動態)、實作方法(無程式碼vs. 程式碼優先,如ADK)和框架(開放、可觀測)。 6. 核心設計選擇、多智能體系統和設計模式· 指令與上下文:使用系統提示注入領域知識和角色(如“友好支持智能體”)。增強上下文包括短期記憶(當前會話)和長期記憶(RAG 查詢歷史)。 · 多智能體:採用「專家團隊」模式,避免單一超級智能體。常見模式:協調器(路由子任務)、順序(流水線)、迭代精煉(產生-批評循環)和HITL(人類審批)。 · 部署與服務:從本地到雲端託管(如Vertex AI Agent Engine 或Cloud Run)。需處理會話歷史、安全日誌和合規。 7. Agent Ops:結構化處理不確定性 Agent Ops 是DevOps 和MLOps 的演化,針對智能體的隨機性。關鍵實踐: · 度量重要指標:如目標完成率、使用者滿意度、延遲和業務影響。 · 品質評估:使用「語言模型作為評判者」對輸出評分,基於黃金資料集。 · 指標驅動開發:自動化測試變化,A/B 部署驗證。 · 調試:OpenTelemetry 追蹤記錄執行路徑。 · 人類回饋:將報告轉化為新測試案例,關閉循環。 8. 智慧體互通性· 智慧體與人類:透過聊天UI、電腦使用工具(控制介面)、動態UI 產生或即時多模態(如Gemini Live API)互動。 · 智能體與智能體:A2A 協定標準化發現與通訊(非同步任務)。 · 智能體與金錢:AP2 和x402 協議處理交易,確保授權和微支付。 9. 安全與擴展· 單一智能體安全:平衡效用與風險,使用混合防護(確定性護欄+ AI 守衛)。智能體身分作為新主體,使用SPIFFE 驗證。 ADK 範例:回呼、外掛程式和Model Armor 偵測注入。 · 擴展到企業艦隊:處理“智能體蔓延”,透過控制平面(網關+ 註冊表)強制政策。專注於安全(提示注入、資料外洩)和基礎設施(可靠性和成本,如預置吞吐量)。 10. 智能體如何演化學習智能體需適應變化,避免「老化」。學習來源:運作經驗(日誌、HITL 回饋)和外部訊號(政策更新)。優化包括上下文工程和工具創建。範例:多智能體工作流程學習合規指南。 Agent Gym 是前沿:離線模擬平台,使用合成數據和專家諮詢優化。 11. 高階智能體範例· Google Co-Scientist:虛擬研究夥伴,產生並評估假設。透過監督智能體管理專家團隊,運行循環改進想法。 · AlphaEvolve:發現演算法,結合Gemini 產生程式碼和演化評估。人類指導定義問題,確保透明實用。 12. 結論智能體將AI 從工具轉變為夥伴,透過模型、工具和編排的整合來實現自主性。開發者需從“磚瓦工”轉向“導演”,強調評價和治理。這個框架指導建構可靠系統,推動智能體成為團隊成員。 Google x Kaggle 5天AI 智能體強化課程: https://t.co/0REUoVY2EN Google 11月最新白皮書「Introduction to Agents」:
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
