智能体通信协议全景图
@CopilotKit 最新发布的「The Agent Protocol Landscape」,分析了 MCP、A2A 和 AG-UI 等智能体协议,以及智能体生态组成等,可以帮我们重新理解智能体通信协议。
关键概念与生态基础
文档首先澄清基础术语:智能体应用(Agentic Applications)是指用户与智能体直接协作的界面,支持实时、多模态互动。协议生态围绕多层交互展开,包括智能体与用户的连接、智能体与工具/数据的集成,以及智能体间的协调。这些协议促进了生态的兼容性,例如通过共享格式实现跨框架协作。
核心协议包括:
· MCP(Model Context Protocol):由 Anthropic 维护的开源标准,主要处理模型与客户端之间的结构化上下文和工具访问,确保安全连接外部系统。
· AG-UI(Agent-User Interaction Protocol):CopilotKit 维护的开源协议,专注于智能体后端与前端的实时双向互动,支持多种客户端如 React、移动端或 Slack。
· A2A(Agent-to-Agent):Google 维护的开源协议,启用不同框架下智能体间的安全消息传递和任务委托。
这些协议形成互补栈:AG-UI 桥接用户界面,MCP 管理工具接入,A2A 处理多智能体协调。此外,生成式 UI 规范如 MCP-UI(Anthropic/Microsoft + Shopify)和 Open-JSON-UI(OpenAI)补充了协议,允许智能体返回动态 UI 组件,而非纯文本,提升交互灵活性。
协议全景详解
· 智能体 ↔ 用户交互:AG-UI 主导,提供事件驱动的标准,支持生成式 UI 规范的渲染,实现从聊天到“协作者”模式的转变。
· 智能体 ↔ 声明式 UI:MCP-UI 和 Open-JSON-UI 定义了 LLM 友好的可视化格式,帮助智能体生成可渲染的响应。
· 智能体 ↔ 工具与数据:MCP 确保安全访问外部资源,避免直接共享工具。
· 智能体 ↔ 智能体:A2A 支持目标协商和任务分发,促进分布式协作。
AG-UI 特别值得一提,它是一种横向的多对多协议,支持多种 UI 规范的集成,并通过“握手”机制(如 AG-UI 与 MCP 的联动)可视化工具输出或多智能体协作。CopilotKit 作为上层框架,进一步统一这些协议,实现生产级应用的组合性。
比较与误区澄清
文档强调协议间的互补性,而非竞争:
· AG-UI 侧重运行时连接,与 MCP-UI/Open-JSON-UI 的渲染规范相辅相成。
· 整体生态避免单一主导,转向分布式标准,避免“协议即 API”的误解——它们更像是共享 schema、安全规则和生态规范。
常见误区包括:将 AG-UI 视为纯可视化工具(实际它是连接协议),或忽略协议覆盖用户/工具层面的广度。挑战在于维持状态性和安全性,同时处理多协议下的可观测性和政策传播。
文档地址:
邵猛,中年失业程序员 😂
专注 - Context Engineering, AI Agents.
分享 - AI papers, apps and OSS.
ex Microsoft MVP
合作 - 私信/邮箱:shaomeng@outlook.com
📢 公众号/小红书: AI 启蒙小伙伴