在前面的文章中,介绍过AI领域交互协议的三种代表范式——FC、MCP、A2A:
其中,Function Calling面向单点功能,是“工具调用”的基础设施;MCP更注重系统间的交互,是多系统间的“连接协议”,解决模型与外部系统的标准化交互;而A2A更擅长群体(Agent)协作,可以推动上述二者的基础上推动多智能体生态的形成。
三者分别面向单点功能、系统连接、群体协同三个层级,结合起来,则可以构成一个自顶向下、从内部任务处理到外部多智能体工具协同的技术生态。
三者未来的发展趋势可能会趋向于:MCP可能成为底层协议,A2A在其上实现多Agent协作,Function Calling作为轻量级补充。
从中可以观察到这样一个趋势:随着AI技术的快速发展并在各行各业落地实践,标准通用交互协议涌现的速度也在不断加快。由此我们可以预测,将来会有越来越多的标准开放协议出现,最终由三到五个标准协议成为主流和事实上的标准,其他协议则会成为垂直细分领域的补充而存在。
但如果仔细观察,你会发现这三大范式都属于“后端协议”,缺少和前端的交互标准协议。按照发展趋势推演,很快会出现覆盖前后端交互的AI开放协议,所以,AG-UI出现了。
一、什么是AG-UI?
AG-UI(Agent-User Interface Protocol)协议是智能体领域新兴的开放协议,旨在标准化AI Agent与前端应用之间的连接方式。它的核心目标是简化智能体与用户界面的交互流程,提升开发效率与跨平台兼容性,于2025年5月13日由CopilotKit推出。
AG-UI出现的背景,一方面是技术发展的必然趋势,另一方面则是因为传统的通信协议在智能体实时交互,以及多模态支持方面开始显现瓶颈。而AG-UI协议基于支持轻量级事件驱动的技术架构,更适合多端多设备上的AI实时交互。
二、AG-UI的技术架构与实现方式
项目开发文档:https://docs.ag-ui.com/introduction
GitHub项目仓库:https://github.com/ag-ui-protocol/ag-ui
AG-UI基于事件驱动模型,采用模块化设计,主要技术特点包括:
AG-UI采用分层架构设计,主要包括如下三层:
实现示例:在线聊天场景,用户输入通过WebSocket发送至Agent,AG-UI协议将响应拆分为多个事件(如文本生成、表情推荐),并并行推送到前端。
三、AG-UI的核心功能与应用场景
AG-UI的核心功能有如下几点:
AG-UI的典型应用场景有如下几种:
四、AG-UI与同类协议的对比分析


相比于HTTP和WebSocket协议,AG-UI具备如下两点优势:
五、AG-UI的优缺点与面临的挑战
AG-UI的优点很明显:
但在当下来说,AG-UI仍存在一些不足和挑战:
六、AG-UI的实际应用案例
通过目前已经披露出的信息来看,AG-UI协议未来有望成为智能体前后端交互的“事实标准”,因为它开放性与轻量化设计为开发者提供了新的可能性,但也需社区共同努力解决标准化与安全性等挑战。
总的来看,AG-UI未来的扩展方向有如下几种: