资讯正文

大多数应用目前的AI方案,就是在产品里嵌入一个聊天窗口——用户打字(或语音)描述需求,AI去尝试完成。这种「外挂式」交互体验往往比较生硬:纯文本界面很难承载复杂的交互意图,比如你想用一个旅行App规划完整行程,却只能面对一堆文字描述,体验并不好。

CopilotKit的创始团队认为,这种方式没有充分发挥AI Agent和大语言模型的能力。他们的解决方案是:让Agent直接「看懂」并「操控」应用界面,而不只是返回一段文字。

AG-UI协议:连接AI与前端的标准

CopilotKit的开源协议**AG-UI(Agent-User Interface Protocol)**是这套方案的核心。这是一个开放标准,定义了AI Agent如何与应用界面(Web浏览器或App)通信,提供以下关键能力:

  • 流式对话:实时返回进度和结果
  • 前端工具调用:Agent可以触发页面的具体操作
  • 状态共享:人机协作时保持上下文同步
  • 动态UI生成:Agent可以根据场景动态生成交互界面,而非返回大段文字

用创始人Atai Barkai的话说:「Agent不只是用文字块回复你,而是用你公司自己设计的交互组件来响应。比如用户问『按类别展示收入分布』,返回的不是一大段难懂的文字,而是一张用户可以交互的饼图。」

开发者可以完全控制Agent能多大程度改变界面——从「像素级精确」到「提供基础组件让AI自由组装」,都可以按需配置。

AG-UI与MCP、A2A的关系

AG-UI并不是要替代已有协议,而是与它们形成互补:

协议定位解决的问题
MCP(Model Context Protocol)数据连接层让Agent能够访问外部数据源和工具
A2A(Agent2Agent)Agent间通信让不同Agent相互协作
AG-UI前端交互层让Agent理解和操控用户界面

三者各司其职,构成完整的Agent技术栈。

融资与生态进展

本轮融资2700万美元,由Glilot Capital、NFX和SignalFire领投。资金将用于企业级工具包的开发,包括技术支持、自托管部署等功能。

生态方面,AG-UI已获得多家主流厂商支持:

AI基础设施提供商:Google、Microsoft、Amazon、Oracle
开发框架:LangChain、Mastra、PydanticAI、Agno

CopilotKit透露,AG-UI协议目前每周有数百万次安装,大型企业的生产环境中已有较高渗透率。企业客户包括Deutsche等大型金融机构。

为什么这件事值得关注

AG-UI解决的是一个根本问题:AI Agent如何真正融入用户工作流,而不只是对话窗口。在此之前,Agent能做的事情很有限——要么只能回答问题,要么需要通过复杂的API与系统对接。AG-UI提供了一条中间路径:让Agent理解界面、操作界面,同时保留人类干预的空间。

对开发者而言,这意味着不用等待每个App都提供专用API,只要App支持AG-UI协议,Agent就能直接与之交互。


我们的判断:这个消息对两类人最有价值——前端开发者AI应用产品经理。如果你正在构建需要深度用户交互的AI应用,AG-UI值得研究;如果你在评估AI产品的落地可行性,这个协议能让「应用内Agent」的实现成本大幅下降。其他AI从业者可以先了解生态布局,密切关注协议覆盖的工具和应用数量变化。