扎克伯格：大多数 AI Agent 没有通过我妈妈的测试

前言

当一家公司的 CEO 开始用「能不能给我妈用」来评估产品，这意味着什么？

2026 年 5 月 1 日，Meta CEO 马克·扎克伯格（Mark Zuckerberg）在季度财报电话会议上，罕见地从个人视角评价了 AI Agent 的当前成熟度。他的原话大致意思是：很多 AI Agent 展示了潜力，但它们还没有准备好让我妈妈使用。

这是大厂 CEO 首次将 AI Agent 的成熟度用「家庭场景」来锚定，而非技术指标。

综合 Business Insider、Fox Business 等媒体的报道，扎克伯格的核心观点包括：

1. 「母亲测试」——可用性的终极标准

扎克伯格表示，Meta 内部测试了很多 AI Agent，部分产品在演示阶段表现不错，但当他让团队把产品交给他的母亲试用时，她遇到了各种无法解决的交互问题。

这个标准被外界称为「母亲测试」（Mother Test）——如果一个 AI 产品连科技圈以外的人都能顺畅使用，它才算真正成熟。

2. Meta 不做 AI 编程助手

在被分析师问到 Meta 是否会跟进 Copilot、Cursor 等 AI 编程工具时，扎克伯格明确表示这不是 Meta 的优先方向。他透露，Meta 更关注 Agent 在社交、创意和商业场景中的应用，而非替代程序员写代码。

这与 Google、Microsoft、OpenAI 纷纷推出编程 Agent 的趋势形成了有趣的反差。

3. 裁员与 AI 投入的关系

扎克伯格还承认，Meta 近期裁员约 10% 劳动力（一万人左右），与 AI 基础设施投入有关。他表示，公司正在将资源从人力密集型岗位转向 AI 驱动的自动化，同时也承认这个转变过程中「效率提升不等于人员减少」。

扎克伯格的这个「母亲测试」表述有意思的地方在于：他没有用准确率、延迟、基准测试来评价 AI Agent，而是用了一个极度主观但极度真实的场景——非技术用户的日常使用体验。

这说明 AI Agent 当前的核心问题不是「能不能做到」，而是「能不能稳定地做到且用户信任」。

一个普通的 AI Agent 在家庭场景中会遇到的问题：

这些问题本质上是 Agent 在「开放世界」中的鲁棒性问题，在受控 demo 中很难暴露。

扎克伯格选择不做编程 Agent，可能有几层原因：

这不是扎克伯格首创的说法。事实上，AI 行业早有类似的测试框架：

当行业开始从「能不能做到」转向「能不能让普通人用」，这通常是技术进入主流采用阶段的一个信号。

对谁有用：AI 产品经理、Agent 开发者、投资人——关注 AI Agent 从技术展示走向真实用户场景的转化路径。

影响在哪里：扎克伯格的表态说明头部大厂已经完成了「AI Agent 能做什么」的验证，现在进入「AI Agent 能被谁用」的下一阶段。这意味着产品设计的重心需要从模型能力转向用户体验和容错设计。

如果你的 Agent 产品还没做过「非技术用户测试」，现在是个好时机。

参考来源：