前言

Anthropic 近日公布了一项名为 Project Deal 的内部实验:让 AI Agent 同时代表买方和卖方,在一个人工构建的市场中进行真实的商品交易。这不仅是一次技术演示,更是对 AI Agent 自主代理商业行为的大规模实测。

实验设计

Project Deal 的核心设计如下:

  • 参与者:69 名 Anthropic 员工
  • 预算:每人 100 美元(以礼品卡形式发放)
  • 任务:用 AI Agent 代表自己购买其他同事的物品
  • 交易总额:186 笔交易,总价值超过 4000 美元

Anthropic 实际运行了四个独立市场,采用不同模型和机制,其中一个是「真实」市场(所有参与者均由 Anthropic 最先进模型代表,交易结果在实验后真正兑现)。

关键发现

1. 模型质量直接决定交易结果

使用更先进模型的 Agent,为用户赢得了「客观上更好的交易结果」。然而,参与者本身几乎没有察觉到这一差距。这揭示了一个重要风险:「Agent 质量差距」——使用较弱模型的用户可能意识不到自己处于劣势。

2. 初始指令对交易结果影响甚微

出人意料的是,给 Agent 的初始交易指令(Prompt)对最终成交概率和价格几乎没有影响。这暗示:经过充分训练的 Agent 可能具备超越初始指令的谈判和决策能力。

3. 交易效率超预期

69 名员工在有限预算下完成 186 笔交易,人均近 2.7 笔,交易密度远超普通内部市场。

行业意义

Project Deal 证明了 AI Agent 在真实商业场景中自主决策的可行性。更重要的是,它揭示了一个必须正视的问题:当 AI Agent 代表用户进行经济活动时,模型能力的差距会直接转化为用户利益的不平等。这对未来的 Agent 经济提出了重要的公平性课题。

Anthropic 表示,这次实验是「仅有 pilot experiment with a self-selected participant pool」,但已足够让外界窥见 Agent 代理 commerce 的未来图景。


来源:TechCrunch / Anthropic 官方