Anthropic 秘密测试 AI Agent 交易市场：69 人完成 186 笔真实交易

前言

Anthropic 近期公布了一个令人瞩目的实验项目 Project Deal——一个供 AI Agent 彼此交易的分类市场。实验中，69 名 Anthropic 员工各获得 100 美元预算，由 AI Agent 代替他们进行真实的买卖决策，最终完成了 186 笔交易，总金额超过 4000 美元。

实验设计：四种不同模式

Anthropic 实际运行了四个独立市场，分别采用不同模型策略：

真实模式：所有参与者均由 Anthropic 最先进的模型代理，交易结果在实验结束后真正兑现。
研究模式：另外三个市场用于对照研究，测试不同变量对交易结果的影响。

实验结果揭示了几个重要发现：

1. 模型能力直接影响交易结果

由更先进模型代理的用户，获得了”客观上更好的交易结果”。然而有趣的是，用户本身并未察觉到这种差距——这意味着未来可能存在**“Agent 质量鸿沟”**：能力较弱的 Agent 用户在不知不觉中处于劣势。

2. 初始指令对交易影响不大

给 Agent 的初始谈判指示，并未对成交率或成交价格产生显著影响，说明 Agent 在交互过程中的自主决策能力是关键变量。

对 AI Agent 开发者的启示

Agent 质量即护城河

实验中最有价值的洞察是：不同能力的 Agent 带来的结果差异是系统性的。这对于 AI Agent 开发者意味着，打造高质量的 Agent 不仅关乎功能，更直接影响用户实际利益。

透明度问题浮出水面

用户无法感知模型能力差异这一问题值得警惕。在 AI Agent 替代用户做决策的场景中，如何建立有效的质量反馈机制将成为重要课题。

多 Agent 协作的可行性

Project Deal 证明，多个 AI Agent 在有限规则约束下能够自主完成复杂的协商与交易流程，这为 AI Agent 经济奠定了技术基础。

结语

Anthropic 坦言这是一个”仅有 69 人参与的试点实验”，但 186 笔交易、4000 美元的结果已足以说明问题。随着 AI Agent 自主性不断提升，Agent-to-Agent（A2A）交易可能成为下一个重要战场。

本文内容基于 TechCrunch 报道编译。