2026 年 4 月 25 日,Meta 与 AWS 签署重要协议,将大规模部署 AWS Graviton 处理器驱动其下一代 AI 工作负载。这标志着两家公司长期合作关系的重大扩展。
核心数据
- 部署规模:数十万 Graviton 核心,未来可进一步扩展
- 客户地位:Meta 成为全球最大 Graviton 客户之一
- 技术基础:基于 Meta 此前在 Amazon Bedrock 上的大规模应用
为什么是 Graviton?
Meta 选择了 Graviton 而不是传统 GPU 集群来驱动 Agentic AI 工作负载,这不是偶然的。
传统观念认为 AI 训练必须依赖 GPU,但 Agentic AI 的工作负载分布正在改变这一认知:
- 代码生成:CPU 密集型,适合 Graviton
- 实时推理:需要高吞吐量和低延迟
- 多步骤任务编排:需要协调大量并发请求
Graviton5 芯片规格:
- 192 核心
- 缓存是上一代的 5 倍
- 核心间通信延迟降低 33%
Agentic AI 的基础设施革命
AWS 副总裁 Nafea Bshara 表示:
“这不仅仅关乎芯片,而是为客户提供构建 AI 的基础设施基础、数据和推理服务,让 AI 能够理解、预测并高效扩展至数十亿人。”
Meta 基础设施负责人此前提到:
“随着我们扩展 Meta AI 背后的基础设施,Graviton 使我们能够高效运行各种工作负载,从训读到推理。“
行业意义
这个协议反映了 AI 基础设施的三个趋势:
- CPU 复兴:Agentic AI 工作负载对 CPU 的需求正在被重新认识
- 成本优化:Graviton 提供比传统方案更好的性价比
- 垂直整合:芯片、框架、云服务的一体化设计