核心更新
OpenAI 于 4 月 15 日发布 Agents SDK 重大更新,引入了一系列新能力,旨在帮助开发者更轻松地构建生产级 AI Agent。
这次更新的核心理念是:开发者不仅需要最好的模型,还需要支持 Agent 检查文件、运行命令、编写代码并在多个步骤中持续工作的系统。
新功能一览
1. 模型原生框架(Model-Native Harness)
新的 Agent Harness 专为处理文档、文件和系统的 Agent 设计:
- 可配置内存:支持长时运行任务的上下文管理
- 沙盒感知编排:安全地协调 Agent 执行环境
- Codex 风格文件系统工具:文件读写、代码编辑等
- 标准化集成:支持 MCP、Skills、AGENTS.md 等新兴 Agent 原语
2. 原生沙盒执行
Agent 需要一个安全的工作空间来执行任务。SDK 现在原生支持沙盒执行:
- 开箱即用:无需自己搭建执行环境
- 多平台支持:Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop、Vercel
- 存储集成:AWS S3、Google Cloud Storage、Azure Blob Storage、Cloudflare R2
3. Manifest 抽象
新的 Manifest 抽象让 Agent 的工作空间可跨沙盒提供商移植:
# 示例:定义 Agent 工作空间mount: - local: ./data target: /workspace/dataoutput_dir: /workspace/outputstorage: - provider: s3 bucket: my-agent-data为什么重要
在此之前,开发者面临三难选择:
- 模型无关框架:灵活但无法充分利用前沿模型能力
- 模型提供商 SDK:贴近模型但缺乏足够的执行框架可见性
- 托管 Agent API:简化部署但限制了 Agent 运行位置和数据访问方式
OpenAI 的新 SDK 试图解决这一困境,提供一个即用又灵活的框架,让开发者专注于领域特定逻辑。
实际案例
Oscar Health 使用新 SDK 自动化了临床记录工作流程:
“更新的 Agents SDK 让我们能够可靠地自动化关键的临床记录工作流程。关键区别不仅在于提取正确的元数据,还在于正确理解长而复杂的记录中每次就诊的边界。” — Rachael Burns, Oscar Health Staff Engineer
开发者如何使用
SDK 目前已在 Python 中提供,TypeScript 支持计划在未来发布:
from openai import OpenAI
client = OpenAI()
# 创建带有沙盒的 Agentagent = client.agents.create( model="gpt-4o", instructions="分析数据并生成报告", tools=["shell", "apply_patch"], sandbox={ "provider": "e2b", "manifest": { "mount": [{"local": "./data", "target": "/data"}] } })展望
OpenAI 表示将继续扩展 Agents SDK 的能力,包括:
- 代码模式(Code Mode)
- 子 Agent(Subagents)
- 更多沙盒提供商支持
- TypeScript 支持
这次更新标志着 AI Agent 从实验阶段向基础设施演进的重要一步。
参考来源:OpenAI 官方博客