Summary
Sandbox(沙箱)是 harness 的执行环境,类比于服务器在传统应用中的角色。Harness 负责推理和调用工具,Sandbox 提供隔离的计算环境、文件系统和状态管理。
Key Points
Sandboxes Vs Servers
- 服务器:运行应用,使用计算资源、写入文件系统、跨重启保持状态
- Sandbox:运行 harness,提供隔离执行环境
- 两者可独立替换:swap either one independently and the system still works
Core Functions
- Compute Isolation:隔离的执行环境,防止 agent 行为污染主系统
- Filesystem Access:agent 创建、修改、删除文件的场所
- State Persistence:跨会话保持状态的能力
State Components
- Trajectory(轨迹):完整记录——问了什么问题、做了什么 tool call、做了什么决策
- Local Data(本地数据):下载的文件、新写的 skills、生成的分析、修改的 code
Providers
- Daytona:Cloud-hosted sandboxes
- E2B:Cloud-hosted sandboxes
- Stripe Minions:Self-hosted option
- Browserbase:Browser automation sandboxes
Open Questions
- How will enterprises balance managed vs self-hosted sandbox options?
- What trajectory ownership models will emerge?
Evidence Timeline
- 2026-04-20: Ingested from Aparna Dhinakaran’s “Sandboxes Are the Servers of the Harness Era”