Agent 中的 Approval Checkpoints
Approval checkpoints 是 agent 在高风险或不可逆动作前必须停下并请求授权的控制节点,用来把自动化和人工判断组合起来。
#tech / ai
#type / concept
#status / growing
[!info] related notes
- 所属 MOC: Agent MOC, Coding Agent MOC, Agent Evals MOC
- 前置概念: Agent Guardrails, Agent 中的人类监督
- 并列概念: Agent Runtime
- 易混淆概念: Agent Guardrails
- 关系笔记: Agent 测试与评估
Agent 中的 Approval Checkpoints
一句话定义
Approval checkpoints 是 agent 在执行高风险、越权或不可逆动作前必须暂停并请求人或策略系统授权的控制点。
核心机制 / 工作原理
审批点通常会放在这些地方:
- 资金、权限、生产环境等高风险动作前
- 会造成外部副作用的操作前
- 沙箱外执行或权限升级前
- agent 对当前计划信心不足时
一个有效审批点通常不只是“弹个确认框”,而是会一起提交:
- agent 准备做什么
- 为什么现在要做
- 影响范围是什么
- 可供审批人检查的 diff、命令、目标对象或风险说明
最小例子 / 最小场景
coding agent 准备执行 git push、修改生产配置或运行高权限脚本时:
- runtime 先拦下动作
- 展示变更摘要和目标命令
- 等待人工批准或拒绝
这就是典型的 approval checkpoint。
边界与易混淆点
- approval checkpoint 不等于一般 guardrail。guardrail 可以自动阻止;审批点强调显式授权。
- 它不只发生在最终交付前,也可能出现在执行中间的关键节点。
- 如果审批点放得太晚,副作用已经发生,它就不再是真正的控制点。