Agent 中的 Approval Checkpoints

Approval checkpoints 是 agent 在高风险或不可逆动作前必须停下并请求授权的控制节点,用来把自动化和人工判断组合起来。

#tech / ai #type / concept #status / growing

[!info] related notes

Agent 中的 Approval Checkpoints

一句话定义

Approval checkpoints 是 agent 在执行高风险、越权或不可逆动作前必须暂停并请求人或策略系统授权的控制点。

核心机制 / 工作原理

审批点通常会放在这些地方:

  • 资金、权限、生产环境等高风险动作前
  • 会造成外部副作用的操作前
  • 沙箱外执行或权限升级前
  • agent 对当前计划信心不足时

一个有效审批点通常不只是“弹个确认框”,而是会一起提交:

  • agent 准备做什么
  • 为什么现在要做
  • 影响范围是什么
  • 可供审批人检查的 diff、命令、目标对象或风险说明

最小例子 / 最小场景

coding agent 准备执行 git push、修改生产配置或运行高权限脚本时:

  • runtime 先拦下动作
  • 展示变更摘要和目标命令
  • 等待人工批准或拒绝

这就是典型的 approval checkpoint。

边界与易混淆点

  • approval checkpoint 不等于一般 guardrail。guardrail 可以自动阻止;审批点强调显式授权。
  • 它不只发生在最终交付前,也可能出现在执行中间的关键节点。
  • 如果审批点放得太晚,副作用已经发生,它就不再是真正的控制点。
创建于 2026/5/4 更新于 2026/5/27