Agent 中的 Approval Checkpoints

Approval checkpoints 是 agent 在高风险或不可逆动作前必须停下并请求授权的控制节点，用来把自动化和人工判断组合起来。

#tech / ai #type / concept #status / growing

[!info] related notes

所属 MOC: Agent MOC, Coding Agent MOC, Agent Evals MOC

前置概念: Agent Guardrails, Agent 中的人类监督

并列概念: Agent Runtime

易混淆概念: Agent Guardrails

关系笔记: Agent 测试与评估

Agent 中的 Approval Checkpoints

一句话定义

Approval checkpoints 是 agent 在执行高风险、越权或不可逆动作前必须暂停并请求人或策略系统授权的控制点。

核心机制 / 工作原理

审批点通常会放在这些地方：

资金、权限、生产环境等高风险动作前
会造成外部副作用的操作前
沙箱外执行或权限升级前
agent 对当前计划信心不足时

一个有效审批点通常不只是“弹个确认框”，而是会一起提交：

agent 准备做什么
为什么现在要做
影响范围是什么
可供审批人检查的 diff、命令、目标对象或风险说明

最小例子 / 最小场景

coding agent 准备执行 git push、修改生产配置或运行高权限脚本时：

runtime 先拦下动作
展示变更摘要和目标命令
等待人工批准或拒绝

这就是典型的 approval checkpoint。

边界与易混淆点

approval checkpoint 不等于一般 guardrail。guardrail 可以自动阻止；审批点强调显式授权。
它不只发生在最终交付前，也可能出现在执行中间的关键节点。
如果审批点放得太晚，副作用已经发生，它就不再是真正的控制点。