Agent 执行闭环

把 planning loop、tool use、runtime、ground truth feedback、stopping conditions 和 approval checkpoints 放在一条执行链里理解。

#tech / ai #type / synthesis #status / growing

[!info] related notes

Agent 执行闭环

范围

这篇关系笔记不单独解释某一个组件,而是把 agent 真正在运行时怎么形成闭环放到一张图里理解。

为什么要放在一起理解

很多人会分别讨论 planning、tools、runtime、feedback,但真正的系统稳定性来自它们被串起来之后的行为:

  • 只会规划,不会可靠执行,任务推进不下去
  • 只会调工具,不会读反馈,系统会盲走
  • 只会循环,不设停止条件,系统会失控
  • 只会自动执行,不设审批点,系统会在高风险动作上越界

所以 agent 不是若干能力的清单,而是一条受控制的执行闭环。

依赖路径 / 调用链 / 演进链

可以把一个典型 agent loop 粗略理解成:

  1. 接收目标
  2. 进入 planning loop
  3. 在 loop 中选择并执行 tool use
  4. 这些动作由 runtime 负责真正运行和回填结果
  5. 通过 ground truth feedback 判断是否继续、修正或切换路径
  6. 遇到高风险动作时进入 approval checkpoints
  7. 命中成功条件、失败条件或 stopping conditions 后退出

从工程视角看,planning -> action -> observation -> control 才是 agent 的最小执行骨架。

对比与易混淆点

  • Orchestration 更偏系统层“怎么组织流程和角色”;这篇更偏单个 agent 在执行中的闭环。
  • Prompt Chaining 可以有多步,但通常路径预定义;agent execution loop 更强调反馈驱动和动态重规划。
  • 不是所有 agent 都需要很长的 loop,但只要它能根据环境反馈决定下一步,它就已经进入了 execution loop 的范畴。
创建于 2026/5/4 更新于 2026/5/27