Agent 中的 Planning Loop

Planning loop 是 agent 在执行中持续做计划、采取动作、读取反馈并重规划的闭环,不是一次性写完的静态总计划。

#tech / ai #type / concept #status / growing

[!info] related notes

Agent 中的 Planning Loop

一句话定义

Planning loop 是 agent 在执行过程中持续进行 计划 -> 动作 -> 观察 -> 重计划 的闭环。

核心机制 / 工作原理

agent 的 planning 通常不是先写一份大计划再机械执行到底,而是边做边更新:

  • 先根据目标和当前上下文形成下一步计划
  • 调用工具或执行动作
  • 读取真实环境反馈
  • 判断当前路径是否还成立
  • 必要时缩小范围、换策略或请求人工介入

这也是为什么很多 agent 看起来像在“思考很多轮”,本质上是在执行一个带反馈的 planning loop。

最小例子 / 最小场景

一个 coding agent 收到“修复测试失败”后:

  1. 先读失败栈和相关文件
  2. 规划先改哪一层
  3. 修改代码并运行测试
  4. 如果新错误暴露,再基于新反馈调整计划

这就是最典型的 planning loop。

边界与易混淆点

  • planning loop 不等于一开始产出一份很长的 roadmap。真正关键是执行中的持续重规划。
  • planning loop 不等于静态 workflow。像 Prompt Chaining 更偏预定义路径,loop 则更强调反馈驱动。
  • 如果系统没有观察环境和重规划能力,它更像脚本流水线,而不是 agent loop。
创建于 2026/5/4 更新于 2026/5/27