Agent 中的 Planning Loop

Planning loop 是 agent 在执行中持续做计划、采取动作、读取反馈并重规划的闭环，不是一次性写完的静态总计划。

#tech / ai #type / concept #status / growing

[!info] related notes

所属 MOC: Agent MOC, Coding Agent MOC

前置概念: Agent, Agent 中的 Ground Truth Feedback

并列概念: Orchestration, Agent Runtime

易混淆概念: Prompt Chaining

关系笔记: Coding Agents

Agent 中的 Planning Loop

一句话定义

Planning loop 是 agent 在执行过程中持续进行 计划 -> 动作 -> 观察 -> 重计划 的闭环。

核心机制 / 工作原理

agent 的 planning 通常不是先写一份大计划再机械执行到底，而是边做边更新：

先根据目标和当前上下文形成下一步计划
调用工具或执行动作
读取真实环境反馈
判断当前路径是否还成立
必要时缩小范围、换策略或请求人工介入

这也是为什么很多 agent 看起来像在“思考很多轮”，本质上是在执行一个带反馈的 planning loop。

最小例子 / 最小场景

一个 coding agent 收到“修复测试失败”后：

先读失败栈和相关文件
规划先改哪一层
修改代码并运行测试
如果新错误暴露，再基于新反馈调整计划

这就是最典型的 planning loop。

边界与易混淆点

planning loop 不等于一开始产出一份很长的 roadmap。真正关键是执行中的持续重规划。
planning loop 不等于静态 workflow。像 Prompt Chaining 更偏预定义路径，loop 则更强调反馈驱动。
如果系统没有观察环境和重规划能力，它更像脚本流水线，而不是 agent loop。