Agent 中的 Planning Loop
Planning loop 是 agent 在执行中持续做计划、采取动作、读取反馈并重规划的闭环,不是一次性写完的静态总计划。
#tech / ai
#type / concept
#status / growing
[!info] related notes
- 所属 MOC: Agent MOC, Coding Agent MOC
- 前置概念: Agent, Agent 中的 Ground Truth Feedback
- 并列概念: Orchestration, Agent Runtime
- 易混淆概念: Prompt Chaining
- 关系笔记: Coding Agents
Agent 中的 Planning Loop
一句话定义
Planning loop 是 agent 在执行过程中持续进行 计划 -> 动作 -> 观察 -> 重计划 的闭环。
核心机制 / 工作原理
agent 的 planning 通常不是先写一份大计划再机械执行到底,而是边做边更新:
- 先根据目标和当前上下文形成下一步计划
- 调用工具或执行动作
- 读取真实环境反馈
- 判断当前路径是否还成立
- 必要时缩小范围、换策略或请求人工介入
这也是为什么很多 agent 看起来像在“思考很多轮”,本质上是在执行一个带反馈的 planning loop。
最小例子 / 最小场景
一个 coding agent 收到“修复测试失败”后:
- 先读失败栈和相关文件
- 规划先改哪一层
- 修改代码并运行测试
- 如果新错误暴露,再基于新反馈调整计划
这就是最典型的 planning loop。
边界与易混淆点
- planning loop 不等于一开始产出一份很长的 roadmap。真正关键是执行中的持续重规划。
- planning loop 不等于静态 workflow。像 Prompt Chaining 更偏预定义路径,loop 则更强调反馈驱动。
- 如果系统没有观察环境和重规划能力,它更像脚本流水线,而不是 agent loop。