Goal-Driven Execution

把任务改写成可验证成功状态,再围绕这个状态循环执行和验证的 agent 原则。

#type / concept #status / growing #tech / ai #resource / karpathy-guidelines

[!info] related notes

Goal-Driven Execution

一句话定义

不要只接受“修 bug”“加验证”这种口号式任务,而要把它重写成可验证的成功状态,再循环执行直到达成。

核心机制 / 工作原理

LLM 很擅长围绕清晰终止条件持续迭代,但如果成功标准很弱,它就容易看起来做了很多,实际上并没有完成。这个原则把任务从命令式描述转换为可验证目标。

最小例子 / 最小场景

“修复重复 score 时排序坏了”应先变成“写一个能复现重复 score 排序错误的测试,并让它通过”,然后再做实现修改。

边界与易混淆点

  • 它和 TDD 高度相邻,但范围更广,重点是任务表述方式
  • 不是所有任务都必须先写测试,但都应该有清晰可验证终点
创建于 2026/5/3 更新于 2026/5/27