Agent

Agent 的关键不是多轮对话，而是围绕目标持续规划、调用工具、读取环境反馈并推进任务完成。

#tech / ai #type / concept #status / growing #resource / agent

[!info] related notes

所属 MOC: Agent MOC, AI MOC

前置概念: LLM, Augmented LLM

并列概念: Agentic Systems, Orchestration, Agent Runtime

易混淆概念: AI Agent 创建实践, Agent 在前端研发里是什么

关系笔记: Agentic Workflow Patterns, Agent 执行闭环

Agent

一句话定义

Agent 是一种围绕目标持续规划、调用工具、读取环境反馈并决定下一步动作的 LLM 驱动执行体。

核心机制 / 工作原理

Agent 和普通聊天助手的本质差异不在“会不会多轮对话”，而在于它能否形成任务闭环：

接收目标或和人澄清目标
规划接下来要做什么
调用工具或访问环境
根据真实反馈判断是否继续、修正、停下或请求人工介入

一个成熟 agent 常见会具备：

模型本体
工具接口
状态或记忆层
运行时循环
停止条件和 guardrails

如果把这些环节串起来看，可以进一步接到 Agent 执行闭环。

最小例子 / 最小场景

一个 coding agent 收到“修复测试失败”后，如果它能：

搜索相关文件
运行测试
读取报错
修改代码
再次运行测试直到通过

那么它就已经体现了 agent 的核心特征。

边界与易混淆点

agent 不等于“任何会调工具的 LLM”。如果整个路径都是代码硬控，它更接近 workflow。
agent 不等于“完全自主很久的系统”。很多生产 agent 仍然会设置强停止条件和人工审批点。
agent 也不等于“更会聊天的模型”。它的本质是 goal-driven execution，而不是对话轮数。

面试要点

来自 what-is-agent-in-frontend-engineering-interview-question 的面试视角整理。

一句话回答

Agent 的关键不是会多轮对话，而是能围绕目标拆解任务、调用工具、根据结果继续迭代，最终形成一定的任务闭环。在前端研发里，它更适合接入代码库、规范和工具链来完成半自动开发流程。

最稳的回答主线

先说 Agent 和普通聊天助手的本质差别
再说它在前端研发里能做什么
最后补边界：它适合半自动闭环，不适合脱离人独立负责结果

在前端研发里的典型作用

读取代码库和文档上下文
拆解任务并逐步执行
调用 lint、测试、搜索、脚本等工具
根据结果继续修改并收敛问题

常见误区

把多轮对话助手都叫 Agent
把 Agent 当成完全自主开发者
忽略权限、验证和安全边界

可能追问

Agent 和 AI IDE 有什么区别
Agent 和 MCP 的关系是什么
什么前端任务适合用 Agent，什么不适合

最短记忆方式

普通 AI 回答问题，Agent 更像围绕目标做事。

Tool Use in Agents

Agent

一句话定义

核心机制 / 工作原理

最小例子 / 最小场景

边界与易混淆点

面试要点

一句话回答

最稳的回答主线

在前端研发里的典型作用

常见误区

可能追问

最短记忆方式

Related notes