Agent
Agent 的关键不是多轮对话,而是围绕目标持续规划、调用工具、读取环境反馈并推进任务完成。
#tech / ai
#type / concept
#status / growing
#resource / agent
[!info] related notes
- 所属 MOC: Agent MOC, AI MOC
- 前置概念: LLM, Augmented LLM
- 并列概念: Agentic Systems, Orchestration, Agent Runtime
- 易混淆概念: AI Agent 创建实践, Agent 在前端研发里是什么
- 关系笔记: Agentic Workflow Patterns, Agent 执行闭环
Agent
一句话定义
Agent 是一种围绕目标持续规划、调用工具、读取环境反馈并决定下一步动作的 LLM 驱动执行体。
核心机制 / 工作原理
Agent 和普通聊天助手的本质差异不在“会不会多轮对话”,而在于它能否形成任务闭环:
- 接收目标或和人澄清目标
- 规划接下来要做什么
- 调用工具或访问环境
- 根据真实反馈判断是否继续、修正、停下或请求人工介入
一个成熟 agent 常见会具备:
- 模型本体
- 工具接口
- 状态或记忆层
- 运行时循环
- 停止条件和 guardrails
如果把这些环节串起来看,可以进一步接到 Agent 执行闭环。
最小例子 / 最小场景
一个 coding agent 收到“修复测试失败”后,如果它能:
- 搜索相关文件
- 运行测试
- 读取报错
- 修改代码
- 再次运行测试直到通过
那么它就已经体现了 agent 的核心特征。
边界与易混淆点
- agent 不等于“任何会调工具的 LLM”。如果整个路径都是代码硬控,它更接近 workflow。
- agent 不等于“完全自主很久的系统”。很多生产 agent 仍然会设置强停止条件和人工审批点。
- agent 也不等于“更会聊天的模型”。它的本质是 goal-driven execution,而不是对话轮数。
面试要点
来自 what-is-agent-in-frontend-engineering-interview-question 的面试视角整理。
一句话回答
Agent 的关键不是会多轮对话,而是能围绕目标拆解任务、调用工具、根据结果继续迭代,最终形成一定的任务闭环。在前端研发里,它更适合接入代码库、规范和工具链来完成半自动开发流程。
最稳的回答主线
- 先说 Agent 和普通聊天助手的本质差别
- 再说它在前端研发里能做什么
- 最后补边界:它适合半自动闭环,不适合脱离人独立负责结果
在前端研发里的典型作用
- 读取代码库和文档上下文
- 拆解任务并逐步执行
- 调用 lint、测试、搜索、脚本等工具
- 根据结果继续修改并收敛问题
常见误区
- 把多轮对话助手都叫 Agent
- 把 Agent 当成完全自主开发者
- 忽略权限、验证和安全边界
可能追问
- Agent 和 AI IDE 有什么区别
- Agent 和 MCP 的关系是什么
- 什么前端任务适合用 Agent,什么不适合
最短记忆方式
普通 AI 回答问题,Agent 更像围绕目标做事。