Agent

Agent 的关键不是多轮对话,而是围绕目标持续规划、调用工具、读取环境反馈并推进任务完成。

#tech / ai #type / concept #status / growing #resource / agent

[!info] related notes

Agent

一句话定义

Agent 是一种围绕目标持续规划、调用工具、读取环境反馈并决定下一步动作的 LLM 驱动执行体。

核心机制 / 工作原理

Agent 和普通聊天助手的本质差异不在“会不会多轮对话”,而在于它能否形成任务闭环:

  • 接收目标或和人澄清目标
  • 规划接下来要做什么
  • 调用工具或访问环境
  • 根据真实反馈判断是否继续、修正、停下或请求人工介入

一个成熟 agent 常见会具备:

  • 模型本体
  • 工具接口
  • 状态或记忆层
  • 运行时循环
  • 停止条件和 guardrails

如果把这些环节串起来看,可以进一步接到 Agent 执行闭环

最小例子 / 最小场景

一个 coding agent 收到“修复测试失败”后,如果它能:

  • 搜索相关文件
  • 运行测试
  • 读取报错
  • 修改代码
  • 再次运行测试直到通过

那么它就已经体现了 agent 的核心特征。

边界与易混淆点

  • agent 不等于“任何会调工具的 LLM”。如果整个路径都是代码硬控,它更接近 workflow。
  • agent 不等于“完全自主很久的系统”。很多生产 agent 仍然会设置强停止条件和人工审批点。
  • agent 也不等于“更会聊天的模型”。它的本质是 goal-driven execution,而不是对话轮数。

面试要点

来自 what-is-agent-in-frontend-engineering-interview-question 的面试视角整理。

一句话回答

Agent 的关键不是会多轮对话,而是能围绕目标拆解任务、调用工具、根据结果继续迭代,最终形成一定的任务闭环。在前端研发里,它更适合接入代码库、规范和工具链来完成半自动开发流程。

最稳的回答主线

  • 先说 Agent 和普通聊天助手的本质差别
  • 再说它在前端研发里能做什么
  • 最后补边界:它适合半自动闭环,不适合脱离人独立负责结果

在前端研发里的典型作用

  • 读取代码库和文档上下文
  • 拆解任务并逐步执行
  • 调用 lint、测试、搜索、脚本等工具
  • 根据结果继续修改并收敛问题

常见误区

  • 把多轮对话助手都叫 Agent
  • 把 Agent 当成完全自主开发者
  • 忽略权限、验证和安全边界

可能追问

  • Agent 和 AI IDE 有什么区别
  • Agent 和 MCP 的关系是什么
  • 什么前端任务适合用 Agent,什么不适合

最短记忆方式

普通 AI 回答问题,Agent 更像围绕目标做事。

创建于 2026/5/4 更新于 2026/5/27