Embedding 模型

Embedding 模型把文本、图片或其他对象编码成向量，用于语义搜索、聚类、推荐、去重和 RAG 检索。

#tech / ai #type / concept #status / growing #resource / embedding

[!info] related notes

所属 MOC: AI 模型能力 MOC, AI MOC

前置概念: LLM

并列概念: Reranker 模型

应用场景: Python RAG 文件问答 Agent, Augmented LLM

一句话定义

Embedding 模型把文本、图片、音频或其他对象编码成向量，使系统可以用距离或相似度比较它们的语义接近程度。

Embedding 的输出是一组数字，例如一个 384 维、768 维或 1536 维向量。语义越接近的内容，向量空间里的距离通常越近。

一个典型 RAG 链路是：

Embedding 模型通常不是直接生成最终回答，而是负责把内容变成可检索、可比较的语义表示。

在 Python RAG 文件问答 Agent 里，文档段落和用户问题都会先变成向量。系统通过向量相似度找出相关段落，再把这些段落放进 prompt。

Embedding 模型是“把内容压成可比较的语义坐标”的模型。