Reranker 模型

Reranker 模型对初步召回的候选内容重新排序，提升 RAG、搜索和推荐链路中最终上下文的相关性。

#tech / ai #type / concept #status / growing #resource / reranker

[!info] related notes

所属 MOC: AI 模型能力 MOC, AI MOC

前置概念: Embedding 模型

应用场景: Python RAG 文件问答 Agent, Augmented LLM

一句话定义

Reranker 模型用于对初步召回的一组候选内容重新排序，让最相关、最适合放进上下文的内容排在前面。

Embedding 检索通常先快速召回一批候选，例如 top 20 个文本块。Reranker 再逐个判断“查询和候选内容是否真的匹配”，输出更精细的相关性分数。

常见链路是：

Reranker 通常比向量召回更慢，但判断更细，所以适合放在“先粗召回、再精排序”的第二阶段。

用户问“部署失败为什么是 403”，向量检索可能召回很多包含“部署”或“403”的段落。Reranker 会进一步判断哪些段落真正解释这个错误，而不是只因为关键词或语义相近就排前。

Reranker 是 RAG 和搜索里的“复核排序层”，负责从候选里挑出最该给模型看的内容。