RAG

⭐⭐⭐ 核心必背

为何分块？缺上下文与跨片依赖？

参考答案

适配嵌入窗口与检索粒度；重叠窗口、层次摘要、父文档检索；跨片用多跳检索或图边。

向量检索差除换模型外？

参考答案

混合 BM25、查询改写、HyDE、重排、元数据过滤、切分策略、领域微调嵌入。

RAG 流程与知识注入？

参考答案

索引→检索相关块→拼进 prompt→LLM 生成；知识以外部库更新而非改权重。

继续预训练 vs RAG？

参考答案

预训练：知识内化、更新慢、成本高；RAG：易更新、可溯源，依赖检索质量。

向量 vs 关键词矛盾？

参考答案

混合检索（BM25+向量）、Reciprocal Rank Fusion。

为何还要重排？

参考答案

双塔召回快但粗；交叉编码器精细 query-doc 交互提 Top-K 质量。

查询改写？

参考答案

多轮指代消解、扩写关键词、分解子查询，拉近与文档表述分布。

冲突/过时文档？

参考答案

元数据时间戳、置信度提示、多文档比较、拒答策略、人工审核闭环。

RAG 流程图（文字版）？

参考答案

用户问→检索器查知识库→Top-K 块→生成器结合上下文作答；检索器管召回，知识库存向量+原文，生成器管综合与语言。

RAG 评估体系？

参考答案

检索：Recall@k、MRR、nDCG；生成：忠实度、BLEU/ROUGE（弱）、LLM 评判；端到端：任务准确率、用户满意。

忠实度 vs 答案相关性？

参考答案

忠实度=是否被上下文支持（NLI/引用检查）；相关性=是否答用户所问（与 query 嵌入相似或人工）。

RAG vs 微调？

参考答案

RAG 解知识时效与可溯源；微调擅风格与格式；常组合。

完整 RAG 流水线？

参考答案

采集→清洗→切分→嵌入→索引→在线检索→重排→提示构建→生成→日志与再训练。

切块大小与重叠？

参考答案

小切块检索准但上下文碎；大切块噪声多；重叠减边界截断；按文档结构（标题/段落）切。

嵌入模型选择？

参考答案

领域匹配、MTEB、召回评测、延迟与语种。

提升检索的技术？

参考答案

上文 2+多向量、ColBERT late interaction、图谱增强。

Lost in the Middle？

参考答案

模型对上下文中间段关注弱；把关键块放两端、重排、压缩。

检索/生成评估指标？

参考答案

检索 Recall@k、MRR；生成 groundedness、引用覆盖率。

高级 RAG 范式？

参考答案

Agentic RAG、iterative retrieve、Self-Ask、Plan-and-solve。

BM25 vs 稠密？

参考答案

BM25 关键词可解释、零样本；稠密语义泛化；各有过杀/漏杀。

混合检索？

参考答案

互补召回，RRF 融合常见。

重排作用？

参考答案

精排 Top-K，纠偏向量语义近似但主题不符的文档。

⭐⭐ 常见重点

检索-生成闭环？

参考答案

Self-RAG、CRAG；根据生成 logit 或自检再检索；文档级分数反馈。

可解释性？

参考答案

强制引用 span、返回 source id、对齐分数/熵。

图数据库何时用？

参考答案

多跳关系、结构化合规知识、需精确关系推理时。

部署挑战？

参考答案

数据更新、权限隔离、延迟成本、评估漂移、安全注入。

其他召回？

参考答案

图谱 SPARQL、SQL、标签过滤、同义词扩展。

交叉编码器 vs LLM 重排？

参考答案

交叉编码器快、定长；LLM 重排灵活贵，适合极小 K。

超大知识库？

参考答案

分片索引、分层（先类目后向量）、PQ/IVF、缓存热点。

检索块过长？

参考答案

二次摘要、选句、Map-reduce 多轮聚合。

数据更新与版本？

参考答案

增量索引、版本号、回滚、与权限/租户隔离；蓝绿索引切换。

⭐ 拓展了解

长篇小说梗概+细节？

参考答案

层次摘要树+RAG 拉章节；全局问走摘要，细节问走片段检索。

多模态 RAG？

参考答案

CLIP 类向量索引图像/帧；OCR+布局；生成侧返回引用媒体链接。

训练重排？

参考答案

成对相关/不相关对，pairwise/listwise loss；难负样本挖掘。

RAG ​

⭐⭐⭐ 核心必背 ​

为何分块？缺上下文与跨片依赖？ ​

向量检索差除换模型外？ ​

RAG 流程与知识注入？ ​

继续预训练 vs RAG？ ​

向量 vs 关键词矛盾？ ​

为何还要重排？ ​

查询改写？ ​

冲突/过时文档？ ​

RAG 流程图（文字版）？ ​

RAG 评估体系？ ​

忠实度 vs 答案相关性？ ​

RAG vs 微调？ ​

完整 RAG 流水线？ ​

切块大小与重叠？ ​

嵌入模型选择？ ​

提升检索的技术？ ​

Lost in the Middle？ ​

检索/生成评估指标？ ​

高级 RAG 范式？ ​

BM25 vs 稠密？ ​

混合检索？ ​

重排作用？ ​

⭐⭐ 常见重点 ​

检索-生成闭环？ ​

可解释性？ ​

图数据库何时用？ ​

部署挑战？ ​

其他召回？ ​

交叉编码器 vs LLM 重排？ ​

超大知识库？ ​

检索块过长？ ​

数据更新与版本？ ​

⭐ 拓展了解 ​

长篇小说梗概+细节？ ​

多模态 RAG？ ​

训练重排？ ​

RAG

⭐⭐⭐ 核心必背

为何分块？缺上下文与跨片依赖？

向量检索差除换模型外？

RAG 流程与知识注入？

继续预训练 vs RAG？

向量 vs 关键词矛盾？

为何还要重排？

查询改写？

冲突/过时文档？

RAG 流程图（文字版）？

RAG 评估体系？

忠实度 vs 答案相关性？

RAG vs 微调？

完整 RAG 流水线？

切块大小与重叠？

嵌入模型选择？

提升检索的技术？

Lost in the Middle？

检索/生成评估指标？

高级 RAG 范式？

BM25 vs 稠密？

混合检索？

重排作用？

⭐⭐ 常见重点

检索-生成闭环？

可解释性？

图数据库何时用？

部署挑战？

其他召回？

交叉编码器 vs LLM 重排？

超大知识库？

检索块过长？

数据更新与版本？

⭐ 拓展了解

长篇小说梗概+细节？

多模态 RAG？

训练重排？