Skip to content

RAG

⭐⭐⭐ 核心必背

为何分块?缺上下文与跨片依赖?

参考答案

适配嵌入窗口与检索粒度;重叠窗口、层次摘要、父文档检索;跨片用多跳检索或图边。

向量检索差除换模型外?

参考答案

混合 BM25、查询改写、HyDE、重排、元数据过滤、切分策略、领域微调嵌入。

RAG 流程与知识注入?

参考答案

索引→检索相关块→拼进 prompt→LLM 生成;知识以外部库更新而非改权重。

继续预训练 vs RAG?

参考答案

预训练:知识内化、更新慢、成本高;RAG:易更新、可溯源,依赖检索质量。

向量 vs 关键词矛盾?

参考答案

混合检索(BM25+向量)、Reciprocal Rank Fusion。

为何还要重排?

参考答案

双塔召回快但粗;交叉编码器精细 query-doc 交互提 Top-K 质量。

查询改写?

参考答案

多轮指代消解、扩写关键词、分解子查询,拉近与文档表述分布。

冲突/过时文档?

参考答案

元数据时间戳、置信度提示、多文档比较、拒答策略、人工审核闭环。

RAG 流程图(文字版)?

参考答案

用户问→检索器查知识库→Top-K 块→生成器结合上下文作答;检索器管召回,知识库存向量+原文,生成器管综合与语言。

RAG 评估体系?

参考答案

检索:Recall@k、MRR、nDCG;生成:忠实度、BLEU/ROUGE(弱)、LLM 评判;端到端:任务准确率、用户满意。

忠实度 vs 答案相关性?

参考答案

忠实度=是否被上下文支持(NLI/引用检查);相关性=是否答用户所问(与 query 嵌入相似或人工)。

RAG vs 微调?

参考答案

RAG 解知识时效与可溯源;微调擅风格与格式;常组合。

完整 RAG 流水线?

参考答案

采集→清洗→切分→嵌入→索引→在线检索→重排→提示构建→生成→日志与再训练。

切块大小与重叠?

参考答案

小切块检索准但上下文碎;大切块噪声多;重叠减边界截断;按文档结构(标题/段落)切。

嵌入模型选择?

参考答案

领域匹配、MTEB、召回评测、延迟与语种。

提升检索的技术?

参考答案

上文 2+多向量、ColBERT late interaction、图谱增强。

Lost in the Middle?

参考答案

模型对上下文中间段关注弱;把关键块放两端、重排、压缩。

检索/生成评估指标?

参考答案

检索 Recall@k、MRR;生成 groundedness、引用覆盖率。

高级 RAG 范式?

参考答案

Agentic RAG、iterative retrieve、Self-Ask、Plan-and-solve。

BM25 vs 稠密?

参考答案

BM25 关键词可解释、零样本;稠密语义泛化;各有过杀/漏杀。

混合检索?

参考答案

互补召回,RRF 融合常见。

重排作用?

参考答案

精排 Top-K,纠偏向量语义近似但主题不符的文档。

⭐⭐ 常见重点

检索-生成闭环?

参考答案

Self-RAG、CRAG;根据生成 logit 或自检再检索;文档级分数反馈。

可解释性?

参考答案

强制引用 span、返回 source id、对齐分数/熵。

图数据库何时用?

参考答案

多跳关系、结构化合规知识、需精确关系推理时。

部署挑战?

参考答案

数据更新、权限隔离、延迟成本、评估漂移、安全注入。

其他召回?

参考答案

图谱 SPARQL、SQL、标签过滤、同义词扩展。

交叉编码器 vs LLM 重排?

参考答案

交叉编码器快、定长;LLM 重排灵活贵,适合极小 K。

超大知识库?

参考答案

分片索引、分层(先类目后向量)、PQ/IVF、缓存热点。

检索块过长?

参考答案

二次摘要、选句、Map-reduce 多轮聚合。

数据更新与版本?

参考答案

增量索引、版本号、回滚、与权限/租户隔离;蓝绿索引切换。

拓展了解

长篇小说梗概+细节?

参考答案

层次摘要树+RAG 拉章节;全局问走摘要,细节问走片段检索。

多模态 RAG?

参考答案

CLIP 类向量索引图像/帧;OCR+布局;生成侧返回引用媒体链接。

训练重排?

参考答案

成对相关/不相关对,pairwise/listwise loss;难负样本挖掘。

仅供学习交流,题目与答案要点请结合业务与最新论文核对。