RAG
⭐⭐⭐ 核心必背
为何分块?缺上下文与跨片依赖?
参考答案
适配嵌入窗口与检索粒度;重叠窗口、层次摘要、父文档检索;跨片用多跳检索或图边。
向量检索差除换模型外?
参考答案
混合 BM25、查询改写、HyDE、重排、元数据过滤、切分策略、领域微调嵌入。
RAG 流程与知识注入?
参考答案
索引→检索相关块→拼进 prompt→LLM 生成;知识以外部库更新而非改权重。
继续预训练 vs RAG?
参考答案
预训练:知识内化、更新慢、成本高;RAG:易更新、可溯源,依赖检索质量。
向量 vs 关键词矛盾?
参考答案
混合检索(BM25+向量)、Reciprocal Rank Fusion。
为何还要重排?
参考答案
双塔召回快但粗;交叉编码器精细 query-doc 交互提 Top-K 质量。
查询改写?
参考答案
多轮指代消解、扩写关键词、分解子查询,拉近与文档表述分布。
冲突/过时文档?
参考答案
元数据时间戳、置信度提示、多文档比较、拒答策略、人工审核闭环。
RAG 流程图(文字版)?
参考答案
用户问→检索器查知识库→Top-K 块→生成器结合上下文作答;检索器管召回,知识库存向量+原文,生成器管综合与语言。
RAG 评估体系?
参考答案
检索:Recall@k、MRR、nDCG;生成:忠实度、BLEU/ROUGE(弱)、LLM 评判;端到端:任务准确率、用户满意。
忠实度 vs 答案相关性?
参考答案
忠实度=是否被上下文支持(NLI/引用检查);相关性=是否答用户所问(与 query 嵌入相似或人工)。
RAG vs 微调?
参考答案
RAG 解知识时效与可溯源;微调擅风格与格式;常组合。
完整 RAG 流水线?
参考答案
采集→清洗→切分→嵌入→索引→在线检索→重排→提示构建→生成→日志与再训练。
切块大小与重叠?
参考答案
小切块检索准但上下文碎;大切块噪声多;重叠减边界截断;按文档结构(标题/段落)切。
嵌入模型选择?
参考答案
领域匹配、MTEB、召回评测、延迟与语种。
提升检索的技术?
参考答案
上文 2+多向量、ColBERT late interaction、图谱增强。
Lost in the Middle?
参考答案
模型对上下文中间段关注弱;把关键块放两端、重排、压缩。
检索/生成评估指标?
参考答案
检索 Recall@k、MRR;生成 groundedness、引用覆盖率。
高级 RAG 范式?
参考答案
Agentic RAG、iterative retrieve、Self-Ask、Plan-and-solve。
BM25 vs 稠密?
参考答案
BM25 关键词可解释、零样本;稠密语义泛化;各有过杀/漏杀。
混合检索?
参考答案
互补召回,RRF 融合常见。
重排作用?
参考答案
精排 Top-K,纠偏向量语义近似但主题不符的文档。
⭐⭐ 常见重点
检索-生成闭环?
参考答案
Self-RAG、CRAG;根据生成 logit 或自检再检索;文档级分数反馈。
可解释性?
参考答案
强制引用 span、返回 source id、对齐分数/熵。
图数据库何时用?
参考答案
多跳关系、结构化合规知识、需精确关系推理时。
部署挑战?
参考答案
数据更新、权限隔离、延迟成本、评估漂移、安全注入。
其他召回?
参考答案
图谱 SPARQL、SQL、标签过滤、同义词扩展。
交叉编码器 vs LLM 重排?
参考答案
交叉编码器快、定长;LLM 重排灵活贵,适合极小 K。
超大知识库?
参考答案
分片索引、分层(先类目后向量)、PQ/IVF、缓存热点。
检索块过长?
参考答案
二次摘要、选句、Map-reduce 多轮聚合。
数据更新与版本?
参考答案
增量索引、版本号、回滚、与权限/租户隔离;蓝绿索引切换。
⭐ 拓展了解
长篇小说梗概+细节?
参考答案
层次摘要树+RAG 拉章节;全局问走摘要,细节问走片段检索。
多模态 RAG?
参考答案
CLIP 类向量索引图像/帧;OCR+布局;生成侧返回引用媒体链接。
训练重排?
参考答案
成对相关/不相关对,pairwise/listwise loss;难负样本挖掘。