RAG 知识库问答为什么还会出现幻觉？

RAG 知识库问答的基本思路，是先从企业知识库中检索相关内容，再让大模型基于检索结果生成回答。它能够减少模型凭空编造的概率，但并不意味着系统一定不会出现幻觉。

第一类原因是知识库本身质量不足。如果文档过期、重复、缺少关键字段，或者不同文档之间存在冲突，模型即使检索到了资料，也可能基于错误信息生成不准确回答。RAG 的上限很大程度取决于知识库治理水平。

第二类原因是检索不准确。用户问题可能表达模糊，系统的分词、向量召回、关键词匹配或重排策略可能没有命中真正相关的文档。检索阶段拿错材料，生成阶段就很难给出正确答案。

第三类原因是生成约束不足。如果提示词没有明确要求“只依据检索内容回答”“无法确认时说明不知道”“必须给出引用来源”，模型就可能根据通用知识补充内容，导致答案看起来完整但并不可靠。

要降低 RAG 幻觉，企业需要从四个方向入手：定期清理和更新知识库，优化检索和重排策略，为答案增加来源引用，并对高风险场景设置人工复核。对于政策、合同、医疗、金融等严肃内容，还应当限制模型自由发挥。

因此，RAG 不是简单上传文档就能完成的功能，而是一套知识工程。只有把文档、检索、生成和审核都设计好，知识库问答才会真正稳定。

相关阅读