RAG 知识库问答为什么还会出现幻觉?
RAG 知识库问答的基本思路,是先从企业知识库中检索相关内容,再让大模型基于检索结果生成回答。它能够减少模型凭空编造的概率,但并不意味着系统一定不会出现幻觉。
第一类原因是知识库本身质量不足。如果文档过期、重复、缺少关键字段,或者不同文档之间存在冲突,模型即使检索到了资料,也可能基于错误信息生成不准确回答。RAG 的上限很大程度取决于知识库治理水平。
第二类原因是检索不准确。用户问题可能表达模糊,系统的分词、向量召回、关键词匹配或重排策略可能没有命中真正相关的文档。检索阶段拿错材料,生成阶段就很难给出正确答案。
第三类原因是生成约束不足。如果提示词没有明确要求“只依据检索内容回答”“无法确认时说明不知道”“必须给出引用来源”,模型就可能根据通用知识补充内容,导致答案看起来完整但并不可靠。
要降低 RAG 幻觉,企业需要从四个方向入手:定期清理和更新知识库,优化检索和重排策略,为答案增加来源引用,并对高风险场景设置人工复核。对于政策、合同、医疗、金融等严肃内容,还应当限制模型自由发挥。
因此,RAG 不是简单上传文档就能完成的功能,而是一套知识工程。只有把文档、检索、生成和审核都设计好,知识库问答才会真正稳定。