大模型若无领域知识,只是「博学的外行」。乞力之巅的 RAG(检索增强生成)引擎 将 TRA 法规、移民政策、劳工条例、会员名录、商品库、历史公告等结构化与非结构化数据,全部嵌入 10M+ 规模向量索引,让 AI 回答有据可查、可溯源、可引用。
检索链路采用 Hybrid Search(混合检索):Dense Vector(pgvector HNSW)捕获语义相似,Sparse BM25 捕获精确关键词,两路结果经 Cross-Encoder 重排序 融合,Top-K 准确率较单向量检索提升 40%+。
政策问答场景启用 Citation Mode(引用模式):AI 回答附带原文段落链接与生效日期,杜绝幻觉杜撰。会员问「工作许可续签要什么材料?」——引擎从移民知识库精准召回,而非凭空编造。
知识库 7×24 增量同步:新公告发布 → 自动切块 → Embedding → 索引更新,延迟 <5 分钟。坦桑政策变了,AI 第一时间知道。