自研专用大模型训练体系

乞力之巅首先是一条宣言：我们是独立存在的 AI 算力引擎——不依附硅谷产品做外壳，不把会员数据送给第三方训练，不在别人的模型上贴 Kililink 的 logo。自研、自训、自持、自服务，完整闭环。

其次，我们的模型只为商贸活动而训练，且语料 100% 坦桑尼亚本地化。通用大模型会写诗、会闲聊；Kililink-TZ 只学一件事：怎么帮坦桑企业与商户谈成生意、守规矩、建信誉。训练语料来自 TRA/BRELA 法规、真实供需、会员名片、商品上架、跨境询价、斯瓦西里语商贸表达——120GB+ 商贸专用指令集，经 PII 脱敏后进入 SFT/DPO/GRPO 对齐管线。

第三，我们让会员走在非洲的前端和顶端。当全非洲大多数平台还在嵌 ChatGPT 时，Kililink 会员已在用非洲本土训练的商贸专用模型——更快、更懂本地、数据更安全。乞力马扎罗之巅，寓意的就是这层含义：非洲商贸智能的制高点，属于先加入、先使用的会员。

技术实现上，Kililink-TZ 自研大模型家族从 CPT、LoRA/MoE 到 Vision 蒸馏，全链路在自有 GPU 集群完成；与旗舰模型联邦调度时，商贸任务优先走自研通道——独立、专用、领先。

本文术语注解

带虚线下划线的缩写已在正文中标注，此处为完整释义

PIIPersonally Identifiable Information

个人可识别信息：训练与推理管线内置 PII 检测/脱敏，会员数据不出租户边界、不进公有云训练集。

SFTSupervised Fine-Tuning

有监督微调：在通用基座模型上，用高质量标注语料进行任务定向训练，使模型掌握坦桑商业领域话术与合规表达。

DPODirect Preference Optimization

直接偏好优化：无需独立 Reward Model，用人类/AI 偏好对（chosen vs rejected）直接对齐模型输出，提升回答可信度与合规性。

GRPOGroup Relative Policy Optimization

组相对策略优化：新一代 RLHF 变体，组内样本相对比较降低训练方差，专用模型对齐效率提升 2×。

LoRALow-Rank Adaptation

低秩适配：在冻结基座权重前提下插入可训练低秩矩阵，实现领域低成本、可热插拔的专用模型版本管理。

MoEMixture of Experts

混合专家架构：稀疏激活多个「专家子网络」，在同等参数量下获得更高容量与更低推理 FLOPs。

核心能力

Kililink-TZ-7B-Instruct：商业通用 · Function Calling 原生 · 生产 serving

Kililink-TZ-Vision-3B：商品识图 · ViT-Adapter · OCR 结构化

Kililink-TZ-Embed-1024：三语 Contrastive Embedding · RAG 底座

Kililink-TZ-Reranker-v2：Cross-Encoder 精排 · Top-5@94%+

Kililink-TZ-Policy-1.8B：Teacher 蒸馏 · 政策 Citation 专用

Kililink-Swahili-Base-13B：东非语料 CPT · 2026 原生 Swahili Agent

训练集群：128+ TFlops · DeepSpeed ZeRO-3 · Megatron 张量并行

MLOps：W&B 实验追踪 · MLflow 模型注册 · Canary 灰度发布

本文术语注解

带虚线下划线的缩写已在正文中标注，此处为完整释义

PIIPersonally Identifiable Information

个人可识别信息：训练与推理管线内置 PII 检测/脱敏，会员数据不出租户边界、不进公有云训练集。

SFTSupervised Fine-Tuning

有监督微调：在通用基座模型上，用高质量标注语料进行任务定向训练，使模型掌握坦桑商业领域话术与合规表达。

DPODirect Preference Optimization

直接偏好优化：无需独立 Reward Model，用人类/AI 偏好对（chosen vs rejected）直接对齐模型输出，提升回答可信度与合规性。

GRPOGroup Relative Policy Optimization

组相对策略优化：新一代 RLHF 变体，组内样本相对比较降低训练方差，专用模型对齐效率提升 2×。

LoRALow-Rank Adaptation

低秩适配：在冻结基座权重前提下插入可训练低秩矩阵，实现领域低成本、可热插拔的专用模型版本管理。

MoEMixture of Experts

混合专家架构：稀疏激活多个「专家子网络」，在同等参数量下获得更高容量与更低推理 FLOPs。

核心能力

Kililink-TZ-7B-Instruct：商业通用 · Function Calling 原生 · 生产 serving

Kililink-TZ-Vision-3B：商品识图 · ViT-Adapter · OCR 结构化

Kililink-TZ-Embed-1024：三语 Contrastive Embedding · RAG 底座

Kililink-TZ-Reranker-v2：Cross-Encoder 精排 · Top-5@94%+

Kililink-TZ-Policy-1.8B：Teacher 蒸馏 · 政策 Citation 专用

Kililink-Swahili-Base-13B：东非语料 CPT · 2026 原生 Swahili Agent

训练集群：128+ TFlops · DeepSpeed ZeRO-3 · Megatron 张量并行

MLOps：W&B 实验追踪 · MLflow 模型注册 · Canary 灰度发布

本文术语注解

核心能力

同分类专题

自研专用大模型训练体系

本文术语注解

核心能力

同分类专题