10%知识数据让模型事实一致性飙升27%:我用正交实验三周找到微调黄金配比7:2:1

我在客服AI项目中发现,随便定微调数据配比差点把模型训成胡话生成器。用三因子正交实验设计,仅27次微调就收敛到指令、对话、知识7:2:1的黄金比例,事实一致性提升27%,线上投诉降了40%。文章分享了完整的实验设计代码和踩坑经验。