我把推理服务切到DeepSeek‑V3,成本跳水但凌晨三点Prometheus又开始尖叫——MoE专家负载倾侧的真相

我叫赵一帆,干了8年DevOps。凌晨三点被PagerDuty叫醒的次数,比我陪孩子去公园的次数还多。所以当CTO在周一晨会上兴奋地说“DeepSeek‑V3能把API推理成本干下去一个数量级”的时候,我脑子里第一反应不是架构有多优雅,而是——这个新玩具上线之后,Prometheus又得加几条告警规…