技术教程 – 第 6 页

Serverless GPU混部翻车记：用MIG物理隔离和分时调度硬扛三个模型，延迟从抖动300ms压到10ms以内

2026年5月4日 155 次浏览

那天晚上，告警群炸了：推理延迟飙到2秒，客户在直播间等出图事情得从去年夏天说起，我们团队负责一个内容平台的 AI 推理服务，日活大概 30 万，不算大但业务场景挺花哨——同时跑着三个模型：一个 BERT 做实时评论情感分类，一个事故复盘：时间片共享的假象与 GPU 饥饿接到报警时我正窝在沙发上…

合成十万条指令后，我总结出清洗数据比生成数据难十倍

2026年5月4日 29 次浏览

花了三周时间搭建合成指令数据的清洗流水线，从去重到安全过滤再到质量评分，每一步都是血泪教训。文章分享如何用GPT-4批量生成指令并控制多样性，对比实验表明清洗后合成数据微调效果在某些任务上比人工标注还好，但核心挑战不在生成，在于数据工程。

标签：合成数据

Rust重写推理服务后速度提升了5倍，但我差点被编译器逼疯

2026年5月4日 30 次浏览

为了搞掉在线教育平台批改服务的延迟和内存问题，我用Rust重写了推理网关。结果吞吐暴增5倍，p99延迟从510ms压到42ms，但开发过程几乎让我放弃——Session不支持Send、编译时间漫长、错误信息无法理解。这篇文章记录了我如何手写线程池、用Axum+ONNX Runtime趟过生产坑，以及最终为什么还说“Rust值得，但要用在刀刃上”。

标签： ONNX Runtime Rust 推理服务

2026年我还在写技术博客，因为AI生成的内容少了三样东西：血、汗、眼泪

2026年5月2日 30 次浏览

2026年大模型能秒出复盘、给代码建议，但我依然坚持写技术博客——因为真正的知识藏在凌晨三点熬出来的直觉里，藏在只有自己才记得的注脚里，藏在那些AI永远生成不出来的失败上下文里。我用K8s事故、Rust内存泄漏和微调崩盘的三个真实故事，说清楚这件事。

标签： AI局限性 Kubernetes排障技术博客

我推Copilot推了半年，技术问题全是小意思，人的问题差点把我逼疯

2026年4月30日 34 次浏览

我花了半年在团队里推行GitHub Copilot，原以为技术配置是难关，结果发现人的问题才最致命。从法务合规挑战到代码质量不升反降，再到团队分裂成依赖派和偷偷用派，这篇分享拆解了每个真实的坑，并给出了我最终转向“推行对AI说不的能力”的实际做法。

标签： Copilot 团队管理

一张4090训出的7B模型，在某些任务上暴打GPT-4，然后被生产环境连捅四刀

2026年4月30日 38 次浏览

用一张4090训好的7B模型，在客服意图识别任务上准确率比GPT-4高了6个点，推理速度快了15倍。但上线后被生产环境连捅四刀：时间感知缺失、tokenization切碎订单号、vLLM显存泄漏导致周期性OOM、以及反馈循环让模型慢慢退化。本文用真实代码和日志复盘了整个从训练到踩坑到修复的过程。

标签： 7B模型微调 Mistral-7B vLLM部署生产环境踩坑

三年修了200台机器人后，我悟了：ROI的命门是螺丝刀，不是Excel

2026年4月29日 21 次浏览

搞了三年制造业机器人部署，从选型被坑到现场抢修，最后发现机器人的ROI根本不是财务算出来的，而是一把螺丝刀和一堆py脚本修出来的。我把踩过的通信、机械、环境坑都记下来，还写了仿真模型重新定义回报公式，讲给所有还在信PPT的同行。

标签： Python运维 ROI计算 ROS2踩坑制造业机器人工业通信机器人维护预防性维护

视觉分拣系统落地一年后复盘：准时才是那个最难伺候的大爷

2026年4月28日 29 次浏览

花了40多万、产线打磨一年后，我发现在视觉分拣系统里，目标检测的精度只是起点，真正的魔鬼全藏在时间维度里：触发抖动、散热降频、时钟不同步、通信假死。这篇文章记录了我从软触发踩坑，到硬件同步、动态曝光、状态机重构的全过程，以及如何把节拍时间从1.2秒压到290ms，抓取成功率从58%拉到93%。

标签：实时系统工业视觉视觉分拣

AI代码审查流水线实战：Code Review时间从4小时压到20分钟，但Bug率反而上升了12%

2026年4月28日 35 次浏览

团队Code Review卡了我每天两个多小时，把AI塞进CI流水线后，PR等待时间从4.2小时降到1.3小时，我自己的Review时间降了70%。但三个月的数据告诉我，合并后的Bug反而多了12%，因为开发者在有AI把关后反而没那么仔细了。这篇文章记录了我从选型、集成、踩坑到最终找到平衡点的完整过程，包括真实的配置和监控代码。

标签： AI Code Review CI/CD流水线 CodeRabbit GitLab CI 代码质量研发效能

多模态大模型在产线上“看”了一年，我终于承认：它离「看懂」还差着十万个坑

2026年4月27日 19 次浏览

多模态大模型在工业场景里“能看”但远没到“看懂”的地步。我花了一年时间把它丢进产线、仓库和车间，踩遍了幻觉、光照敏感、业务术语水土不服的坑，才摸索出检索增强、多智能体拆分和视觉提示微调这三种接地气的落地方案。这篇文章用真实案例告诉你，技术与业务融合的鸿沟到底有多深。