技术教程 – 第 2 页

当黑客把Prompt注入你的API，传统的WAF只能看戏——我在1000QPS攻击流下重构了大模型的安全防线

2026年6月1日 70 次浏览

50元触觉手指：从选型、标定到灵巧抓取，我把Dobot折腾到凌晨三点

2026年5月16日 44 次浏览

我花了不到50块钱，用压阻薄膜、Arduino Nano和几个电阻造了个触觉手指，装到Dobot机械臂上做了抓取实验。这篇文章记录了从传感器选型、标定到滑移检测的全过程，包括那些翻车瞬间。如果你想入门机器人灵巧操作又不想烧钱，这篇应该对你有用。

我用0.05M参数的轻量VAD给唤醒词模型守门，功耗直降80%，电池终于能撑一天了

2026年5月15日 33 次浏览

为了在电池供电的ESP32上实现全天候语音唤醒，我设计了一个0.05M参数的轻量CNN VAD作为唤醒词模型的前置守门员。通过两级流水线——能量检测初筛加神经网络细判，误唤醒率从每小时5次降到0.3次，平均功耗下降72%，电池续航从17小时延长到31小时。文章分享了模型砍参数、INT8量化校准、TFLite Micro内存分配的血泪经验，展示了超低资源MCU上语音AI的极限部署策略。

云IDE不卡了：从网络到GPU直通，我们如何将远程开发延迟降到50ms

2026年5月15日 32 次浏览

我把团队云IDE的延迟从300ms降到了50ms，不是靠换更快的网，而是拆解了五层瓶颈，把WebRTC塞进JetBrains Gateway，又搞定了GPU显存零拷贝。本文从系统性能工程角度，还原网络、协议、渲染的深层次优化，并对比自建方案与GitHub Codespaces的真实成本和体验，给出选型建议。

那个看起来无害的LoRA权重文件，差点偷走了我的AWS密钥——我用SBOM+LLM给AI供应链上了三道锁

2026年5月15日 34 次浏览

AI 模型供应链远比 PyPI 投毒更难防守——pickle 反序列化、恶意的加载脚本、tokenizer 配置污染，攻击面大得吓人。我结合 SBOM 和 LLM 做了模型依赖白盒分析，又用确定性规则扫描恶意载荷，最后靠行为基线和智能告警完成持续监控。三道锁下来，总算把内部仓库的安全水位拉起来了。

数据飞轮转起来后，我的合成数据版本比代码还乱——DVC+MLflow给我装上了可审计刹车

2026年5月15日 39 次浏览

数据飞轮中的合成数据版本管理不靠脑子靠基础设施。我分享了一套用DVC定义数据生成pipeline、用MLflow关联实验与数据版本哈希的实战方案，实现了合成数据从参数、来源到训练实验的完整血统追踪，并展示了出问题时如何一分钟定位、三分钟回滚，给数据飞轮装上可审计的刹车。

面积缩小12%后，我得到了一版没人敢用的模拟芯片布局

2026年5月15日 24 次浏览

深度强化学习在模拟IC布局中做到了面积缩减12%，但功耗和噪声的恶化让结果变得鸡肋。工程师的抗拒背后，是AI无法解释设计意图的信任危机。本文从亲历实验出发，拆解RL布局在真实模拟设计流程中的翻车现场，探讨黑盒优化的代价与可解释AI在EDA领域的唯一求生路径。

从“省着点花”到“精确到每token成本”——我在云账单里翻到的秘密

2026年5月8日 40 次浏览

一张翻了倍的云账单让我痛下决心重构推理基础设施。我拆解出每token的真实成本，用Spot实例混合按需、连续批处理、时间切片替代MIG，甚至给Envoy加了压缩，最终把月GPU费用从8400美元砍到3100美元。这篇文章记录了我踩过的每一个坑和每一步优化代码，适合被GPU推理成本压得喘不过气的工程师阅读。

我用LLM生成5万份假病历，把BioBERT召回率拉升35%——一份零真实数据泄露的医疗NER实战

2026年5月5日 49 次浏览

为化解医疗NER项目中的真实数据隐私限制，我用GPT-4生成了5万份无真实患者信息的胃镜报告，并设计了基于语义相似度的隐私泄露检查方案。使用这些合成数据微调BioBERT后，实体识别召回率从68%提升至92%，同时确保没有任何一条合成记录与原始数据高度雷同。本文分享从提示工程到模型评估的完整实战流程与踩坑经验。

云IDE+AI原生不是换工具，是拆了10人团队重来

2026年5月5日 29 次浏览

一个10人远程团队的开发流程改造实录。我们通过Project IDX把端到端延迟从200ms降到50ms，利用AI助手重构了结对编程模式，将交付周期从5.6天压缩到2.3天。这不是工具评测，而是关于如何用云IDE和AI原生能力重新设计协作规范的实战记录。

10%知识数据让模型事实一致性飙升27%：我用正交实验三周找到微调黄金配比7:2:1

2026年5月5日 37 次浏览

我在客服AI项目中发现，随便定微调数据配比差点把模型训成胡话生成器。用三因子正交实验设计，仅27次微调就收敛到指令、对话、知识7:2:1的黄金比例，事实一致性提升27%，线上投诉降了40%。文章分享了完整的实验设计代码和踩坑经验。

在银行内网部署Llama 3，我踩了六个坑后终于把推理延迟压到了1.8秒

2026年5月5日 37 次浏览

银行内网部署Llama 3，既要过合规关，又要管住模型不乱说话、日志不泄密、磁盘不爆炸。我用A40 4卡跑通AWQ量化+TensorRT-LLM，把推理延迟压到1.8秒，中间填了六个实打实的坑，这篇是血泪记录。