50元触觉手指:从选型、标定到灵巧抓取,我把Dobot折腾到凌晨三点
我花了不到50块钱,用压阻薄膜、Arduino Nano和几个电阻造了个触觉手指,装到Dobot机械臂上做了抓取实验。这篇文章记录了从传感器选型、标定到滑移检测的全过程,包括那些翻车瞬间。如果你想入门机器人灵巧操作又不想烧钱,这篇应该对你有用。
我用0.05M参数的轻量VAD给唤醒词模型守门,功耗直降80%,电池终于能撑一天了
为了在电池供电的ESP32上实现全天候语音唤醒,我设计了一个0.05M参数的轻量CNN VAD作为唤醒词模型的前置守门员。通过两级流水线——能量检测初筛加神经网络细判,误唤醒率从每小时5次降到0.3次,平均功耗下降72%,电池续航从17小时延长到31小时。文章分享了模型砍参数、INT8量化校准、TFLite Micro内存分配的血泪经验,展示了超低资源MCU上语音AI的极限部署策略。
云IDE不卡了:从网络到GPU直通,我们如何将远程开发延迟降到50ms
我把团队云IDE的延迟从300ms降到了50ms,不是靠换更快的网,而是拆解了五层瓶颈,把WebRTC塞进JetBrains Gateway,又搞定了GPU显存零拷贝。本文从系统性能工程角度,还原网络、协议、渲染的深层次优化,并对比自建方案与GitHub Codespaces的真实成本和体验,给出选型建议。
那个看起来无害的LoRA权重文件,差点偷走了我的AWS密钥——我用SBOM+LLM给AI供应链上了三道锁
AI 模型供应链远比 PyPI 投毒更难防守——pickle 反序列化、恶意的加载脚本、tokenizer 配置污染,攻击面大得吓人。我结合 SBOM 和 LLM 做了模型依赖白盒分析,又用确定性规则扫描恶意载荷,最后靠行为基线和智能告警完成持续监控。三道锁下来,总算把内部仓库的安全水位拉起来了。
数据飞轮转起来后,我的合成数据版本比代码还乱——DVC+MLflow给我装上了可审计刹车
数据飞轮中的合成数据版本管理不靠脑子靠基础设施。我分享了一套用DVC定义数据生成pipeline、用MLflow关联实验与数据版本哈希的实战方案,实现了合成数据从参数、来源到训练实验的完整血统追踪,并展示了出问题时如何一分钟定位、三分钟回滚,给数据飞轮装上可审计的刹车。
面积缩小12%后,我得到了一版没人敢用的模拟芯片布局
深度强化学习在模拟IC布局中做到了面积缩减12%,但功耗和噪声的恶化让结果变得鸡肋。工程师的抗拒背后,是AI无法解释设计意图的信任危机。本文从亲历实验出发,拆解RL布局在真实模拟设计流程中的翻车现场,探讨黑盒优化的代价与可解释AI在EDA领域的唯一求生路径。
从“省着点花”到“精确到每token成本”——我在云账单里翻到的秘密
一张翻了倍的云账单让我痛下决心重构推理基础设施。我拆解出每token的真实成本,用Spot实例混合按需、连续批处理、时间切片替代MIG,甚至给Envoy加了压缩,最终把月GPU费用从8400美元砍到3100美元。这篇文章记录了我踩过的每一个坑和每一步优化代码,适合被GPU推理成本压得喘不过气的工程师阅读。
我用LLM生成5万份假病历,把BioBERT召回率拉升35%——一份零真实数据泄露的医疗NER实战
为化解医疗NER项目中的真实数据隐私限制,我用GPT-4生成了5万份无真实患者信息的胃镜报告,并设计了基于语义相似度的隐私泄露检查方案。使用这些合成数据微调BioBERT后,实体识别召回率从68%提升至92%,同时确保没有任何一条合成记录与原始数据高度雷同。本文分享从提示工程到模型评估的完整实战流程与踩坑经验。
云IDE+AI原生不是换工具,是拆了10人团队重来
一个10人远程团队的开发流程改造实录。我们通过Project IDX把端到端延迟从200ms降到50ms,利用AI助手重构了结对编程模式,将交付周期从5.6天压缩到2.3天。这不是工具评测,而是关于如何用云IDE和AI原生能力重新设计协作规范的实战记录。
10%知识数据让模型事实一致性飙升27%:我用正交实验三周找到微调黄金配比7:2:1
我在客服AI项目中发现,随便定微调数据配比差点把模型训成胡话生成器。用三因子正交实验设计,仅27次微调就收敛到指令、对话、知识7:2:1的黄金比例,事实一致性提升27%,线上投诉降了40%。文章分享了完整的实验设计代码和踩坑经验。
在银行内网部署Llama 3,我踩了六个坑后终于把推理延迟压到了1.8秒
银行内网部署Llama 3,既要过合规关,又要管住模型不乱说话、日志不泄密、磁盘不爆炸。我用A40 4卡跑通AWQ量化+TensorRT-LLM,把推理延迟压到1.8秒,中间填了六个实打实的坑,这篇是血泪记录。