5毫瓦的AI奇迹:我把关键词识别塞进Cortex-M0+的功耗优化全记录
为了把关键词识别塞进Cortex-M0+,我给自己下了10mW的死命令。从模型剪枝量化到时钟门控、稀疏推理,一步步把功耗从45mW压到5mW,同时死守95%准确率。这篇文章记录了每一次权衡和每个差点放弃的瞬间,是一份能给同样在边缘AI里抠纳瓦的同行参考的工程笔记。
我造了一台对抗样本工厂,用1000张合成图捅穿了多模态模型的内容防线,然后又逼着自己把它补上
多模态大模型把图像和文本拼在一起交给LLM,让越狱攻击的门槛直线降低。我亲手造了一条自动化流水线,用1000个合成对抗样本把公司内部助手攻穿,再通过输入过滤、对抗微调与偏好对齐三管齐下,将越狱率从62%压到4%。这篇文章记录了从攻击模拟到加固防线的完整踩坑过程,适合关注AI安全的工程师。
LangGraph多Agent协作死锁亲历:订单系统里我靠超时检测和补偿事务救回每天2万笔卡死的交易
凌晨三点被运维电话叫醒,16个LangGraph Agent互相等待形成死锁,订单吞吐量从300笔/秒暴跌到3笔/秒。这篇文章记录了我是如何用Wait-For Graph检测器、LLM驱动的解锁Agent和心跳机制构建死锁自动恢复系统的全过程。混沌测试中翻车的两阶段提交改造经验,以及安全校验器拦截4.6%危险操作的真实数据都在里面。
我对着自家客服大模型狂轰滥炸了72小时,7种越狱手法全都打穿了防线
我针对自家客服大模型做了一次内部红队测试,用角色扮演、代码注入、多语言混淆等7种手法把防线全面打穿。文章从环境搭建、攻击复现、对齐缺陷分析,到输入过滤、NeMo Guardrails、输出审核和安全微调的四层防护升级,完整记录了从30%越狱成功率压到2%以下的过程,并给出了自动化红队测试的路线图。
我给自动驾驶模型喂了3万张“假事故”,它终于学会了防撞
等现实发生事故再训练自动驾驶模型,效率低得离谱。我把3D渲染和扩散模型串起来,造了一套事故场景印钞机,批量生成碰撞、行人闯入、异常天气的超逼真图像。模型吃下这些“假事故”后,对极端情况的召回直接翻倍,mAP提升超20%。但纯合成数据有域迁移的坑,真实和合成的黄金配比大概是7:3,还得配上mixup和标签平滑才稳。这篇文章记录了我从踩坑到跑通的全过程。