在Jetson Orin上跑金丝雀发布:100次抓取任务A/B测试,仿真99%置信自动止损,但真实传感器延迟让贝叶斯提前关停
我是许彦,一个在机器人公司摸爬滚打了五年的工程师,从ROS 1一直折腾到ROS 2 Humble,从简单的差分底盘做到现在的人形双臂操作。我们团队最近在做一个看似很“互联网”但实际上跟机器人硬件耦合极深的项目:为大模型驱动的抓取感知服务建立金丝雀发布体系。这个想法来自微服务的渐进式交付,但把它搬到J…
我是许彦,一个在机器人公司摸爬滚打了五年的工程师,从ROS 1一直折腾到ROS 2 Humble,从简单的差分底盘做到现在的人形双臂操作。我们团队最近在做一个看似很“互联网”但实际上跟机器人硬件耦合极深的项目:为大模型驱动的抓取感知服务建立金丝雀发布体系。这个想法来自微服务的渐进式交付,但把它搬到J…
那个周五晚上,生产环境的RAG应用又崩了一次。用户投诉说回答完全胡编乱造,但监控大盘上RAGAS的Faithfulness曲线稳得像直线——0.94,0.93,0.95。我盯着Grafana发呆,突然意识到:我们花了三个月把手工评测替换成RAGAS流水线,但它连最基础的事实幻觉都没抓到。 这不是RA…