🧪 代码实验室

探索编程技术,实验代码片段,分享开发经验

29 篇实验 返回首页

让大模型写E2E测试:覆盖了90%场景但总漏极端情况,我们怎么补位

用GPT-4生成Playwright端到端测试,常规场景覆盖率轻松到90%,但状态爆炸、异步竞态和权限边界这些极端情况几乎一片空白。本文复盘了我们为电商应用搭建的混合测试流水线:AI批量生成快乐路径,系统自动注入网络异常与业务错误,最终由人审查断言与业务规则。这条产线让我们用极低成本补上了AI想象力的短板。

我用三个LangChain Agent搭了个“多部门协作”的智能客服,踩坑踩到怀疑人生

给一家日活3万的家居电商重构客服系统,单Agent搞出“AI诈骗”后,我用三个LangChain Agent搭建了多部门协作架构。本文记录订单查询的17种状态模板、退款流程的硬编码流水线、Agent间共享上下文的消息总线,以及双11压测从85撑到240 QPS的优化过程。重点是那些框架文档不会告诉你的坑。