让大模型写E2E测试:覆盖了90%场景但总漏极端情况,我们怎么补位

用GPT-4生成Playwright端到端测试,常规场景覆盖率轻松到90%,但状态爆炸、异步竞态和权限边界这些极端情况几乎一片空白。本文复盘了我们为电商应用搭建的混合测试流水线:AI批量生成快乐路径,系统自动注入网络异常与业务错误,最终由人审查断言与业务规则。这条产线让我们用极低成本补上了AI想象力的短板。