OSpec.ai
返回文章列表
Article

如何使用 Checkpoint 插件做应用流程验证与自动化检查

Checkpoint 适合在应用流程验证、关键路径检查和验收前运行验证中使用。你可以直接检查页面效果、交互和核心流程,让自动化验证更早进入同一个工作流。

如何使用 Checkpoint 插件做应用流程验证与自动化检查

如何使用 Checkpoint 插件做应用流程验证与自动化检查

当一个需求已经进入“要确认它是不是真的能跑”的阶段,只看代码或者只手动点几下,通常还不够。

Checkpoint 插件适合用在这个时候。它的重点不是替代开发,而是把应用流程验证和自动化检查更早接进工作流里。这样你可以在交付前更快确认页面效果、交互行为和关键流程是不是都正常。

Checkpoint 是做什么的

Checkpoint 主要用于应用流程验证与自动化检查。

在 OSpec 的工作流里,你可以直接打开 Checkpoint 插件,让它围绕关键页面和关键流程做验证。对外可以理解成:Checkpoint 负责验证,底层会结合 Playwright 来检查页面和流程。

简单说,Checkpoint 更适合回答这类问题:

  • 这个页面实际跑起来有没有问题
  • 关键交互是不是正常
  • 提交流程能不能完整走通
  • 上线前还有没有明显的运行风险

什么场景适合用 Checkpoint

下面这些场景特别适合优先使用 Checkpoint:

  • 表单提交或多步骤流程验证
  • 登录、跳转、操作确认等关键路径检查
  • 验收前的运行验证
  • UI 改动后的页面效果复核
  • 想把人工抽查变成更稳定的自动化检查

如果只是改了一行文案,或者只是调整很小的静态样式,未必需要专门开 Checkpoint。
但只要改动已经影响流程、交互或实际运行结果,Checkpoint 就会很有价值。

Checkpoint 和 Playwright 的关系

这里有一个很重要的理解方式:

  • 对外使用的是 Checkpoint 插件
  • 在验证执行层,会结合 Playwright 做页面和流程检查

所以更准确的说法不是“打开 Playwright 插件”,而是“打开 Checkpoint 插件,让它去完成验证测试”。

这也是为什么在 OSpec 的公开产品表达里,Checkpoint 更偏向“验证与检查”,而 Playwright 更偏向“底层测试能力”。

最常见的使用方式

一个比较顺手的方式是:

1. 先明确你要验证什么

不要只说“帮我测一下”。更有效的做法,是先把你最关心的流程说清楚。

比如你可以直接说明:

  • 要验证的是哪个页面或哪个流程
  • 用户会从哪里进入
  • 哪一步最容易出问题
  • 你最担心的是 UI、交互还是提交流程

2. 打开 Checkpoint 插件

你们当前对外推荐的说法,可以直接这样用:

$ospec 帮我打开 Checkpoint 插件

这一步的重点不是打开插件本身,而是把接下来的流程检查放进同一个工作流上下文里继续推进。

3. 用“可验证目标”来描述需求

给 Checkpoint 提需求时,尽量少说模糊判断,多说可以被验证的目标。

比如不要只说:

“帮我检查一下有没有问题。”

可以改成:

“帮我检查首页首屏、插件介绍区和 CTA 区域的交互是否正常,再走一遍主要跳转流程,确认页面展示、点击反馈和关键路径没有明显问题。”

这种描述更容易得到有价值的结果,因为它给出了验证范围、重点和预期。

一个简单示例

如果你想让 AI 帮你做一次比较完整的检查,可以这样开头:

$ospec 帮我打开 Checkpoint 插件。我要验证官网首页的关键展示和主要跳转流程,重点检查首屏、插件介绍区、CTA 按钮和主要导航,确认页面展示正常、交互反馈正常、关键路径可以顺利走通。

这类提示词的好处是,它不会把范围放得太散,同时又足够明确,便于继续往下验证。

Checkpoint 和 Stitch 怎么配合使用

如果一个页面先经过 Stitch 做页面设计和预览协作,Checkpoint 的价值会更明显。

一个更完整的工作方式通常是:

  • 先用 Stitch 生成页面预览,并确认整体方向
  • 再用 Checkpoint 结合 Playwright 检查页面展示、交互和关键流程
  • 最后根据验证结果继续调整页面或修复问题

这样做的好处是,团队不会停留在“页面看起来差不多可以了”这一步,而是能继续确认:

  • 页面实际展示是否稳定
  • 关键按钮和交互是否正常
  • 主要流程能不能顺利走通
  • 页面改动有没有带来新的运行问题

简单说,Stitch 更偏向先把页面做出来,Checkpoint 更偏向确认这个页面和流程能不能放心交付。

如果你的需求同时涉及页面改动和运行验证,把 Stitch 和 Checkpoint 放在同一个工作流里连续使用,通常会比单独处理更高效。

生成结果后,应该怎么看

Checkpoint 跑完之后,不要只看“通过”还是“失败”,更应该看下面几件事:

  • 问题出在页面展示、交互还是流程本身
  • 问题是否可复现
  • 是局部小问题,还是会影响用户完成任务
  • 这是不是上线前必须处理的问题
  • 如果继续交付,风险是否还能接受

这一步很关键。Checkpoint 的价值不只是帮你发现问题,更是帮你更早判断哪些问题值得立刻处理,哪些问题可以排到下一轮。

使用 Checkpoint 时的三个建议

1. 先抓关键路径,不要一开始铺太大

先验证最重要的页面和流程,再逐步扩大范围。这样更容易尽快发现真正影响交付的问题。

2. 一次只验证一个明确目标

一次只聚焦一个验证任务,通常比把所有页面全混在一起更有效。比如先检查首页主要交互,再检查提交流程,最后再补边缘路径。

3. 把检查结果和实现一起看

自动化验证不是为了替代判断,而是为了帮助判断。把 Checkpoint 的结果和实际页面、代码实现放在一起看,通常更容易确定下一步是修问题、补测试,还是继续推进。

结语

Checkpoint 适合那些“是否真的能正常运行”本身就是需求一部分的工作。

当你不想只靠人工点击去猜流程有没有问题,而是希望更早发现页面、交互和关键路径中的风险,再继续推进交付时,Checkpoint 会是很好用的一步。

如果你的需求已经进入运行验证、关键路径检查或验收前复核阶段,最简单的开始方式就是先把 Checkpoint 打开,然后从一个清晰的验证目标说起。

上一篇如何使用 Stitch 插件做页面设计与预览协作下一篇OSpec 的主要流程是什么:一个 change 里有哪些文档,AI 每一步在做什么