【爬虫脚本自动化录制】playwright-codegen使用教程

【爬虫脚本自动化录制】playwright-codegen使用教程

前言

在做 Web 自动化测试、爬虫脚本开发时,手动写定位、写操作步骤往往耗时又容易出错。Playwright 官方提供了一个零代码录制神器:codegen,只需要在浏览器里用鼠标点击,就能自动生成可直接运行的 Python/Java/JS 自动化代码,极大提升开发效率。


什么是 playwright codegen?

codegen 是 Playwright 内置的交互式录制工具,核心功能:

  • 记录鼠标点击、输入、选择、滚动、切换页面等操作

  • 实时生成高质量、可直接运行的代码

  • 自动识别 iframe、弹窗、下拉框等复杂场景

  • 支持 Python / Node. js / Java / C# 多语言导出

适用场景:快速生成登录脚本、表单提交、页面遍历、爬虫操作等。


环境准备

安装 Playwright

阅读更多
【爬虫项目解析】-小鹅通m3u8逆向解密

【爬虫项目解析】-小鹅通m3u8逆向解密

打开 F12, 勾选保留日志,进行手动登录,找到请求方法为 POST 的信息,这就是登录时向服务器发送的请求,找到 cookie 的信息并记录。

点击负载可以找到发起登录请求时传入的参数信息

  • ticket:验证码票据(用来校验你输入的验证码)

  • randstr:随机字符串(防重放攻击)

  • verification_type:验证类型(1 通常代表密码登录)

  • session_id:当前会话 ID

  • phone:你的登录手机号(明文)

  • password:你的密码(这里看起来是部分掩码显示,实际传输时大概率是加密或脱敏后的)

  • keep_login:是否记住登录状态(false 代表不记住)

  • nation_login:国家 / 地区登录标识(1 通常代表国内)

播放视频时产生一系列 Session 会话,这些视频相关行都是客户端向服务器请求的视频分片 TS分片的会话,类型时 video/mp2t,也就是 HLS 流媒体切片文件,第四第五列分别是目标服务器域名以及请求的视频分片 url 路径,但是知识 ts 切片,需要找到完整的 m3u8 文件

ctrl+f 搜索 m3u8 的session会话

请求头中包含 url 信息,需要加上 host 域名前缀

阅读更多
Less
More