Authenticated Web Research

支持用户授权访问的网站,通过本地浏览器会话进行动态内容抓取。

已扫描
适合谁
需访问受控网站的研究人员、企业内部系统信息提取者
不适合谁
希望绕过登录验证的用户、无账号权限的普通浏览者
国内可用性
需网络配置。可能需要网络配置或第三方服务可访问。
安装难度
新手友好(★☆☆)。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

openclaw skills install @1477009639zw-blip/authenticated-web-research

Skill 说明

命令、参数、文件名以原文为准

已认证的网络研究

在目标网站需要登录、动态渲染内容,或仅在用户使用自己的账户登录后才可访问时,请使用此技能。

硬性规则

不得绕过访问控制、付费墙或反机器人保护机制。

本技能仅用于用户授权访问:

  • 用户使用自己的账户登录
  • 浏览器会话保持本地
  • 仅在合法获取访问权限后继续执行数据提取

何时使用

  • 直接请求返回登录页面或部分页面骨架
  • 搜索结果显示内容存在,但直接请求被阻止
  • 网站依赖客户端侧渲染
  • 用户明确希望获得其自身可访问网站的帮助

工作流程

1. 诊断失败原因

识别阻塞类型:

  • 需要登录
  • JavaScript 重度渲染
  • 地域或语言环境不匹配
  • 仅索引片段内容
  • 临时请求不兼容

2. 使用基于浏览器的加载方式

在判定页面不可用前:

  • 在本地浏览器中打开目标页面
  • 等待客户端内容完成渲染
  • 适当检查可见文本、链接及网络行为
  • 对于 JavaScript 重度页面,优先选择浏览器路径而非纯 HTTP 请求

3. 让用户在本地完成登录

若需登录且用户已具备权限:

  • 在本地浏览器中打开登录流程
  • 仅请求最小必要操作,例如:“请在打开的页面中完成登录”
  • 当浏览器登录可行时,不要在聊天中要求提供原始密码或其他敏感信息

4. 在已认证会话中继续操作

用户登录后:

  • 导航至目标页面
  • 在站点内部或账户区域进行搜索
  • 提取所需的事实、链接或结构化结果
  • 标注哪些信息来自已认证视图

5. 优先使用官方登录后界面

若可用,优先选择:

  • 账户仪表盘
  • 导出页面
  • 官方 API
  • RSS 或订阅源
  • 站点内搜索
  • 站点地图
  • 可下载的报告

输出格式

返回以下内容:

  1. 公开可访问的内容
  2. 需要认证才能访问的内容
  3. 用户是否已在本地完成登录
  4. 认证后成功提取的信息
  5. 仍无法获取的内容
1B
@1477009639zw-blip

已收录 3 个 Skill

相关推荐