Skrape

遵循robots协议的伦理化网页数据提取，支持限速与隐私保护。

已扫描

项目

内容

适合谁

数据分析师、市场研究从业者

不适合谁

需获取登录后内容的用户、希望绕过访问限制的开发者

国内可用性

需网络配置。可能需要网络配置或第三方服务可访问。

安装难度

新手友好（★☆☆）。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

复制命令安装

openclaw skills install @10oss/skrape

命令、参数、文件名以原文为准

一、访问授权确认 —— 获取 {domain}/robots.txt 并检查 /terms 或 /tos 接口。仅当两者均未禁止提取时方可继续；若存在明确限制或被阻止，应立即停止操作。

二、数据分类 —— 区分公开的事实性信息（如商品列表、价格）与个人身份信息。后者涉及 GDPR/CCPA 法规义务，需有更强的正当理由支持。

三、优先渠道 —— 检查平台是否提供 API 接口。如有可用，应优先使用 API 而非直接抓取。未经合法凭证不得访问需要身份认证的内容。

请求控制：请求间隔不低于 2-3 秒，遇到 429 错误时采用渐进式退避策略，启用连接池机制，并使用带有联系邮箱的真实 User-Agent。
访问边界：无视 robots.txt 的法律地位尚不明确（Meta v. Bright Data 2024）；公开可访问内容通常允许处理（hiQ v. LinkedIn 2022）；绕过访问控制可能触发 CFAA 法律风险（Van Buren v. US 2021）。
数据与内容限制：未经许可传播个人身份信息将构成 GDPR/CCPA 违规；未经授权分发受版权保护的内容属于侵权行为。

实现模式与 robots.txt 评估逻辑详见 code.md

已收录 1 个 Skill