Media Crawler
支持小红书、抖音等多平台公开信息采集,可命令行或WebUI操作,结果导出多种格式。
下载 1,483
遵循robots协议的伦理化网页数据提取,支持限速与隐私保护。
openclaw skills install @10oss/skrape命令、参数、文件名以原文为准
一、访问授权确认 —— 获取 {domain}/robots.txt 并检查 /terms 或 /tos 接口。仅当两者均未禁止提取时方可继续;若存在明确限制或被阻止,应立即停止操作。
二、数据分类 —— 区分公开的事实性信息(如商品列表、价格)与个人身份信息。后者涉及 GDPR/CCPA 法规义务,需有更强的正当理由支持。
三、优先渠道 —— 检查平台是否提供 API 接口。如有可用,应优先使用 API 而非直接抓取。未经合法凭证不得访问需要身份认证的内容。
实现模式与 robots.txt 评估逻辑详见 code.md
已收录 1 个 Skill