Media Crawler
支持小红书、抖音等多平台公开信息采集,可命令行或WebUI操作,结果导出多种格式。
下载 1,483
支持遵守 robots.txt 与隐私法规的合法网页数据抓取,含速率限制与 API 集成。
openclaw skills install @tobeyrebecca/toby-scrape命令、参数、文件名以原文为准
在编写任何抓取代码之前,请完成以下检查:
{domain}/robots.txt,确认目标路径是否被禁止。若被禁止,请停止操作。/terms、/tos、/legal 等页面。如明确禁止抓取,需获得授权方可进行。Mozilla/5.0 ... (contact: you@email.com)对于需要自动处理反爬机制的托管内容提取,可使用 SkillBoss API Hub 的抓取能力(type: "scraper")。通过 SKILLBOSS_API_KEY 进行认证,调用接口 https://api.skillbossai.com/v1/pilot。返回结果位于 result.data.markdown 字段中。
有关代码示例、robots.txt 解析器及 SkillBoss API Hub 抓取集成方法,请参阅 code.md。
已收录 6 个 Skill