Ot Aiops
支持多协议工业设备数据采集与智能诊断,具备高风险写入防护机制。
基于Scrapling的反检测网页抓取框架,支持绕过Cloudflare等反爬机制。
openclaw skills install @jeminay/scrapling-fetcher命令、参数、文件名以原文为准
源码地址: https://github.com/D4Vinci/Scrapling (开源项目,采用类 MIT 许可证)
PyPI 包名: scrapling — 首次使用前需安装(见下方说明)
⚠️ 仅对您有权限访问的网站进行爬取。请遵守
robots.txt和服务条款。不得使用隐身模式绕过付费墙或未经授权访问受限内容。
pip install scrapling[all]
patchright install chromium # 隐身/动态模式所需scrapling[all] 安装 patchright(Playwright 的隐身分支,作为 PyPI 包捆绑分发 —— 非拼写错误)、curl_cffi、MCP 服务器依赖项以及 IPython shell。patchright install chromium 通过 patchright 自带的安装器下载 Chromium(约 100 MB),机制与 playwright install chromium 相同。scripts/scrape.py —— 用于三种获取模式的命令行封装工具。
# 基础获取(文本输出)
python3 ~/skills/scrapling/scripts/scrape.py <url> -q
# 使用 CSS 选择器提取内容
python3 ~/skills/scrapling/scripts/scrape.py <url> --selector ".class" -q
# 隐身模式(绕过 Cloudflare)—— 仅限您有权访问的站点使用
python3 ~/skills/scrapling/scripts/scrape.py <url> --mode stealth -q
# JSON 格式输出
python3 ~/skills/scrapling/scripts/scrape.py <url> --selector "h2" --json -qweb_fetch 返回 403/429/Cloudflare 验证页面 → 使用 --mode stealth--mode dynamic--mode http(默认)如需超出 CLI 功能的自定义逻辑,请编写内联 Python 代码。详见 references/patterns.md 中的内容:
auto_save / adaptive —— 本地保存元素指纹)scrapling mcp):启动一个本地网络服务,用于 AI 原生爬取。仅在明确需要且信任的情况下启动 —— 该服务会暴露本地 HTTP 接口。auto_save=True**:将元素指纹持久化到磁盘,支持后续自适应重爬。会在工作目录创建本地状态。xvfb-run。已收录 1 个 Skill