Ot Aiops
支持多协议工业设备数据采集与智能诊断,具备高风险写入防护机制。
通过AI将任意网页转换为结构化JSON数据,支持动态参数和API调用。
openclaw skills install @melvin2016/webscraper-pulpminer命令、参数、文件名以原文为准
PulpMiner 可将任意网页转换为结构化 JSON 数据。您只需提供一个 URL,可选地再提供一个 JSON 模板,PulpMiner 会抓取页面内容,通过大语言模型(LLM)处理,并返回清洗后的结构化数据。
所有 API 调用都需要包含 apikey 请求头:
apikey: <PULPMINER_API_KEY>在 https://pulpminer.com/api 获取您的 API 密钥——如果没有密钥,请点击“重新生成密钥”。
PulpMiner 的工作分为两个阶段:
curl -X GET "https://api.pulpminer.com/external/<apiId>" \
-H "apikey: <PULPMINER_API_KEY>"返回配置网页中提取的 JSON 数据。
对于保存时使用模板 URL(如 https://example.com/search?q={{query}}&page={{page}})的 API:
curl -X POST "https://api.pulpminer.com/external/<apiId>" \
-H "apikey: <PULPMINER_API_KEY>" \
-H "Content-Type: application/json" \
-d '{"query": "javascript frameworks", "page": "1"}'保存的 URL 中的 {{variable}} 占位符将被您提供的值替换。
成功响应返回:
{
"data": { ... },
"errors": null
}错误响应返回:
{
"data": null,
"errors": "描述错误原因的提示信息"
}在 https://pulpminer.com/api 创建已保存的 API 时,可配置以下选项:
| 选项 | 说明 |
|---|---|
| URL | 要抓取的网页地址 |
| JSON 模板 | 可选的 JSON 结构,供 LLM 参照(例如:{"name": "", "price": ""}) |
| 渲染 JavaScript | 启用以支持单页应用(SPA)和 JS 重度加载的页面(使用无头浏览器) |
| CSS 选择器 | 仅提取页面特定部分(例如:.product-list、#main-content) |
| 额外指令 | 提供给 AI 的补充说明(例如:“仅提取价格高于 $50 的项目”) |
| 动态 URL | 启用 URL 中使用 {{variable}} 语法的模板变量 |
| 缓存 | 开启或关闭响应缓存 |
用于在 Zapier 工作流中进行异步抓取:
# 静态 API
curl -X POST "https://api.pulpminer.com/external/zapier/get/<apiId>" \
-H "apikey: <PULPMINER_API_KEY>" \
-d '{"callbackURL": "https://hooks.zapier.com/..."}'
# 动态 API
curl -X POST "https://api.pulpminer.com/external/zapier/post/<apiId>" \
-H "apikey: <PULPMINER_API_KEY>" \
-d '{"callbackURL": "https://hooks.zapier.com/...", "query": "value"}'立即返回 201 状态码。当抓取完成后,将数据发送至回调地址。
验证认证:
curl -X GET "https://api.pulpminer.com/external/n8n/auth" \
-H "apikey: <PULPMINER_API_KEY>"随后可使用标准的 /external/<apiId> 端点获取数据。
已收录 1 个 Skill