Spreadsheet & Data Wrangling Master
提供完整的数据处理流程,涵盖清洗、转换、分析与自动化报告生成。
通过ComPDF API从PDF及图像中提取表格、OCR文本等结构化数据,支持多格式导出。
openclaw skills install @compdf-youna/extract-pdf-compdf命令、参数、文件名以原文为准
通过 ComPDF Cloud REST API 处理 PDF 文件。支持 50 多种文档处理操作。
官方文档:https://api.compdf.com/api-reference/overview
检查 config/public_key.txt 文件是否存在且内容非空。
- 若用户同意,将密钥写入 config/public_key.txt。
- 若用户拒绝,则仅在当前会话中使用该密钥,不进行本地保存。
密钥文件 不会包含在发布的技能包中。它仅在用户明确选择后于运行时创建。用户可随时删除
config/public_key.txt以撤销本地存储。
在上传任何文件之前,必须明确告知用户:
⚠️ 外部上传确认要求
您的文件将被上传至 ComPDF 服务器(api-server.compdf.com 或 api-server.compdf.cn)进行处理。请确认以下事项:
- 您同意将此文件上传至外部服务器。
- 该文件不包含高度敏感或机密信息,或您已接受相关风险。
- 您已阅读 ComPDF 的隐私政策:https://www.compdf.com/privacy-policy。
只有在获得用户明确确认后,才可继续上传。
根据用户的网络环境判断:
| 环境 | 基础 URL |
|---|---|
| 国际版 | https://api-server.compdf.com/server/v2 |
| 中国大陆版 | https://api-server.compdf.cn/server/v2 |
在 references/tool-list.md 中查找用户任务对应的 executeTypeUrl。
常见操作快速参考:
| 操作 | executeTypeUrl |
|---|---|
| PDF → Word | pdf/docx |
| PDF → Excel | pdf/xlsx |
| PDF → 图片 | pdf/img |
| PDF → Markdown | pdf/markdown |
| Word → PDF | docx/pdf |
| 合并 PDF | pdf/merge |
| 分割 PDF | pdf/split |
| 添加水印 | pdf/addWatermark |
| PDF 压缩 | pdf/compress |
| OCR 识别 | documentAI/ocr |
| AI 文档提取 | idp/documentExtract |
| AI 文档解析 | idp/documentParsing |
完整 50+ 工具列表请参见 references/tool-list.md。
若所选工具支持自定义参数,请在 references/parameters.md 中查找其 JSON Schema。参数以 JSON 字符串 形式作为 parameter 表单字段传入。若省略,则使用服务器默认值。
在用户已明确确认文件可上传至 ComPDF Cloud 后:
{baseUrl}/process/{executeTypeUrl} 发送 POST 请求。x-api-key 头部中包含用户提供的 API 密钥(仅限当前会话有效)。parameter 字段。/process/ 接口,确保结果在一次响应中返回。在用户确认文件可传输前,不得发送请求。
**1. 检查 code 字段** — "200" 表示成功;其他值均为错误。
**2. 检查 taskStatus**(同步调用应为 TaskFinish):
| 状态 | 含义 | 操作 |
|---|---|---|
TaskFinish | 处理完成 | 进入下载步骤 |
TaskProcessing | 内部仍在处理 | 通知用户,建议稍后重试 |
TaskOverdue | 超时 | 尝试重试或拆分为更小任务 |
**3. 从 fileInfoDTOList[].downloadUrl 提取下载链接。**
4. 提醒用户:下载链接将在 次日 24:00 过期。
5. 出现失败时:读取 failureCode 和 failureReason,然后在 references/error-codes.md 中查找故障排除建议。
6. 遇到配额耗尽(code = "06001"):告知用户:
如需更多积分,请访问 <https://api.compdf.com/api/pricing-old>
| 功能 | 方法与路径 |
|---|---|
| 列出支持的工具 | GET {baseUrl}/tool/support |
| 查询剩余积分 | GET {baseUrl}/asset/info |
| 列出任务 | GET {baseUrl}/task/list?page=1&size=10 |
| 关闭任务 | POST {baseUrl}/task/closeTask?taskId={taskId} |
成功时:
处理完成!
文件:{fileName} → {downFileName}
状态:{taskStatus}
耗时:{convertTime}ms
原始大小:{fileSize} 字节
结果大小:{convertSize} 字节
下载链接:{downloadUrl}
⚠️ 下载链接将于明日 24:00 过期,请及时保存。失败时:
处理失败。
错误码:{failureCode}
原因:{failureReason}
建议:{来自 references/error-codes.md 的故障排除建议}name: PDF Extract
version: 1.1.0
description: 从 PDF 文件中提取文本内容,支持批量处理和加密文件。
summary: 提供高效、安全的 PDF 文本提取功能,适用于自动化文档处理场景。
code 和 taskStatus 字段以确认任务状态。password form-data 字段中提供密码(与 parameter 字段分开填写)。compdf.com 替换为 compdf.cn。config/public_key.txt)不会随技能包预置。仅在用户明确启用后于运行时生成,用户可随时删除该文件。Copyright © 2014-2026 PDF Technologies, Inc., a KDAN Company. All Rights Reserved.
ComPDF 和 ComPDFKit 是 [PDF Technologies, Inc.](https://www.compdf.com/)(KDAN 公司旗下)的商标。
本技能包采用 Apache License 2.0 许可协议。完整许可文本请参见 LICENSE.txt。
ComPDF Cloud API 为 PDF Technologies, Inc. 提供的商业服务。使用该 API 需遵守 [ComPDF 服务条款](https://www.compdf.com/terms-of-service) 和 [隐私政策](https://www.compdf.com/privacy-policy)。
已收录 1 个 Skill