PDF Extract

通过ComPDF API从PDF及图像中提取表格、OCR文本等结构化数据,支持多格式导出。

已扫描
适合谁
需要批量处理PDF数据的办公人员、从事文档自动化与数据录入的技术用户
不适合谁
对数据隐私要求极高的敏感行业用户、无法访问外部API或网络受限环境的用户
国内可用性
需网络配置。可能需要网络配置或第三方服务可访问。
安装难度
新手友好(★☆☆)。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

openclaw skills install @compdf-youna/extract-pdf-compdf

Skill 说明

命令、参数、文件名以原文为准

PDF 提取

通过 ComPDF Cloud REST API 处理 PDF 文件。支持 50 多种文档处理操作。

官方文档:https://api.compdf.com/api-reference/overview

何时执行

  • 用户请求转换文件格式(例如:“将这个 PDF 转为 Word”,“将 Excel 转为 PDF”)
  • 用户请求编辑 PDF 页面(例如:“合并这两个 PDF”,“删除第 3 页”,“旋转 PDF”)
  • 用户请求为 PDF 添加或移除水印
  • 用户请求压缩 PDF 文件
  • 用户请求对扫描件或图片中的文字进行 OCR 识别
  • 用户请求使用 AI 提取或解析文档内容
  • 用户请求从图片中提取表格
  • 用户请求批量处理多个文档文件
  • 用户请求对比两个 PDF 文档之间的差异
  • 用户提及 ComPDF、compdf 或相关关键词

工作流程

步骤 1 — 获取 API 密钥

检查 config/public_key.txt 文件是否存在且内容非空。

  • 如果文件存在且内容不为空:使用存储的密钥(去除首尾空白字符)。
  • 如果文件缺失或为空:向用户索取其 ComPDF API 公共密钥。告知用户可在 <https://api-dashboard.compdf.com/api/keys> 获取。用户提供密钥后,询问是否希望将其本地保存以供后续会话使用。

- 若用户同意,将密钥写入 config/public_key.txt

- 若用户拒绝,则仅在当前会话中使用该密钥,不进行本地保存。

密钥文件 不会包含在发布的技能包中。它仅在用户明确选择后于运行时创建。用户可随时删除 config/public_key.txt 以撤销本地存储。

步骤 2 — 确认外部上传意图

在上传任何文件之前,必须明确告知用户:

⚠️ 外部上传确认要求

您的文件将被上传至 ComPDF 服务器(api-server.compdf.com 或 api-server.compdf.cn)进行处理。请确认以下事项:

  1. 您同意将此文件上传至外部服务器。
  2. 该文件不包含高度敏感或机密信息,或您已接受相关风险。
  3. 您已阅读 ComPDF 的隐私政策:https://www.compdf.com/privacy-policy。

只有在获得用户明确确认后,才可继续上传。

步骤 3 — 确定基础 URL

根据用户的网络环境判断:

环境基础 URL
国际版https://api-server.compdf.com/server/v2
中国大陆版https://api-server.compdf.cn/server/v2

步骤 4 — 选择工具

references/tool-list.md 中查找用户任务对应的 executeTypeUrl

常见操作快速参考:

操作executeTypeUrl
PDF → Wordpdf/docx
PDF → Excelpdf/xlsx
PDF → 图片pdf/img
PDF → Markdownpdf/markdown
Word → PDFdocx/pdf
合并 PDFpdf/merge
分割 PDFpdf/split
添加水印pdf/addWatermark
PDF 压缩pdf/compress
OCR 识别documentAI/ocr
AI 文档提取idp/documentExtract
AI 文档解析idp/documentParsing

完整 50+ 工具列表请参见 references/tool-list.md

步骤 5 — 构建参数(可选)

若所选工具支持自定义参数,请在 references/parameters.md 中查找其 JSON Schema。参数以 JSON 字符串 形式作为 parameter 表单字段传入。若省略,则使用服务器默认值。

步骤 6 — 发送请求

在用户已明确确认文件可上传至 ComPDF Cloud 后:

  1. {baseUrl}/process/{executeTypeUrl} 发送 POST 请求。
  2. x-api-key 头部中包含用户提供的 API 密钥(仅限当前会话有效)。
  3. 将选定文件作为多部分表单数据发送。
  4. 仅当所选工具支持自定义参数时,才包含 parameter 字段。
  5. 使用同步 /process/ 接口,确保结果在一次响应中返回。

在用户确认文件可传输前,不得发送请求。

步骤 7 — 处理响应

**1. 检查 code 字段** — "200" 表示成功;其他值均为错误。

**2. 检查 taskStatus**(同步调用应为 TaskFinish):

状态含义操作
TaskFinish处理完成进入下载步骤
TaskProcessing内部仍在处理通知用户,建议稍后重试
TaskOverdue超时尝试重试或拆分为更小任务

**3. 从 fileInfoDTOList[].downloadUrl 提取下载链接。**

4. 提醒用户:下载链接将在 次日 24:00 过期

5. 出现失败时:读取 failureCodefailureReason,然后在 references/error-codes.md 中查找故障排除建议。

6. 遇到配额耗尽code = "06001"):告知用户:

如需更多积分,请访问 <https://api.compdf.com/api/pricing-old>

辅助接口

功能方法与路径
列出支持的工具GET {baseUrl}/tool/support
查询剩余积分GET {baseUrl}/asset/info
列出任务GET {baseUrl}/task/list?page=1&size=10
关闭任务POST {baseUrl}/task/closeTask?taskId={taskId}

输出格式

成功时:

处理完成!

文件:{fileName} → {downFileName}
状态:{taskStatus}
耗时:{convertTime}ms
原始大小:{fileSize} 字节
结果大小:{convertSize} 字节
下载链接:{downloadUrl}

⚠️ 下载链接将于明日 24:00 过期,请及时保存。

失败时:

处理失败。

错误码:{failureCode}
原因:{failureReason}
建议:{来自 references/error-codes.md 的故障排除建议}

重要规则


name: PDF Extract

version: 1.1.0

description: 从 PDF 文件中提取文本内容,支持批量处理和加密文件。

summary: 提供高效、安全的 PDF 文本提取功能,适用于自动化文档处理场景。

使用说明

  1. HTTP 200 ≠ 处理成功 — 始终检查返回 JSON 中的 codetaskStatus 字段以确认任务状态。
  2. 单个任务最多处理 5 个文件 — 若需处理更多文件,请拆分为多个任务提交。
  3. 免费套餐限制 — 每 30 天内最多可处理 200 个文件。
  4. 文件类型自动识别 — API 会自动检测上传文件类型,无需手动修改文件扩展名。
  5. 加密 PDF 支持 — 如文件受密码保护,请在 password form-data 字段中提供密码(与 parameter 字段分开填写)。
  6. 中国大陆域名 — 中国大陆用户需将 compdf.com 替换为 compdf.cn
  7. API Key 用户自主管理 — API 密钥文件(config/public_key.txt)不会随技能包预置。仅在用户明确启用后于运行时生成,用户可随时删除该文件。
  8. 外部上传需用户确认 — 在将文件上传至 ComPDF 服务器前,必须获得用户的明确同意。

许可与版权

Copyright © 2014-2026 PDF Technologies, Inc., a KDAN Company. All Rights Reserved.

ComPDF 和 ComPDFKit 是 [PDF Technologies, Inc.](https://www.compdf.com/)(KDAN 公司旗下)的商标。

本技能包采用 Apache License 2.0 许可协议。完整许可文本请参见 LICENSE.txt

ComPDF Cloud API 为 PDF Technologies, Inc. 提供的商业服务。使用该 API 需遵守 [ComPDF 服务条款](https://www.compdf.com/terms-of-service) 和 [隐私政策](https://www.compdf.com/privacy-policy)。

CY
@compdf-youna

已收录 1 个 Skill

相关推荐