Azure Content Understanding Layout

利用 Azure 内容理解分析器提取 PDF、图片等文档的结构化内容,输出 Markdown 和 JSON。

已扫描
适合谁
需要处理大量文档的办公人员、自动化文档转换的技术用户
不适合谁
无 Azure API 密钥的用户、希望免配置直接使用的初学者
国内可用性
需网络配置。可能需要网络配置或第三方服务可访问。
安装难度
新手友好(★☆☆)。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

openclaw skills install @zwcih/azure-content-layout

Skill 说明

命令、参数、文件名以原文为准

Azure 内容理解 — 布局分析器

使用 Azure 的预构建布局分析器从文档中提取结构化内容。输出包含 Markdown 和结构化 JSON,支持文本、表格、图表及文档层级结构。

设置

设置环境变量:

export AZURE_CU_ENDPOINT="https://YOUR_RESOURCE.services.ai.azure.com/"
export AZURE_CU_API_KEY="YOUR_KEY_HERE"

可选:设置 API 版本(默认为 2025-05-01-preview):

export AZURE_CU_API_VERSION="2025-11-01"

快速使用

分析 URL 并输出 Markdown

node scripts/analyze.mjs --url "https://example.com/document.pdf"

分析本地文件(通过 stdin 输入)

cat invoice.pdf | node scripts/analyze.mjs --stdin --markdown output.md --output result.json

同时保存 Markdown 与完整 JSON

node scripts/analyze.mjs --url "https://example.com/report.pdf" \
  --markdown report.md \
  --output report.json

直接 API 调用

当脚本不可用时,可使用 curl:

# 提交分析请求(预览版 API)
curl -s -X POST "$AZURE_CU_ENDPOINT/contentunderstanding/analyzers/prebuilt-layout:analyze?api-version=2025-05-01-preview" \
  -H "Ocp-Apim-Subscription-Key: $AZURE_CU_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url":"https://example.com/doc.pdf"}'

# 响应包含 Operation-Location 头部 —— 需轮询该 URL 获取结果

对于正式版 API(2025-11-01),请求体格式发生变化:

{"inputs": [{"url": "https://example.com/doc.pdf"}]}

输出

Markdown

分析器生成 GitHub 风格的 Markdown,保留以下内容:

  • 标题(h1–h6)
  • 表格(以 HTML <table> 块形式输出)
  • 选择标记(☒ 已勾选,☐ 未勾选)
  • 图表(带引用)
  • 段落(按阅读顺序排列)

结构化 JSON

完整结果包含各元素的详细数据:

  • pages — 每页的尺寸、文字和行数统计
  • paragraphs — 文本块及其边界区域和语义角色
  • tables — 包含行列跨距的单元格信息
  • figures — 检测到的图像/图表及其边界区域
  • sections — 文档的分层结构

支持的格式

PDF、JPEG、PNG、BMP、TIFF、HEIF、DOCX、XLSX、PPTX、HTML

最佳实践

  • 异步操作 — API 返回 202 状态码;需轮询 Operation-Location 获取结果
  • 轮询间隔 — 建议每 3 秒一次;结果通常在 5–60 秒内返回
  • 大文档处理 — 最多支持 2,000 页;处理时间与页数成线性关系
  • 文件上传 — 使用 Content-Type: application/octet-stream 并发送二进制数据
  • 表格渲染 — 复杂布局(如合并单元格)的表格以 HTML 形式嵌入 Markdown

API 参考

详见 [references/api.md](references/api.md) 获取完整的请求与响应说明。

Z
@zwcih

已收录 1 个 Skill

相关推荐