News Summary Local
读取本地 RSS/XML 文件,提取标题生成简洁列表。
将扫描件或图像中的财务文档内容转换为可编辑格式,支持多格式输出。
openclaw skills install @rizmoon/finance-ocr-pro命令、参数、文件名以原文为准
版本 1.0.7 更新:Word/DOCX 输出现在包含优化并扩展的 LaTeX 公式还原功能,用于识别出的公式。
请在用户明确提出 OCR 需求后运行此技能。
该技能特别适用于财务报告、年度报告、招股说明书、投资者演示文稿、监管文件、研究报告以及其他包含复杂结构、图表、图形、表格和混合布局元素的文档。
在执行 OCR 前,请明确操作模式:
- API_KEY(敏感)——用于认证 VLM 接口的 API 密钥。
- BASE_URL —— OpenAI 兼容 VLM 接口的基地址。所有页面图像和 OCR 提示内容将发送至该地址。
- VLM_MODEL —— 支持图像输入的视觉语言模型标识符。仅支持文本的模型无法使用。
BASE_URL。这是主要的数据传输路径。处理敏感文档前,用户必须确认该接口是可信的。BASE_URL 必须指向本地 VLM 服务。除非提供方可信,否则不要对敏感文档使用外部接口。scripts/ocr_setup.py 会检查依赖项并生成 .env 模板文件,但不会自动安装 Python 包。用户需自行审查并执行依赖安装。scripts/vendor/ 目录中的内嵌 Mermaid 和 MathJax 文件,运行时不会从 CDN 下载前端资源。osascript)。命令通过显式参数列表执行,而非 shell 字符串。.env 文件。请使用 .env.example 作为模板,真实凭证应保留在本地。当用户请求 OCR 或信息提取后,请给出简要说明,包括:
BASE_URL 是本地还是远程VLM_MODEL除非用户要求更改默认设置,否则自动继续。
VLM_MODEL1若用户的 API 接口或套餐支持安全的并发 OCR 请求,可告知用户可选择更高线程数。
- 后台模式:~/.semantic-ocr/jobs/<job_id>/results/
- 同步模式:ocr_output/OCR_<filename>/results/
如存在本地虚拟环境,请优先使用:
.venv/bin/python.venv/Scripts/python.exepython3,Windows 使用 python在运行任何命令前,确定解释器并全程复用:
PYTHON="${PYTHON:-$( [ -x .venv/bin/python ] && printf .venv/bin/python || printf python3 )}".venv\Scripts\python.exe,则使用它;否则使用 python运行以下命令:
$PYTHON scripts/ocr_setup.py --check若设置不完整,运行:
$PYTHON scripts/ocr_setup.py默认情况下,启动后台工作进程:
$PYTHON scripts/ocrctl.py --json start /path/to/document.pdf若提供商支持并发且用户希望更快完成 OCR,可建议更高线程数,例如:
$PYTHON scripts/ocrctl.py --json start -t 4 /path/to/document.pdf随后检查进度与输出:
$PYTHON scripts/ocrctl.py --json status <job_id>
$PYTHON scripts/ocrctl.py --json artifacts <job_id>
$PYTHON scripts/ocrctl.py --json tail <job_id>仅当用户明确要求即时执行时,才使用同步模式:
$PYTHON scripts/ocr_main.py /path/to/document.pdfAPI_KEY、BASE_URL 和 VLM_MODEL。200 DPI。1。已收录 1 个 Skill