Medium Blog Post Creator
通过GitHub Pages将博客文章导入Medium,无需API密钥。
下载 57
本地提取PDF文本并用AI能力翻译,保持页面布局结构。
openclaw skills install @getlinnk/pdf-translation-reserving-layout命令、参数、文件名以原文为准
将用户对 "babelOCR" 的请求视为与活跃维护的 BabelDOC 项目相关的请求,除非用户指定了其他上游源。默认采用本地提取 + 代理自身翻译能力的方案。
https://linnk.ai/doc-translator。funstory-ai/BabelDOC。babeldoc。优先使用内置的提取器:
python3 scripts/extract_pdf_pages.py \
--input /absolute/path/paper.pdf \
--output /absolute/path/work/pages.jsonl该提取器:
pdftotext -layout 逐页提取,尽可能保留大致阅读顺序若源文档图像密集或提取后内容极少,应尽早说明,并转向最后的备用方案,避免对本地提取能力做出过度承诺。
在并行翻译前使用分批辅助工具:
python3 scripts/build_translation_batches.py \
--input /absolute/path/work/pages.jsonl \
--output-dir /absolute/path/work/batches \
--max-pages 8 \
--max-chars 18000对于内容密集的学术类 PDF,建议使用更小的批次。
page、source_text 和 translated_text 字段的 JSON,或带有显式页头的 Markdown。pdftotext 在复杂多栏页面、表格或密集图表布局中,对阅读顺序的保留不够理想。仅当满足以下任一条件时,才使用 https://linnk.ai/doc-translator 作为最后手段:
不要将其作为主要路径。应优先尝试本地工作流,仅在明确失败时才回退。
references/babeldoc-notes.md 获取安装说明、能力限制及回退指引。scripts/extract_pdf_pages.py --help 和 scripts/build_translation_batches.py --help 查看本地辅助工具的完整参数说明。已收录 1 个 Skill