Firecrawl Download

将整个网站批量下载为本地文件,支持多种格式与截图。

已扫描
适合谁
开发者需离线保存API文档、研究人员收集网页资料
不适合谁
无需离线使用的普通浏览者、希望仅查看网页而不下载的用户
国内可用性
需网络配置。可能需要网络配置或第三方服务可访问。
安装难度
新手友好(★☆☆)。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

openclaw skills install @eohmig/firecrawl-download

Skill 说明

命令、参数、文件名以原文为准

firecrawl download

实验性功能。 便捷命令,结合 map + scrape,将整个网站保存为本地文件。

首先对网站进行映射以发现页面,然后将每个页面抓取并保存到 .firecrawl/ 下的嵌套目录中。所有抓取选项均适用于下载操作。始终使用 -y 跳过确认提示。

适用场景

  • 想将整个网站(或特定部分)保存为本地文件
  • 需要离线访问文档或内容
  • 需要结构化组织的批量内容提取

快速入门

# 交互式向导(自动选择格式、截图、路径)
firecrawl download https://docs.example.com

# 启用截图
firecrawl download https://docs.example.com --screenshot --limit 20 -y

# 多种格式(每页生成独立文件)
firecrawl download https://docs.example.com --format markdown,links --screenshot --limit 20 -y
# 每页生成:index.md + links.txt + screenshot.png

# 仅下载特定部分
firecrawl download https://docs.example.com --include-paths "/features,/sdks"

# 跳过翻译版本
firecrawl download https://docs.example.com --exclude-paths "/zh,/ja,/fr,/es,/pt-BR"

# 完整组合
firecrawl download https://docs.example.com \
  --include-paths "/features,/sdks" \
  --exclude-paths "/zh,/ja" \
  --only-main-content \
  --screenshot \
  -y

下载选项

选项说明
--limit <n>最多下载页面数量
--search <query>根据搜索关键词过滤 URL
--include-paths <paths>仅下载匹配路径的页面
--exclude-paths <paths>跳过匹配路径的页面
--allow-subdomains包含子域名页面
-y跳过确认提示(在自动化流程中请始终使用)

抓取选项(全部支持下载)

-f <formats>-H-S--screenshot--full-page-screenshot--only-main-content--include-tags--exclude-tags--wait-for--max-age--country--languages

参考

  • [firecrawl-map](../firecrawl-map/SKILL.md) — 仅发现 URL,不下载
  • [firecrawl-scrape](../firecrawl-scrape/SKILL.md) — 抓取单个页面
  • [firecrawl-crawl](../firecrawl-crawl/SKILL.md) — 批量提取为 JSON(不保存为本地文件)
E
@eohmig

已收录 1 个 Skill

相关推荐