Web Research

自动执行网络研究并生成带引用的结构化报告,支持多格式输出。

已扫描
适合谁
研究人员、内容创作者
不适合谁
无网络环境用户、需要本地离线处理敏感数据者
国内可用性
需网络配置。可能需要网络配置或第三方服务可访问。
安装难度
新手友好(★☆☆)。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

openclaw skills install @indigas/claw-web-research

Skill 说明

命令、参数、文件名以原文为准

Web Research 技能

版本: 2.1.0

作者: Claw 🦾

用途: 生成带来源引用、质量评分和自动跟进的结构化研究报告。


概述

Web-research 技能实现了端到端的研究自动化流程:解析问题 → 生成多样化查询 → 搜索 → 获取内容 → 跟进 → 去重 → 综合 → 生成报告。

相较于 v1 的主要改进:

  • 自动跟进查询 — 基于初始发现,执行两轮跟进搜索
  • 质量评分 — 对每个来源按内容深度、URL、标题、日期进行 0-1 分评分
  • 来源去重 — 移除重复来源,保留最详细的版本
  • 批量研究模式 — 单次会话处理多个主题
  • 多种输出格式 — 支持 markdown(默认)、JSON、HTML
  • 主题提取 — 从自然语言问题中智能提取关键词

使用方法

基础用法

# 单个研究问题
python3 scripts/research.py "2026 年欧盟人工智能监管现状是什么?"

# 增加跟进轮次
python3 scripts/research.py --followups 5 "捷克共和国可再生能源市场分析"

# JSON 格式输出
python3 scripts/research.py --format json "2026 年加密货币监管"

# HTML 格式输出
python3 scripts/research.py --format html "云计算市场竞争格局"

# 自定义来源数量限制
python3 scripts/research.py --sources 15 "中小企业 SaaS 工具的最佳定价方案"

批量模式

创建一个 JSON 文件(questions.json):

{
  "questions": [
    "2026 年欧盟人工智能监管现状",
    "中小企业自动化最佳 SaaS 工具",
    "2026 年加密货币监管趋势"
  ]
}

然后运行:

python3 scripts/research.py --batch questions.json

流程步骤

步骤 1:解析问题

从自然语言问题中提取有意义的主题关键词。去除停用词,保留实体和关键术语。

步骤 2:生成查询

生成 5 种多样化的查询变体:

  • 精确匹配
  • 宽泛匹配
  • 时间敏感(如 2025/2026)
  • 分析型
  • 市场数据导向

步骤 3:执行搜索

对每种查询变体运行 web_search。收集包含标题、URL、摘要的结果。

步骤 4:获取内容

使用 web_fetch 从顶部 URL 提取内容。保存全文以供综合使用。

步骤 5:跟进查询(v2)

基于初始发现,生成两轮跟进搜索:

  • 检索发现中的新兴主题
  • 添加时间敏感的跟进
  • 弥补信息空白
  • 提升覆盖范围与准确性

步骤 6:去重与评分

根据 URL 去除重复来源。对每个来源进行评分(0-1),依据:

  • 包含 URL(+0.2),包含标题(+0.15),包含详细信息(+0.3)
  • 内容长度 > 100 字符(+0.2),包含日期(+0.15)

步骤 7:综合与报告

将发现整合为结构化报告,包含:

  • 执行摘要
  • 编号的关键发现(附质量标签)
  • 质量评估表
  • 局限性与方法说明
  • 来源引用

报告格式

Markdown(默认)

富文本格式,支持标题、表格、项目列表,适合阅读与分享。

JSON

结构化数据输出,适合程序处理、API 接入、仪表盘展示。

HTML

自包含样式报告,适合网页查看、邮件附件。


输出文件

报告保存路径:workspace/research/web-research-YYYY-MM-DD-<topic>.md

JSON 报告:workspace/research/web-research-YYYY-MM-DD-<topic>.json

HTML 报告:workspace/research/web-research-YYYY-MM-DD-<topic>.html


质量规则

  1. 交叉验证 — 每个主要论断至少来自两个来源
  2. 标记过时信息 — 快速变化领域中超过两年的数据需标注
  3. 区分观点与数据 — 明确标注分析性内容
  4. 每条事实均需引用 — 所有事实性陈述必须附带 URL
  5. 记录分歧 — 当来源意见不一致时,应同时记录各方观点
  6. 来源评分 — 低质量来源在报告中标注

技能依赖

  • web_search — 通过 SearXNG 搜索网络
  • web_fetch — 从 URL 获取并提取内容
  • write — 生成并保存报告
  • exec — 执行流程脚本

定价

套餐价格说明
单份报告€25-50一个研究问题,完整流程
批量研究€50-100多个问题(最多 5 个)
深度研究€75-150延长跟进轮次,引入专家来源
月度套餐€100-300/月持续研究,每周报告

文件结构

web-research/
  SKILL.md                              — 本文件
  scripts/
    research.py                         — 研究流程 v2.1.0
  references/
    synthesis-framework.md              — 如何综合发现
    report_template.md                  — 标准报告结构
    search-strategies.md                — 查询生成最佳实践

版本历史

版本日期变更
1.0.02026-04-19初始发布
2.0.02026-04-27增加跟进查询、质量评分、批量模式、多格式输出
2.1.02026-04-27新增 HTML 输出、改进主题提取、优化去重逻辑
I
@indigas

已收录 1 个 Skill

相关推荐