Research

基于多源数据的市场研究,涵盖竞品分析、用户痛点与市场规模。

已扫描
适合谁
创业者、产品经理
不适合谁
仅需简单信息查询的用户、无需市场验证的内部工具开发
国内可用性
需网络配置。可能需要网络配置或第三方服务可访问。
安装难度
新手友好(★☆☆)。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

openclaw skills install @fortunto2/solo-research

Skill 说明

命令、参数、文件名以原文为准

/research

在生成 PRD 之前进行深度研究。输出结构化的 research.md,包含竞争分析、用户痛点、SEO/ASO 关键词、命名/域名建议以及市场规模数据。

MCP 工具(如可用则优先使用)

若 MCP 工具可用,请优先于 CLI 使用:

  • kb_search(query, n_results) — 在知识库中搜索相关文档
  • web_search(query, engines, include_raw_content) — 支持引擎路由的网页搜索
  • session_search(query, project) — 查找以往类似研究的记录
  • project_info(name) — 查看项目详情及技术栈
  • codegraph_explain(project) — 生成现有项目的架构概览(技术栈、设计模式、依赖关系)
  • codegraph_query(query) — 对代码图执行原始 Cypher 查询(查找共享包、依赖项)
  • project_code_search(query, project) — 在项目源码中进行语义搜索

MCP web_search 支持引擎覆盖:例如 engines="reddit"engines="youtube" 等。

若无 MCP 工具,以 WebSearch/WebFetch 为主要手段;若有 MCP web_search 工具,则优先使用以获得更优结果。

Reddit 搜索最佳实践

  • 单次查询最多使用 3 个关键词 — 关键词越多,返回结果越少
  • 有效示例:"product hunt outreach launch"

无效示例:"product hunt scraper maker profiles linkedin outreach launch strategy"

  • include_raw_content=true 在 Reddit 上很少有效 — 建议使用下方回退链

Reddit 内容获取 — 回退链

当搜索发现相关 Reddit 帖子时,读取其完整内容需通过以下回退链:

1. MCP Playwright (old.reddit.com)     ← 最佳选择:绕过验证码,获取完整帖子与评论
2. PullPush API (api.pullpush.io)      ← 通过关键词/子版块/作者/评分/日期进行搜索
3. MCP web_search include_raw_content   ← 有时可用,但常被截断
4. WebFetch / WebSearch 片段        ← 最后手段,仅提供部分数据

方法 1:MCP Playwright(推荐用于获取完整内容)

  • 使用 browser_navigate("https://old.reddit.com/r/...") — old.reddit.com 可免验证码加载
  • www.reddit.com 会触发验证码提示(“证明你是人类”),始终使用 old.reddit.com
  • 快照包含完整的帖子正文 + 评论,格式为结构化 YAML
  • 示例:old.reddit.com/r/indiehackers/comments/abc123/post_title/

方法 2:PullPush API(适用于搜索与发现)

  • 接口地址:https://api.pullpush.io/reddit/submission/search
  • 参数:q(关键词)、subredditauthorscore(如 >10,<100)、since/until(Unix 时间戳)、size(最大 100)
  • 速率限制:软限制 15 次/分钟,硬限制 30 次/分钟,每小时最多 1000 次请求。建议每次请求间隔 4 秒
  • 返回 JSON 格式,包含完整 selftext、作者、评分、创建时间戳
  • 评论搜索接口:/reddit/comment/search(参数相同)
  • 可通过 curl 调用:
curl -s "https://api.pullpush.io/reddit/submission/search?q=product+hunt+launch&subreddit=indiehackers&size=10"

方法 3:Reddit .json 接口(常被屏蔽)

  • 在任意 Reddit URL 后添加 .jsonreddit.com/r/sub/comments/id.json
  • 返回原始 JSON,包含完整帖子与评论
  • 频繁被阻止(返回 403 或 429)——仅作为机会性回退使用

方法 4:PRAW(Reddit 官方 API,适用于实时搜索与用户资料)

  • [praw-dev/praw](https://github.com/praw-dev/praw) — Python Reddit API 封装库
  • 支持 OAuth2 认证,内置速率限制,支持同步与异步操作
  • 适用场景:实时子版块搜索、用户资料、评论树获取
  • 安装命令:pip install prawuv add praw

搜索策略:混合模式(MCP + WebSearch)

同时使用多种搜索后端。每种各有优势:

步骤推荐后端原因
竞争对手分析WebSearch + site:producthunt.com + site:g2.com广泛发现 + Product Hunt + B2B 评测
Reddit / 用户痛点MCP web_searchengines: reddit(最多 3 个关键词!)+ MCP Playwright 获取完整内容可获取 PullPush API 中的 selftext 内容
YouTube 评测MCP web_searchengines: youtube视频评测(播放量反映需求热度)
市场规模WebSearch综合多个来源的数据进行估算
SEO / ASO 关键词WebSearch覆盖范围广,可获取趋势数据
页面抓取WebFetch 或 MCP web_searchinclude_raw_content最多提取 5000 字符的内容
Hacker News 讨论WebSearch site:news.ycombinator.comHN 上的讨论与观点
融资信息 / 公司背景WebSearch site:crunchbase.com竞品融资情况、团队规模
已验证收入WebFetch trustmrr.com/startup/<slug>Stripe 验证的月经常性收入(MRR)、增长数据、技术栈、流量

搜索工具可用性说明

以 WebSearch/WebFetch 为主。若 MCP web_search 工具可用,应优先使用(支持引擎路由和原始内容提取)。

执行步骤

  1. 解析想法 — 从 $ARGUMENTS 中提取想法。若为空,向用户询问具体想研究的主题。
  1. 识别产品类型 — 根据想法描述推断:

- 包含“app”、“mobile”、“iPhone”、“Android”等关键词 → 移动端(iOS/Android)

- 包含“website”、“SaaS”、“dashboard”、“web app”等关键词 → 网页端

- 包含“CLI”、“terminal”、“command line”等关键词 → 命令行工具

- 包含“API”、“backend”、“service”等关键词 → 后端服务

- 包含“extension”、“plugin”、“browser”等关键词 → 网页扩展(归类为 web)

- 若无法判断 → 默认为 web

- 仅在真正模糊时使用 AskUserQuestion(如“做一个待办事项应用”可能为 web 或 mobile)

- 该判断决定后续哪些研究模块生效(如移动端用 ASO,网页端用 SEO 等)

  1. 检索知识库与过往工作:

- 若 MCP kb_search 可用:kb_search(query="<idea keywords>", n_results=5)

- 若 MCP session_search 可用:session_search(query="<idea keywords>") — 检查是否曾研究过此想法

- 否则:在 .md 文件中通过 grep 搜索关键词

- 检查是否存在同名的 research.mdprd.md 文件

  1. 检查现有作品集(若可用 MCP codegraph 工具):

- codegraph_explain(project="<类似项目>") — 查看相关项目的架构概览

- project_code_search(query="<相关模式>", project="<兄弟项目>") — 寻找可复用的代码、模式或基础设施

- codegraph_query("MATCH (p:Project)-[:DEPENDS_ON]->(pkg:Package) WHERE pkg.name CONTAINS '<相关技术>' RETURN p.name, pkg.name") — 找出使用相似技术的项目

- 有助于评估:可行性、可复用代码、技术栈决策和时间预估

- 若无 MCP 工具可用,跳过此步骤

  1. 竞争分析 — 优先使用 WebSearch + 可选的 MCP web_search:

- "<创意> 竞争对手 替代方案 2026" — 广泛发现

- "<创意> 应用评论 定价" — 获取定价信息

- WebFetch 或 MCP include_raw_content=true:抓取竞争对手网址以获取详细定价数据

- MCP engines: reddit 或 WebSearch:"<创意> vs" — 用户评价

- "site:producthunt.com <创意>" — Product Hunt 上的新品发布

- "site:g2.com <创意>""site:capterra.com <创意>" — B2B 产品评价

- "site:crunchbase.com <竞争对手>" — 融资情况、团队规模

- "site:trustmrr.com <创意>" 或 WebFetch trustmrr.com/startup/<slug> — Stripe 验证的月经常性收入(MRR)、增长率、技术栈、流量(24小时/7天/30天)

- 对每个竞争对手提取:名称、网址、定价、核心功能、弱点、已验证的 MRR(如在 TrustMRR 上)

  1. 用户痛点 — 使用 MCP web_search / WebSearch + YouTube:

- MCP engines: reddit 或 WebSearch:"<问题>" — Reddit 讨论(最多 3 个关键词!

- 若找到 Reddit 帖子但内容不可访问 → 使用 MCP Playwright 打开:browser_navigate("https://old.reddit.com/r/...") — old.reddit.com 可绕过 CAPTCHA

- MCP engines: youtube 或 WebSearch:"<问题> 评测" — 视频评测

- "site:news.ycombinator.com <问题>" — Hacker News 上的意见

- WebSearch:"<问题> 烦人 或 让人恼火" — 更广泛的搜索

- 整合结果:列出前 5 个主要痛点,并附上原文引用和来源链接

  1. SEO / ASO 分析(根据第 2 步的产品类型决定):

针对网页应用:

- "<竞争对手> SEO 关键词 排名" — 竞争对手使用的关键词

- "<问题领域> 搜索量趋势 2026" — 需求信号

- WebFetch 或 MCP include_raw_content:抓取竞争对手页面以获取元标签信息

- 结果:关键词表格(关键词、意图、竞争度、相关性)

针对移动应用:

- "<类别> App Store 热门应用 关键词 2026" — 类别市场格局

- "site:reddit.com <竞争对手应用> 评测" — 用户投诉

- 结果:ASO 关键词、竞品评分、常见问题

  1. 命名、域名与公司注册:

- 生成 7-10 个候选名称(结合描述性与虚构/品牌化风格)

- 域名可用性:三重验证(whois → dig → RDAP)

- 商标及公司名称冲突检查

参见 references/domain-check.md(随本技能打包)了解 TLD 优先级层级、bash 脚本、注意事项及商标检查方法。

  1. 市场规模(TAM/SAM/SOM)—— 优先使用 WebSearch:

- WebSearch:"<市场> 市场规模 2025 2026 报告" — 综合统计数据

- WebSearch:"<市场> 增长率 CAGR 十亿" — 增长预测

- 推算:TAM → SAM → SOM(第一年)

  1. **撰写 research.md** — 写入当前项目目录下的 docs/research.md。若目录不存在则自动创建。
  1. 输出摘要:

- 关键发现(3-5 条要点)

- 建议:GO / NO-GO / PIVOT,附简要理由

- 生成的 research.md 路径

- 建议下一步操作:/validate <idea>

research.md 格式

参见 references/research-template.md(随本技能打包)获取完整输出模板(frontmatter、6 个章节、表格)。

注意事项

  • 项目目录名始终使用 kebab-case(短横线命名法)
  • research.md 已存在,提示确认是否覆盖
  • 当查询相互独立时,应并行执行

常见问题

MCP web_search 不可用

原因: MCP 服务器未运行或未正确配置。

解决: 优先使用 WebSearch/WebFetch。如需更好引擎路由效果(Reddit、GitHub、YouTube),可部署 [SearXNG](https://github.com/fortunto2/searxng-docker-tavily-adapter)(私有、自托管、免费),并配置 solograph MCP。

域名检查返回错误结果

原因: .app/.dev 的 whois 显示的是 TLD 创建时间,而非域名注册状态。

解决: 使用三重验证方法(whois → dig → RDAP)。关注 Name Server 和 Registrar 字段,而非创建日期。

research.md 已存在

原因: 此创意此前已进行过研究。

解决: 技能会提示是否覆盖。可选择合并新发现或重新开始。

主动式搜索实践

Reddit 深度挖掘

  1. MCP web_search 或 WebSearch — 用于发现(Reddit 最多 3 个关键词),获取帖子链接
  2. MCP Playwright — 打开 old.reddit.com 链接以阅读完整帖子与评论(绕过 CAPTCHA)
  3. 提取引述 — 复制关键语句并标注出处(用户 u/username、子版块、日期)
  4. 跨版检测 — 同一帖子出现在多个子版块 = 更高可信信号

Product Hunt 研究

  1. producthunt.com/visit-streaks — 连续访问排行榜(可通过 Playwright 抓取)
  2. producthunt.com/@username — 个人主页含社交链接、创作者历史、积分
  3. PH API v2 已损坏 — 自 2023 年 2 月起隐藏用户名/Twitter,建议使用爬虫
  4. Apify 机器人 — 使用前检查是否标记为 DEPRECATED(2025 年 9 月大规模停用)

TrustMRR 收入验证

技能:研究

版本:1.7.1

分块:3/3

TrustMRR 数据获取

  1. **trustmrr.com/startup/<slug>** — 经 Stripe 验证的月经常性收入(MRR)、增长百分比、订阅数、流量数据
  2. WebFetch 有效 — 无需认证,返回完整页面内容,包含 JSON-LD 结构化数据
  3. 数据字段:MRR、累计收入、最近 30 天收入、活跃订阅数、技术栈、流量(24 小时 / 7 天 / 30 天)、所属类别、创始人 X 账号
  4. 用途:验证竞争对手收入水平、基于真实数据进行市场规模估算、发现技术栈信息
  5. 搜索技巧:使用 "site:trustmrr.com <行业或创意关键词>" 查找具有已验证收入的同类初创公司
  6. Apify 抓取器:[TrustMRR 抓取器](https://apify.com/actor_builder/trustmrr-scraper/api) 用于批量数据提取

GitHub 库发现

  1. **MCP engines: github** — 常返回空结果,建议以 WebSearch 为主
  2. github.com/topics/<keyword> — 通过 Playwright 或 WebFetch 浏览话题页面
  3. 检查指标:关注项目星标数、最近更新时间、开放问题数量 —— 避免选择已废弃的仓库

被屏蔽内容的备用获取链

MCP Playwright(最佳) → PullPush API(Reddit) → WebFetch → WebSearch 片段 → MCP web_search include_raw_content

若 WebFetch 访问页面时返回 403 或出现 CAPTCHA:

  1. Reddit:使用 MCP Playwright 访问 old.reddit.com(始终可用,无 CAPTCHA)
  2. Reddit 搜索:通过 PullPush API api.pullpush.io 获取结构化 JSON,包含完整正文内容
  3. Product Hunt 等其他网站:使用 MCP Playwright 的 browser_navigate(多数站点无 CAPTCHA)
  4. 通用场景:结合 WebSearch 片段与 WebSearch 合成结果进行补充
F
@fortunto2

已收录 1 个 Skill

相关推荐