Zhihu Keyword Content Search

根据关键词抓取知乎问题与回答,支持排序和多格式导出。

已扫描
适合谁
内容创作者、数据分析人员
不适合谁
无网络访问权限的用户、无法获取知乎登录Cookie的用户
国内可用性
需网络配置。可能需要网络配置或第三方服务可访问。
安装难度
新手友好(★☆☆)。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

openclaw skills install @taiyuexiao/zhihu-keyword-content-search

Skill 说明

命令、参数、文件名以原文为准

知乎爬虫 Skill

环境要求

  • Python 3.7+(pythonpython3 命令)
  • 依赖:pip install requests

工作流程

  1. 识别关键词:从用户请求中提取要搜索的关键词
  2. 获取 Cookie:若用户未提供,告知获取方式(见下方)
  3. 执行脚本:运行 zhihu_crawl.py,监控进度
  4. 汇报结果:问题数、回答数、输出目录

浏览器打开 zhihu.com 登录 → F12 → Network → 任意请求 → Request Headers → 复制 cookie: 后的完整值

执行命令

python zhihu_crawl.py \
  --cookie "用户的Cookie" \
  --keywords "关键词1" "关键词2" \
  --top 100 \
  --output ./zhihu_output

Windows PowerShell:

python zhihu_crawl.py `
  --cookie "用户的Cookie" `
  --keywords "关键词1" "关键词2" `
  --top 100 `
  --output ./zhihu_output

Windows 上若提示 SSL 错误,在命令前加:

$env:PATH = "C:\python\anaconda\Library\bin;" + $env:PATH

参数

参数必填默认值说明
--cookie知乎登录 Cookie
--keywordsMyGO Ave Mujica 丰川祥子搜索词,多个用空格分隔,含空格的词用引号
--top100取回答数最多的前 N 个问题
--outputzhihu_output输出目录路径
--search-max200每个关键词最多搜索多少候选

输出文件

output/
├── question_{id}.json     # 每道题的完整数据(含全部回答)
├── _question_list.json    # 问题列表(按回答数降序)
└── _merged_all.txt        # 所有内容合并纯文本(可直接喂给 AI 分析)

常见错误

错误原因解决
SSL module not availableAnaconda PATH 未配置设置 $env:PATH = "C:\python\anaconda\Library\bin;" + $env:PATH
ModuleNotFoundError: requests未安装依赖pip install requestspip install --user requests
HTTP 403Cookie 失效重新从浏览器复制 Cookie
找到 0 个问题Cookie 失效或关键词无结果检查 Cookie 是否完整有效

使用示例

抓取单主题:

python zhihu_crawl.py --cookie "abc..." --keywords "高松灯" --top 50 --output ./output_灯

抓取多主题,取 TOP 200:

python zhihu_crawl.py --cookie "abc..." --keywords "MyGO" "Ave Mujica" "丰川祥子" --top 200
T
@taiyuexiao

已收录 1 个 Skill

相关推荐