X News Crawler

通过本地CLI抓取X平台关键词搜索结果,生成结构化新闻数据。

已扫描
适合谁
需要监控社交媒体热点的运营人员、从事信息调研或新闻摘要的研究者
不适合谁
无技术基础的普通用户、希望一键完成且不接受配置的用户
国内可用性
需网络配置。可能需要网络配置或第三方服务可访问。
安装难度
新手友好(★☆☆)。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

openclaw skills install @leeguooooo/x-news-crawler

Skill 说明

命令、参数、文件名以原文为准

X 新闻爬取器

使用此技能,运行一条命令即可获取结构化的 X 新闻 JSON 数据。

前置条件(必需)

在执行任何爬取命令前,请先运行:

pnpm add -g agent-browser-stealth
pnpm approve-builds -g

在爬取前,使用 CDP 启动 Chrome 浏览器并使用默认配置文件:

/Applications/Google\ Chrome.app/Contents/MacOS/Google\ Chrome --remote-debugging-port=9333

请勿在该 Chrome 启动命令中使用 --user-data-dir 参数。

工作流程

  1. 使用 CLI 命令,而非直接调用 abs 命令。
  2. 默认使用 --mode hybrid:先获取 top 内容,再获取 latest 内容,最后按时间排序并去重。
  3. 读取返回的 JSON 输出,并向用户总结信号与噪声的比例。

命令示例

从项目根目录运行:

./bin/x-news-crawler --query "openclaw" --mode hybrid --since-hours 72 --limit 30 --output .tmp/openclaw-news.json

快速探测命令:

./bin/x-news-crawler --query "openclaw" --mode top --limit 10
./bin/x-news-crawler --query "openclaw" --mode latest --since-hours 24 --limit 20
./bin/x-news-crawler --query "openclaw" --cdp 9333 --limit 20

输出规范

CLI 返回的 JSON 包含以下字段:

  • fetched_at
  • query
  • mode
  • count
  • warnings[]
  • failed_sources[]
  • rows[],其中包含:sourcedatetimestatus_urlusertextrepliesrepostslikes

安全约束

  • 除非用户明确要求仅使用 toplatest,否则优先选择 hybrid 模式。
  • since-hours 保持在较小范围(24–168 小时),以避免获取过时内容。
  • 即使互动量高,也应将未经验证的传闻类帖子视为低置信度内容。

参考资料

完整参数说明请参见 [cli.md](references/cli.md)。

L
@leeguooooo

已收录 2 个 Skill

相关推荐