Knowledge Base Skill
支持图片附件与OCR的文字提取,按业务类型管理问答知识库。
下载 719
自动抓取小红书关键词搜索结果,整合图文与评论生成分析报告。
openclaw skills install @piekill/xiaohongshu-search-summarizer命令、参数、文件名以原文为准
此技能可自动从小红书(Xiaohongshu)提取高质量的多模态内容(文字 + 图片),并主动协助您生成深度整合、分析性强的最终报告。由于小红书具有严格的反爬机制,直接发起 HTTP 请求或简单爬取通常会导致 404 错误或被封禁。本技能通过 playwright-cli 在带界面的浏览器环境中模拟真实用户行为,原生绕过这些限制。
该过程分为两个阶段:
[keyword]_raw_data.md)。[keyword]_raw_data.md 文件。playwright-cli(必须可在系统路径中访问)python3(用于下载图片并拼接原始数据 Markdown)requests Python 包(运行 pip install requests)——由 parse.py 脚本调用以下载图片执行位于 scripts/run.sh 的封装脚本。支持以下参数:
/bin/bash <skill_dir>/scripts/run.sh "YOUR KEYWORD" <MAX_POSTS> <OUTPUT_DIRECTORY>YOUR KEYWORD**:要在小红书上搜索的关键字。<MAX_POSTS>**:(可选,默认值 = 10)要扫描的顶部动态数量。<OUTPUT_DIRECTORY>**:(可选,默认值 = ./)用于保存原始数据和图片的输出目录。示例执行:
/bin/bash ~/.claude/skills/xiaohongshu-search-summarizer/scripts/run.sh "openclaw使用场景" 10 "./xhs_report_openclaw_scenarios"脚本成功运行后,请进入 OUTPUT_DIRECTORY 目录,使用您的文件读取功能,加载生成的 [keyword]_raw_data.md 文件。
该文件中包含描述、评论以及指向 post_X_img_Y.webp 或 post_X_img_Y.jpg 的文件路径。
这是最关键的一步。请勿直接将原始 Markdown 文件返回给用户。应撰写一份经过精心打磨的综合性 Markdown 报告,对信息进行逻辑重组,同时保留高度细节。
请严格遵守以下编排规则:
.webp 或 .jpg 图片文件路径使用文件读取和视觉理解能力,以准确解析其内容。<OUTPUT_DIRECTORY> 中(例如:<OUTPUT_DIRECTORY>/[keyword]_synthesis.md),并向用户提供该文件路径。若在浏览器执行过程中遇到 404 Not Found 或“元素不可见”错误:
playwright-cli 打开的浏览器窗口,并完成必要的身份验证操作,然后重新尝试运行脚本。已收录 1 个 Skill