小红书舆情爬虫
爬取小红书笔记与评论,支持关键词搜索及基础舆情分析。
下载 38
支持小红书、抖音等多平台公开信息采集,可命令行或WebUI操作,结果导出多种格式。
openclaw skills install @excalibur9527/mediacrawler-skill命令、参数、文件名以原文为准
基于 [MediaCrawler](https://github.com/NanmiCoder/MediaCrawler.git) 的多平台公开信息采集工具。
bash scripts/setup.shcd "$PROJECT_PATH"
uv run main.py --helpuv run main.py --platform xhs --lt qrcode --type search --keywords "护肤" --headless falseuv run main.py --platform dy --lt qrcode --type search --keywords "护肤" --headless falseuv run main.py --platform xhs --lt qrcode --type detail --specified_id "帖子ID1,帖子ID2"uv run main.py --platform xhs --lt qrcode --type creator --creator_id "创作者ID1"uv run uvicorn api.main:app --port 8080 --reload启动后访问:
http://127.0.0.1:8080根据 config/base_config.py 中:
SAVE_DATA_OPTION = "jsonl"
SAVE_DATA_PATH = ""默认结果保存到:
data/{平台}/{存储格式}/例如抖音 JSONL:
data/douyin/jsonl/search_contents_YYYY-MM-DD.jsonl
data/douyin/jsonl/search_comments_YYYY-MM-DD.jsonl
data/douyin/jsonl/search_creators_YYYY-MM-DD.jsonl例如小红书 JSONL:
data/xiaohongshu/jsonl/search_contents_YYYY-MM-DD.jsonl
data/xiaohongshu/jsonl/search_comments_YYYY-MM-DD.jsonl如果你设置了:
--save_data_path "/your/custom/path"则结果会写入你指定的目录。
bash scripts/show_results.sh该脚本会列出当前项目下 data/ 目录中的结果文件。
已收录 1 个 Skill