Bilibili Auto Transcript
支持B站视频一键转录与收藏夹自动扫描,三级降级转录+AI摘要生成。
从网络源生成每日AI新闻摘要,支持自定义参数。
openclaw skills install @j3ffyang/ai-newsletter命令、参数、文件名以原文为准
从最新的网络来源生成一份简洁的每日人工智能新闻简报。
仅用于当前的人工智能/机器学习新闻、发布、研究、融资、产品上线、模型更新、监管动态、基准测试或对从业者有实际意义的发展。
不适用于常青类解释性内容、非AI主题或并非旨在成为精选新闻简报的长篇研究。
默认值:
target_news_count = 20search_query = "latest AI news today"search_time_window_days = 2max_search_results = 60min_articles_required = 10include_domains = []exclude_domains = ["youtube.com", "reddit.com", "facebook.com", "x.com", "twitter.com"]summary_model = "host-default"max_scrape_retries = 2取值范围:
target_news_count: 1..50search_time_window_days: 1..14max_search_results: 20..120min_articles_required: 1..50max_scrape_retries: 0..5若 min_articles_required > target_news_count,则将其设为 target_news_count。
max_search_results 个候选结果。target_news_count * 2 个候选进行抓取尝试。target_news_count 个已验证的条目。返回以下内容:
newsletter_items:对象列表。markdown_newsletter:字符串格式的新闻简报。json_newsletter:JSON 对象。每个条目必须包含:
title:标题url:原始链接domain:域名published_at:发布时间summary:摘要relevance_score:相关性评分(0–100)source_query:原始搜索关键词若无发布时间,使用 "unknown" 填充。
- 应用默认值与取值范围限制。
- 初始化 warnings = [],seen_canonical_urls = set(),processed_urls = set()。
- 使用 web_search 运行 search_query。
- 若无可用结果,尝试一次替代查询:
- "{search_query} generative AI LLM model open source enterprise"
- 若仍无可用结果,明确失败并终止。
- 仅保留标题和链接均非空的结果。
- 统一 URL 格式:主机部分转小写,移除追踪参数,规范化安全尾部斜杠。
- 去重:基于标准化后的 URL。
- 应用 include_domains 和 exclude_domains 筛选。
- 优先选择在 search_time_window_days 时间窗口内的结果。
- 允许未知时间,但降低其评分。
- 对每个候选项评分 0 到 100:
- AI 主题相关性:0..50
- 新鲜度:0..30
- 标题/摘要清晰度:0..20
- 排序规则:
- relevance_score 降序
- published_at 降序(未知时间排最后)
- url 升序
- 保留前 target_news_count * 2 个候选。
- 按排序顺序处理候选,直到收集到 target_news_count 个已验证条目。
- 跳过已在 processed_urls 中的标准化 URL。
- 最多尝试 max_scrape_retries + 1 次 web_fetch。
- 若抓取失败,记录警告信息(含 URL 与原因),继续处理。
- 交叉验证搜索结果与抓取页面的一致性:
- 标题相似性
- 域名一致性
- 主题匹配度
- 可用时的发布时间一致性
- 若页面内容与搜索结果存在显著不一致,跳过并发出警告。
- 生成一段纯文本摘要,长度约 80 字以内。
- 聚焦于该事件对 AI 从业者的实际意义。
- 若摘要生成失败,记录警告并继续。
- 将补充完整的信息添加至条目。
- 若收集的条目数少于 min_articles_required,执行一次备用搜索:
- "AI news today machine learning model release funding research"
- 仅处理尚未见过或未处理的新候选。
- 重复执行过滤、排序、验证与摘要流程。
- 确保每个最终条目均包含非空的 title、url、domain、summary、source_query,且 relevance_score 为数值。
- 确保每个 URL 仅出现一次。
- 确保 markdown_newsletter 与 json_newsletter 的条目数量一致。
- 移除并警告所有无效条目。
- 按 relevance_score 降序,再按 published_at 降序排序。
- 截断至 target_news_count 条。
- 渲染 markdown_newsletter。
- 组装 json_newsletter。
- 返回全部输出。
仅当满足以下条件时才接受一个条目:
- 标准化 URL 有效
- 重复项已去除
- 格式错误的 URL 被拒绝
- 搜索标题与抓取标题大致匹配
- 摘要与页面内容描述同一事件
- 无关页面被拒绝
- 有效发布时间优先
- 仅当其他信息较强时允许使用未知时间
- 格式错误或不可能的时间被拒绝
- 抓取内容须实质性围绕同一 AI 新闻事件
- 内容截断或损坏的页面被拒绝
- 记录每次失败的 URL 及原因
- 记录是否使用了备用搜索
markdown_newsletter 必须使用以下结构:
示例:
摘要段落。
来源:[链接](url)
仅在需要时包含此部分。
仅在以下情况强制失败:
软失败并继续处理的情况包括:
published_at当结果数量介于 min_articles_required 与 target_news_count 之间时,允许部分成功。
始终提供可操作的警告信息,包含 URL、简要原因,以及是否使用了备用搜索。
json_newsletter 必须包含:
datequerycountarticleswarnings已收录 8 个 Skill