Bilibili Video Summary

自动提取B站视频的字幕、弹幕、评论与描述,生成结构化数据用于AI总结。

已扫描
适合谁
内容研究者、视频创作者
不适合谁
无网络环境用户、无法安装GPU推理工具者
国内可用性
需网络配置。可能需要网络配置或第三方服务可访问。
安装难度
中等(★★☆)。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

openclaw skills install @gkd2323c/bilibili-video-summary

Skill 说明

命令、参数、文件名以原文为准

Bilibili 视频摘要工具

从 Bilibili 视频中提取完整内容——字幕/字幕、弹幕、评论和视频描述——然后利用您自己的大模型能力生成深度摘要。无需外部 AI API(无需 OpenAI / Gemini 密钥)。

功能特性

数据来源获取方式优先级
字幕(CC Subtitles)Bilibili API最快,若可用则优先使用
音频转录whisper.cpp + Vulkan GPU无字幕时自动降级使用
视频描述yt-dlp始终获取
弹幕(滚动评论)yt-dlp解析并分析高频内容
评论Bilibili 评论 API按点赞数排序,去重,提取高赞内容

工作流程

收到 Bilibili 视频链接并要求进行摘要时,请按以下步骤操作:

步骤 1:提取全部数据

python bili-transcript.py "<video_url>"

该脚本会自动完成:

  1. 获取视频标题、上传者、时长、描述信息
  2. 尝试获取 Bilibili 字幕(最快,若存在则优先使用)
  3. 若无字幕,则降级使用 GPU 转录:下载音频 → 转换为 wav → 使用 whisper.cpp + Vulkan 进行转录
  4. 下载并分析弹幕(滚动评论)
  5. 获取视频评论,按点赞数排序

输出文件保存至 ./bili-output/ 目录:

  • transcript.txt — 完整的转录文本或字幕内容
  • danmaku.json — 包含统计数据的弹幕数据
  • comments.json — 包含高赞内容的评论数据

JSON 输出包含预览文本、弹幕摘要和精选评论。

步骤 2:阅读完整转录文本

JSON 预览内容在 2000 字符处截断。请阅读完整文件:

cat ./bili-output/transcript.txt

步骤 3:查看弹幕与评论数据

审查社区反馈信息:

cat ./bili-output/danmaku.json
cat ./bili-output/comments.json

步骤 4:撰写摘要

使用您自己的大模型能力生成全面的摘要。建议结构如下:

视频概览 — 标题、上传者、时长、转录来源(字幕 / GPU)。来自描述的关键信息(项目链接、更新说明等)。

核心内容 — 视频的主要主题。用流畅段落总结核心叙事。

关键要点 — 值得强调的重要观点、数据点或信息。

社区反馈(可选) — 弹幕与评论中的反应。若内容质量低(如垃圾信息、恶意刷屏、无实质讨论),可跳过。

  • 弹幕分析:关注重复出现的短语(社区梗、反应)、有信息量的问题、技术讨论、争议点
  • 评论分析:关注高赞观点、创作者互动、用户报告的问题、技术见解

评估(可选) — 内容质量、信息密度、显著优点或缺点

可用命令

# 仅获取视频元数据
python bili-transcript.py "<URL>" --action info

# 仅获取字幕(若可用)
python bili-transcript.py "<URL>" --action subtitle

# 强制使用 GPU 转录(跳过字幕检查)
python bili-transcript.py "<URL>" --action transcribe

# 仅获取弹幕
python bili-transcript.py "<URL>" --action danmaku

# 仅获取评论
python bili-transcript.py "<URL>" --action comments

# 自定义输出目录
python bili-transcript.py "<URL>" --output ./my-output

环境变量

变量用途
WHISPER_CPP_DIRwhisper.cpp 目录路径(包含 whisper-cli)
WHISPER_MODELwhisper 模型文件路径(例如:ggml-large-v3-turbo.bin)
BILI_OUTPUT_DIR默认输出目录(默认值:./bili-output)

性能参考

视频时长总耗时说明
5 分钟~15 秒GPU 转录速度快
12 分钟~22 秒下载 + 转换 + 转录
1 小时~2-3 分钟取决于音频密度
弹幕/评论~5-10 秒取决于评论数量

依赖项

  • Python 包:yt-dlp、av(PyAV)
  • 转录引擎:支持 Vulkan 的 whisper.cpp(可选,仅当无字幕时需要)
  • 模型文件:ggml-large-v3-turbo.bin(约 1.6GB,需单独下载)
  • GPU:任意支持 Vulkan 的显卡(NVIDIA、AMD、Intel)——自动检测
  • 不需要外部 AI API 密钥

限制说明

  • 需要网络连接访问 Bilibili
  • 部分内容需登录(付费课程、受限视频)——可能无法获取
  • 弹幕与评论接口可能存在频率限制
  • whisper.cpp 不支持 m4a 格式;脚本通过 PyAV 自动转换
  • 极长视频(超过 2 小时)转录耗时较长;建议先尝试 --action subtitle
  • 评论仅获取前 3 页(约 60 条);对于热度极高的视频,可能无法覆盖全部内容
G
@gkd2323c

已收录 1 个 Skill

相关推荐