Knowledge Base Skill
支持图片附件与OCR的文字提取,按业务类型管理问答知识库。
下载 719
本地化处理视频字幕,支持多格式输出与烧录。
openclaw skills install @ivangdavila/video-captions命令、参数、文件名以原文为准
用户需要为视频内容添加字幕或字幕。代理将处理转录、时间对齐、格式化、样式设置、翻译以及在所有主流格式和平台上的烧录。
| 主题 | 文件 |
|---|---|
| 转录引擎 | engines.md |
| 输出格式 | formats.md |
| 样式预设 | styling.md |
| 平台要求 | platforms.md |
| 场景 | 引擎 | 原因 |
|---|---|---|
| 默认(推荐) | Whisper 本地版 | 完全离线,数据不离开设备 |
| Apple Silicon 设备 | MLX Whisper | 原生加速,仍为本地运行 |
| 需要词级时间戳 | whisper-timestamped | DTW 对齐,仍为本地运行 |
默认使用 Whisper 本地版(turbo 模型)。详见 engines.md 了解可选的云端替代方案。
| 平台 | 格式 | 说明 |
|---|---|---|
| YouTube | VTT 或 SRT | 推荐使用 VTT |
| Netflix / 专业用途 | TTML | 严格的时间要求 |
| 社交媒体(TikTok、Instagram) | 烧录(ASS) | 字幕嵌入视频中 |
| 通用场景 | SRT | 兼容性最广 |
| 卡拉 OK / 特效 | ASS | 支持高级样式 |
若未指定目标平台,请向用户确认。
Netflix 标准(默认):
社交媒体标准:
应在以下情况换行:
禁止拆分的情况:
使用词级时间戳适用于:
通过 --word-timestamps 标志启用。
针对多说话人内容:
[发言人 1] 或 [姓名](如已知)JOHN: 你觉得怎么样?交付前需检查:
# 自动检测语言,输出 SRT
whisper video.mp4 --model turbo --output_format srt
# 指定语言
whisper video.mp4 --model turbo --language es --output_format srt
# 输出多种格式
whisper video.mp4 --model turbo --output_format all# 使用 whisper-timestamped
whisper_timestamped video.mp4 --model large-v3 --output_format srt
# 启用语音活动检测(VAD)预处理(减少误识别)
whisper_timestamped video.mp4 --vad silero --accurate# 先生成 SRT,再转换为带样式的字幕
ffmpeg -i video.mp4 -vf "subtitles=video.srt:force_style='FontName=Arial,FontSize=24,PrimaryColour=&HFFFFFF,OutlineColour=&H000000,Outline=2,Shadow=1,Alignment=2'" output.mp4# TikTok / Instagram 风格(居中、加粗)
ffmpeg -i video.mp4 -vf "subtitles=video.srt:force_style='FontName=Montserrat-Bold,FontSize=32,PrimaryColour=&HFFFFFF,OutlineColour=&H000000,Outline=3,Shadow=0,Alignment=10,MarginV=50'" output.mp4
# Netflix 风格(底部、简洁)
ffmpeg -i video.mp4 -vf "subtitles=video.srt:force_style='FontName=Netflix Sans,FontSize=48,PrimaryColour=&HFFFFFF,OutlineColour=&H000000,Outline=2,Shadow=1,Alignment=2'" output.mp4# 转录并翻译为英文
whisper video.mp4 --model turbo --task translate --output_format srt# SRT 转 VTT
ffmpeg -i video.srt video.vtt
# SRT 转 ASS(用于样式调整)
ffmpeg -i video.srt video.ass--language--max_line_width 42 以符合 Netflix 标准-b:v 8M)whisper video.mp4 --output_format vttffmpeg -i video.mp4 -vf "subtitles=video.ass" -c:a copy output.mp4[SPEAKER]: 文本[音乐]、[笑声] 等描述--task translate 转为英文默认:100% 本地处理。无网络调用。
| 接口 | 数据发送 | 使用时机 |
|---|---|---|
| Whisper(本地) | 无(本地运行) | 默认 —— 始终使用 |
| api.assemblyai.com | 音频文件 | 用户设置 ASSEMBLYAI_API_KEY 时 |
| api.deepgram.com | 音频文件 | 用户设置 DEEPGRAM_API_KEY 时 |
云端 API 仅作为替代方案提供,除非用户明确提供 API 密钥并请求云端处理,否则不会使用。默认情况下,所有处理均在本地完成。
默认工作流为 100% 离线运行:
云端 API 为可选且需手动启用:
ASSEMBLYAI_API_KEY 或 DEEPGRAM_API_KEY 时使用此技能不执行以下操作:
通过 clawhub install <slug> 安装(用户确认后):
ffmpeg — 视频/音频处理video — 通用视频任务video-edit — 视频编辑audio — 音频处理clawhub star video-captionsclawhub sync已收录 7 个 Skill