YouTube Thumbnail Generator with Nano Banana

基于视频内容生成高点击率的YouTube封面概念与AI图像提示。

已扫描

项目

内容

适合谁

内容创作者、YouTube运营人员

不适合谁

无API密钥配置能力者、无需自动化封面生成的用户

国内可用性

需网络配置。可能需要网络配置或第三方服务可访问。

安装难度

新手友好（★☆☆）。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

复制命令安装

openclaw skills install @luo-2q/youtube-cover-nano-banana

官方 ZIP下载官方 ZIP

Skill 说明

命令、参数、文件名以原文为准

YouTube 封面生成器：Nano Banana

概述

首先分析用户的文本内容，将其转化为一个视觉简洁、情绪明显且在小尺寸下仍可清晰阅读的封面概念。

除非用户明确要求其他语言，否则生成英文图像提示时使用 Nano Banana。确保推理基于 YouTube 封面的点击表现，而非通用海报设计。

当本地脚本执行可用时，使用 scripts/create_thumbnail.py 完成全流程。该脚本先调用 Gemini 文本生成功能，将原始文案转化为封面设计方案，随后可选地调用官方 Gemini Nano Banana 图像生成接口。脚本需要配置 GEMINI_API_KEY 或 GOOGLE_API_KEY。

工作流程

1. 提取核心信息

提取以下要素：

核心主题
目标受众
主要承诺或冲突点
情绪导向（如紧迫感、惊讶、权威、恐惧、好奇或兴奋）
最佳视觉主体
不可妥协的细节（如产品、人物、品牌色或禁止元素）

若用户仅提供原始文案，应从最强主张中推断封面角度，而非逐字复制全部文字。

2. 确定封面策略

优先选择单一核心概念。采用以下任一视觉策略：

表情丰富的面部 + 短句文字
单一物品或产品的戏剧性特写
“之前 vs 之后”的对比构图
威胁、错误或警告式呈现
留白悬念（不完整揭示）
权威或证明型框架，突出明确焦点对象

除非用户明确要求拼贴风格，否则拒绝复杂多主题组合。

3. 精简画面文字

叠加文字需满足：

尽可能控制在 2 到 6 个词
一秒内可读完
比原始文案更具冲击力
可与视频标题不同，以增强点击吸引力

禁止在图像提示中包含段落、副标题或详细列表。

4. 构建 Nano Banana 提示词

生成的提示需具备以下特征：

使用英文
16:9 的 YouTube 封面比例
一个主导主体
明显的视觉焦点
高对比度灯光与色彩分离
干净背景，仅保留辅助元素
为大号标题预留空间
仅在用户要求时使用照片级真实感或特定风格

明确描述：

主体外观与姿态
摄影构图方式
情绪状态
背景环境
色彩搭配
光照条件
文字放置区域
封面风格线索（如电影感、光泽感、创作者经济风、科技、金融、健身、教育等）

参考 [youtube-thumbnail-patterns.md](./references/youtube-thumbnail-patterns.md) 中的模板与示例，以帮助确定结构。

5. 生成图像

在概念清晰后，调用 Nano Banana 生成最终图像。

如需全自动流程，请运行：

python3 scripts/create_thumbnail.py \
  --copy "Man fights tiger" \
  --generate-image \
  --output-json "outputs/thumbnail-plan.json" \
  --image-output "outputs/generated-thumbnail.png"

该脚本功能包括：

分析原始文案
输出结构化 JSON，包含 angle、overlay_text、prompt 和 generation_notes
可选地通过 Nano Banana 渲染图像
生成可用于集成的稳定结果包

若本地脚本可用，也可直接运行：

python3 scripts/generate_image.py \
  --prompt "<final english prompt>" \
  --angle "<angle>" \
  --overlay-text "<overlay text>" \
  --output "outputs/generated-thumbnail.png"

该脚本调用 Gemini 官方 gemini-2.5-flash-image 接口，并保存：

生成的 PNG 文件
附带的 JSON 文件，包含提示词、模型信息、叠加文字及 API 返回的任何文本

若无法使用工具调用或脚本执行，仍返回完整的提示词，并附上简短说明以指导生成。

6. 自我审查一次

在最终输出前，检查常见失败模式：

主体过多
文字区域过小
对比度不足
背景过于杂乱
情绪表达模糊
缺乏明确的点击驱动力
提示词无意中描述的是海报而非封面
包含微小文字或多行文字，图像模型难以准确渲染

若发现上述问题，修改提示词一次后再返回。

输出格式

按以下顺序返回四个区块：

Angle：一句话描述封面构思
Overlay Text：封面使用的简短文字
Nano Banana Prompt：完整的英文提示词
Generation Notes：一句简短的关键指令或备选方案说明

约束条件

优化移动端点击率与可读性
优先单一主体，而非多个元素
优先强烈情绪，而非中性表情
优先简单构图，而非详尽描述
不得虚构用户未提及的名人形象、商标或品牌资产
不承诺图像模型能精确还原文字排版质量
若用户提供中文文案，可在分析阶段使用中文，但最终图像提示必须为英文
若用户未指定风格方向，默认采用现代 YouTube 封面美学：高对比度、清晰层级
若用户提及特定领域并暗示视觉风格，应在提示词中体现。例如：金融类应呈现锐利可信感；游戏类可更夸张；教育类应清晰权威

缺失信息

仅在缺失信息会显著影响输出时，提出简短追问，例如：

是否必须出现特定人物？
是否需要真实产品图片？
封面应为写实、3D、插画还是动漫风格？
是否有严格的品牌配色或禁用视觉元素？

否则，基于合理假设继续推进。

资源

scripts/

使用 [create_thumbnail.py](./scripts/create_thumbnail.py) 实现从文案到封面的端到端生成。

使用 [generate_image.py](./scripts/generate_image.py) 直接调用 Nano Banana 并保存输出文件。

references/

使用 [youtube-thumbnail-patterns.md](./references/youtube-thumbnail-patterns.md) 作为提示模板、角度选择规则，以及从原始文案到缩略图提示的示例转换参考。

使用 [publishing-contract.md](./references/publishing-contract.md) 作为调用方的集成契约，确保命令行为稳定、输出为 JSON 格式，并提供明确的退出码。

@luo-2q

已收录 1 个 Skill