YouTube Thumbnail Generator with Nano Banana

基于视频内容生成高点击率的YouTube封面概念与AI图像提示。

已扫描
适合谁
内容创作者、YouTube运营人员
不适合谁
无API密钥配置能力者、无需自动化封面生成的用户
国内可用性
需网络配置。可能需要网络配置或第三方服务可访问。
安装难度
新手友好(★☆☆)。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

openclaw skills install @luo-2q/youtube-cover-nano-banana

Skill 说明

命令、参数、文件名以原文为准

YouTube 封面生成器:Nano Banana

概述

首先分析用户的文本内容,将其转化为一个视觉简洁、情绪明显且在小尺寸下仍可清晰阅读的封面概念。

除非用户明确要求其他语言,否则生成英文图像提示时使用 Nano Banana。确保推理基于 YouTube 封面的点击表现,而非通用海报设计。

当本地脚本执行可用时,使用 scripts/create_thumbnail.py 完成全流程。该脚本先调用 Gemini 文本生成功能,将原始文案转化为封面设计方案,随后可选地调用官方 Gemini Nano Banana 图像生成接口。脚本需要配置 GEMINI_API_KEYGOOGLE_API_KEY

工作流程

1. 提取核心信息

提取以下要素:

  • 核心主题
  • 目标受众
  • 主要承诺或冲突点
  • 情绪导向(如紧迫感、惊讶、权威、恐惧、好奇或兴奋)
  • 最佳视觉主体
  • 不可妥协的细节(如产品、人物、品牌色或禁止元素)

若用户仅提供原始文案,应从最强主张中推断封面角度,而非逐字复制全部文字。

2. 确定封面策略

优先选择单一核心概念。采用以下任一视觉策略:

  • 表情丰富的面部 + 短句文字
  • 单一物品或产品的戏剧性特写
  • “之前 vs 之后”的对比构图
  • 威胁、错误或警告式呈现
  • 留白悬念(不完整揭示)
  • 权威或证明型框架,突出明确焦点对象

除非用户明确要求拼贴风格,否则拒绝复杂多主题组合。

3. 精简画面文字

叠加文字需满足:

  • 尽可能控制在 2 到 6 个词
  • 一秒内可读完
  • 比原始文案更具冲击力
  • 可与视频标题不同,以增强点击吸引力

禁止在图像提示中包含段落、副标题或详细列表。

4. 构建 Nano Banana 提示词

生成的提示需具备以下特征:

  • 使用英文
  • 16:9 的 YouTube 封面比例
  • 一个主导主体
  • 明显的视觉焦点
  • 高对比度灯光与色彩分离
  • 干净背景,仅保留辅助元素
  • 为大号标题预留空间
  • 仅在用户要求时使用照片级真实感或特定风格

明确描述:

  • 主体外观与姿态
  • 摄影构图方式
  • 情绪状态
  • 背景环境
  • 色彩搭配
  • 光照条件
  • 文字放置区域
  • 封面风格线索(如电影感、光泽感、创作者经济风、科技、金融、健身、教育等)

参考 [youtube-thumbnail-patterns.md](./references/youtube-thumbnail-patterns.md) 中的模板与示例,以帮助确定结构。

5. 生成图像

在概念清晰后,调用 Nano Banana 生成最终图像。

如需全自动流程,请运行:

python3 scripts/create_thumbnail.py \
  --copy "Man fights tiger" \
  --generate-image \
  --output-json "outputs/thumbnail-plan.json" \
  --image-output "outputs/generated-thumbnail.png"

该脚本功能包括:

  • 分析原始文案
  • 输出结构化 JSON,包含 angleoverlay_textpromptgeneration_notes
  • 可选地通过 Nano Banana 渲染图像
  • 生成可用于集成的稳定结果包

若本地脚本可用,也可直接运行:

python3 scripts/generate_image.py \
  --prompt "<final english prompt>" \
  --angle "<angle>" \
  --overlay-text "<overlay text>" \
  --output "outputs/generated-thumbnail.png"

该脚本调用 Gemini 官方 gemini-2.5-flash-image 接口,并保存:

  • 生成的 PNG 文件
  • 附带的 JSON 文件,包含提示词、模型信息、叠加文字及 API 返回的任何文本

若无法使用工具调用或脚本执行,仍返回完整的提示词,并附上简短说明以指导生成。

6. 自我审查一次

在最终输出前,检查常见失败模式:

  • 主体过多
  • 文字区域过小
  • 对比度不足
  • 背景过于杂乱
  • 情绪表达模糊
  • 缺乏明确的点击驱动力
  • 提示词无意中描述的是海报而非封面
  • 包含微小文字或多行文字,图像模型难以准确渲染

若发现上述问题,修改提示词一次后再返回。

输出格式

按以下顺序返回四个区块:

  1. Angle:一句话描述封面构思
  2. Overlay Text:封面使用的简短文字
  3. Nano Banana Prompt:完整的英文提示词
  4. Generation Notes:一句简短的关键指令或备选方案说明

约束条件

  • 优化移动端点击率与可读性
  • 优先单一主体,而非多个元素
  • 优先强烈情绪,而非中性表情
  • 优先简单构图,而非详尽描述
  • 不得虚构用户未提及的名人形象、商标或品牌资产
  • 不承诺图像模型能精确还原文字排版质量
  • 若用户提供中文文案,可在分析阶段使用中文,但最终图像提示必须为英文
  • 若用户未指定风格方向,默认采用现代 YouTube 封面美学:高对比度、清晰层级
  • 若用户提及特定领域并暗示视觉风格,应在提示词中体现。例如:金融类应呈现锐利可信感;游戏类可更夸张;教育类应清晰权威

缺失信息

仅在缺失信息会显著影响输出时,提出简短追问,例如:

  • 是否必须出现特定人物?
  • 是否需要真实产品图片?
  • 封面应为写实、3D、插画还是动漫风格?
  • 是否有严格的品牌配色或禁用视觉元素?

否则,基于合理假设继续推进。

资源

scripts/

使用 [create_thumbnail.py](./scripts/create_thumbnail.py) 实现从文案到封面的端到端生成。

使用 [generate_image.py](./scripts/generate_image.py) 直接调用 Nano Banana 并保存输出文件。

references/

使用 [youtube-thumbnail-patterns.md](./references/youtube-thumbnail-patterns.md) 作为提示模板、角度选择规则,以及从原始文案到缩略图提示的示例转换参考。

使用 [publishing-contract.md](./references/publishing-contract.md) 作为调用方的集成契约,确保命令行为稳定、输出为 JSON 格式,并提供明确的退出码。

L2
@luo-2q

已收录 1 个 Skill

相关推荐