AI Image Generation

支持多平台AI图像生成，通过提示词优化与模型选择提升创作效率。

已扫描

项目

内容

适合谁

设计师与创意工作者、内容创作者与自媒体运营者

不适合谁

无网络环境的离线用户、对API调用敏感的隐私优先用户

国内可用性

需网络配置。可能需要网络配置或第三方服务可访问。

安装难度

新手友好（★☆☆）。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

复制命令安装

openclaw skills install @ivangdavila/image-generation

官方 ZIP下载官方 ZIP

Skill 说明

命令、参数、文件名以原文为准

设置

首次使用时，请阅读 setup.md。

何时使用

用户需要生成AI视觉内容、图像编辑或保持一致性的图像集。

使用此技能可帮助选择合适的模型、撰写更有效的提示词，并避免使用过时的模型。

架构

用户偏好信息会持久化保存在 ~/image-generation/ 目录中。请参考 memory-template.md 进行配置。

~/image-generation/
├── memory.md      # 偏好的服务提供商、项目上下文、成功提示配方
└── history.md     # 可选的生成日志

快速参考

主题	文件
初始设置	`setup.md`
记忆模板	`memory-template.md`
迁移指南	`migration.md`
基准快照	`benchmarks-2026.md`
提示词技巧	`prompting.md`
API 处理模式	`api-patterns.md`
GPT 图像（OpenAI）	`gpt-image.md`
Gemini 与 Imagen（Google）	`gemini.md`
FLUX（Black Forest Labs）	`flux.md`
Midjourney	`midjourney.md`
Leonardo	`leonardo.md`
Ideogram	`ideogram.md`
Replicate	`replicate.md`
Stable Diffusion	`stable-diffusion.md`

核心规则

1. 先将别名解析为官方模型 ID

社区使用的名称变化迅速。调用 API 前，应将昵称映射到服务商的正式模型 ID。

社区标签	首选的官方模型 ID	说明
Nano Banana	`gemini-2.5-flash-image-preview`	常见昵称，非 Google 官方模型 ID
Nano Banana 2 / Pro	查阅服务商文档确认	通常是服务商预设配置，而非 Gemini 图像模型
GPT Image 1.5	`gpt-image-1.5`	当前 OpenAI 高阶图像模型
GPT Image mini / iMini	`gpt-image-1-mini`	OpenAI 的低成本/快速版本
FLUX 2 Pro / Max	`flux-pro` / `flux-ultra`	多数平台对这些 SKU 的重命名

2. 按任务选择模型，而非追逐热度

任务	首选模型	备用方案
图像中精确呈现文字	`gpt-image-1.5`	Ideogram
多轮编辑	`gemini-2.5-flash-image-preview`	`flux-kontext-pro`
写实风格主图	`imagen-4.0-ultra-generate-001`	`flux-ultra`
快速低成本草稿	`gpt-image-1-mini`	`imagen-4.0-fast-generate-001`
角色/产品一致性	`flux-kontext-max`	使用参考图的 `gpt-image-1.5`
本地无 API 工作流	`flux-schnell`	SDXL

3. 将基准表视为时间点快照

基准测试结果每周可能变化。benchmarks-2026.md 可作为起点，但在质量要求高时需重新核对当前排名。

4. 先低价草稿，再高价精修

先生成 1–4 个低成本草稿，选定一个后，仅对优选项进行放大或重渲染。

5. 保持降级备选链路

若首选模型不可用，按以下顺序降级：

1) 同一服务商的低阶模型

2) 跨服务商等效模型

3) 本地或开源模型

6. 将 DALL-E 视为旧版技术

OpenAI 已将 DALL-E 2/3 标记为旧版。新项目不应默认使用它们。

常见陷阱

将厂商昵称直接当作模型 ID 使用 → 导致 API 错误和无效重试
认为“Nano Banana Pro”或“FLUX 2”是通用模型 ID → 造成服务商不匹配
沿用旧版 DALL-E 的提示习惯 → 输出质量低于现代 GPT/Gemini 图像模型
将文本生成与图像编辑的评分混为一谈 → 评估偏差
对每个草稿都使用最高质量参数 → 成本飙升但质量无提升

安全与隐私

离开你设备的数据：

提示词文本
编辑或风格匹配时的参考图像

保留在本地的数据：

~/image-generation/memory.md 中的提供商偏好
可选的本地历史文件

此技能不会：

存储 API 密钥
将文件上传至所选服务商请求之外的任何地方
保存生成的图像，除非用户主动要求保留

外部接口

服务商	接口地址	发送数据	用途
OpenAI	`api.openai.com`	提示词文本，可选输入图像	GPT 图像生成/编辑
Google Gemini API	`generativelanguage.googleapis.com`	提示词文本，可选输入图像	Gemini 图像生成/编辑
Google Vertex AI	`aiplatform.googleapis.com`	提示词文本，可选输入图像	Imagen 4 生成
Black Forest Labs	`api.bfl.ai`	提示词文本，可选输入图像	FLUX 生成/编辑
Replicate	`api.replicate.com`	提示词文本，可选输入图像	第三方托管图像模型
Midjourney	`discord.com`	提示词文本	通过 Discord 工作流生成 Midjourney 图像
Leonardo	`cloud.leonardo.ai`	提示词文本，可选输入图像	Leonardo 生成/编辑
Ideogram	`api.ideogram.ai`	提示词文本	侧重文字排版的图像生成

其他数据不会发送至外部。

迁移

升级至新版本前，请阅读 migration.md，以确保本地记忆结构正确更新。

信任声明

此技能可能会将提示词和参考图像发送给第三方 AI 服务商。

仅在您信任这些服务商处理您的内容的前提下安装。

反馈

若有帮助：clawhub star image-generation
保持更新：clawhub sync

@ivangdavila

已收录 10 个 Skill