AI Image Generation

支持多平台AI图像生成,通过提示词优化与模型选择提升创作效率。

已扫描
适合谁
设计师与创意工作者、内容创作者与自媒体运营者
不适合谁
无网络环境的离线用户、对API调用敏感的隐私优先用户
国内可用性
需网络配置。可能需要网络配置或第三方服务可访问。
安装难度
新手友好(★☆☆)。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

openclaw skills install @ivangdavila/image-generation

Skill 说明

命令、参数、文件名以原文为准

设置

首次使用时,请阅读 setup.md

何时使用

用户需要生成AI视觉内容、图像编辑或保持一致性的图像集。

使用此技能可帮助选择合适的模型、撰写更有效的提示词,并避免使用过时的模型。

架构

用户偏好信息会持久化保存在 ~/image-generation/ 目录中。请参考 memory-template.md 进行配置。

~/image-generation/
├── memory.md      # 偏好的服务提供商、项目上下文、成功提示配方
└── history.md     # 可选的生成日志

快速参考

主题文件
初始设置setup.md
记忆模板memory-template.md
迁移指南migration.md
基准快照benchmarks-2026.md
提示词技巧prompting.md
API 处理模式api-patterns.md
GPT 图像(OpenAI)gpt-image.md
Gemini 与 Imagen(Google)gemini.md
FLUX(Black Forest Labs)flux.md
Midjourneymidjourney.md
Leonardoleonardo.md
Ideogramideogram.md
Replicatereplicate.md
Stable Diffusionstable-diffusion.md

核心规则

1. 先将别名解析为官方模型 ID

社区使用的名称变化迅速。调用 API 前,应将昵称映射到服务商的正式模型 ID。

社区标签首选的官方模型 ID说明
Nano Bananagemini-2.5-flash-image-preview常见昵称,非 Google 官方模型 ID
Nano Banana 2 / Pro查阅服务商文档确认通常是服务商预设配置,而非 Gemini 图像模型
GPT Image 1.5gpt-image-1.5当前 OpenAI 高阶图像模型
GPT Image mini / iMinigpt-image-1-miniOpenAI 的低成本/快速版本
FLUX 2 Pro / Maxflux-pro / flux-ultra多数平台对这些 SKU 的重命名

2. 按任务选择模型,而非追逐热度

任务首选模型备用方案
图像中精确呈现文字gpt-image-1.5Ideogram
多轮编辑gemini-2.5-flash-image-previewflux-kontext-pro
写实风格主图imagen-4.0-ultra-generate-001flux-ultra
快速低成本草稿gpt-image-1-miniimagen-4.0-fast-generate-001
角色/产品一致性flux-kontext-max使用参考图的 gpt-image-1.5
本地无 API 工作流flux-schnellSDXL

3. 将基准表视为时间点快照

基准测试结果每周可能变化。benchmarks-2026.md 可作为起点,但在质量要求高时需重新核对当前排名。

4. 先低价草稿,再高价精修

先生成 1–4 个低成本草稿,选定一个后,仅对优选项进行放大或重渲染。

5. 保持降级备选链路

若首选模型不可用,按以下顺序降级:

1) 同一服务商的低阶模型

2) 跨服务商等效模型

3) 本地或开源模型

6. 将 DALL-E 视为旧版技术

OpenAI 已将 DALL-E 2/3 标记为旧版。新项目不应默认使用它们。

常见陷阱

  • 将厂商昵称直接当作模型 ID 使用 → 导致 API 错误和无效重试
  • 认为“Nano Banana Pro”或“FLUX 2”是通用模型 ID → 造成服务商不匹配
  • 沿用旧版 DALL-E 的提示习惯 → 输出质量低于现代 GPT/Gemini 图像模型
  • 将文本生成与图像编辑的评分混为一谈 → 评估偏差
  • 对每个草稿都使用最高质量参数 → 成本飙升但质量无提升

安全与隐私

离开你设备的数据:

  • 提示词文本
  • 编辑或风格匹配时的参考图像

保留在本地的数据:

  • ~/image-generation/memory.md 中的提供商偏好
  • 可选的本地历史文件

此技能不会:

  • 存储 API 密钥
  • 将文件上传至所选服务商请求之外的任何地方
  • 保存生成的图像,除非用户主动要求保留

外部接口

服务商接口地址发送数据用途
OpenAIapi.openai.com提示词文本,可选输入图像GPT 图像生成/编辑
Google Gemini APIgenerativelanguage.googleapis.com提示词文本,可选输入图像Gemini 图像生成/编辑
Google Vertex AIaiplatform.googleapis.com提示词文本,可选输入图像Imagen 4 生成
Black Forest Labsapi.bfl.ai提示词文本,可选输入图像FLUX 生成/编辑
Replicateapi.replicate.com提示词文本,可选输入图像第三方托管图像模型
Midjourneydiscord.com提示词文本通过 Discord 工作流生成 Midjourney 图像
Leonardocloud.leonardo.ai提示词文本,可选输入图像Leonardo 生成/编辑
Ideogramapi.ideogram.ai提示词文本侧重文字排版的图像生成

其他数据不会发送至外部。

迁移

升级至新版本前,请阅读 migration.md,以确保本地记忆结构正确更新。

信任声明

此技能可能会将提示词和参考图像发送给第三方 AI 服务商。

仅在您信任这些服务商处理您的内容的前提下安装。

相关技能

可通过 clawhub install <slug> 安装,前提是用户确认:

  • image-edit - 专用于修复、扩展及遮罩工作流
  • video-generation - 将图像概念转化为视频流程
  • colors - 为视觉资产构建统一配色方案
  • ffmpeg - 对图像序列和导出文件进行后期处理

反馈

  • 若有帮助:clawhub star image-generation
  • 保持更新:clawhub sync
I
@ivangdavila

已收录 10 个 Skill

相关推荐