🎨 AI Image Generation — Pro Pack on RunComfy

基于 RunComfy CLI 的多模型 AI 图像生成与编辑技能，支持文本/图像生成及精准调优。

已扫描

项目

内容

适合谁

设计师与创意工作者、内容创作者与营销人员

不适合谁

无本地 CLI 使用经验者、无法访问外部 API 或网络环境者

国内可用性

需网络配置。可能需要网络配置或第三方服务可访问。

安装难度

新手友好（★☆☆）。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

复制命令安装

openclaw skills install @kalvinrv/ai-image-generation-runcomfy

官方 ZIP下载官方 ZIP

Skill 说明

命令、参数、文件名以原文为准

🎨 AI 图像生成 — RunComfy Pro 套件

在 RunComfy 上进行 AI 图像生成。 通过 [RunComfy](https://www.runcomfy.com/?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) CLI 使用 11+ 种 AI 模型生成和编辑图像 — 支持文生图与图生图，一次认证，一条命令。本 RunComfy 图像生成技能可根据用户意图自动选择合适模型，并提供已记录的提示词模式及每种模型对应的精确 runcomfy run 调用方式。

[runcomfy.com](https://www.runcomfy.com/?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [浏览所有模型](https://www.runcomfy.com/models?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [CLI 文档](https://docs.runcomfy.com/cli/introduction?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

由 RunComfy CLI 驱动

# 1. 安装（任选其一 — 详情见 runcomfy-cli 技能）
npm i -g @runcomfy/cli                              # 全局安装
npx -y @runcomfy/cli --version                      # 零安装

# 2. 登录（交互式 — 会打开浏览器）
runcomfy login
# 或在 CI / 容器环境中使用：
export RUNCOMFY_TOKEN=<从 runcomfy.com/profile 获取的 token>

# 3. 生成图像
runcomfy run <vendor>/<model>/<endpoint> \
  --input '{"prompt": "..."}' \
  --output-dir ./out

CLI 文档：[安装](https://docs.runcomfy.com/cli/install?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [快速入门](https://docs.runcomfy.com/cli/quickstart?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [命令](https://docs.runcomfy.com/cli/commands?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [认证](https://docs.runcomfy.com/cli/auth?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [故障排查](https://docs.runcomfy.com/cli/troubleshooting?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

根据用户意图选择合适的模型

文生图（t2i）—— 按最新版本排序

FLUX 2 Klein 9B — blackforestlabs/flux-2-klein/9b/text-to-image *(默认)*

经过步数优化，4–25 步完成，支持原生多参考条件输入，兼具高保真写实与插画风格表现力。
推荐场景：意图不明确、快速迭代、多参考风格化、通用用途。
不推荐场景：图像中包含文字内容 —— 请改用 GPT Image 2。

FLUX 2 Klein 4B — blackforestlabs/flux-2-klein/4b/text-to-image

Klein 9B 的亚秒级变体，保持相同功能集。
推荐场景：分镜草图、情绪板、高速批量概念设计。
不推荐场景：最终交付成品 —— 相较于 9B 存在轻微画质下降。

FLUX 2 Pro / Dev / Flash / Turbo / Max — blackforestlabs/flux-2/max，[flux-2-dev](https://www.runcomfy.com/models/blackforestlabs/flux-2-dev/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)，[flux-2-flash](https://www.runcomfy.com/models/blackforestlabs/flux-2-flash?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)，[flux-2-turbo](https://www.runcomfy.com/models/blackforestlabs/flux-2-turbo?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

FLUX 2 基础模型的更高保真度版本，适用于电影级视觉与品牌创作、主视觉画面。
推荐场景：追求高质量成品、品牌宣传项目。
不推荐场景：需要亚秒级响应速度 —— 请改用 Klein 4B。

Nano Banana Pro — [google/nano-banana-pro/text-to-image](https://www.runcomfy.com/models/google/nano-banana-pro/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

最高保真度的 Nano Banana 系列模型。基于 Gemini 构建，支持可选网页搜索以获取真实世界参考（如产品、地标）。
推荐场景：对指令遵循要求高的 Nano Banana 风格创作，且需更高画质。
不推荐场景：成本敏感的快速迭代 —— 可降级至 Nano Banana 2。

Nano Banana 2 — google/nano-banana-2/text-to-image

闪电级延迟响应，构图稳定，支持 enable_web_search 标志以实现真实产品或真实人物的精准定位。
推荐场景：快速迭代、四图并列批量生成、含真实世界参照的提示词。
不推荐场景：复杂组合指令 —— 请改用 GPT Image 2。

GPT Image 2 — openai/gpt-image-2/text-to-image

在图像内文字渲染方面表现最佳（日文假名、西里尔字母、阿拉伯语等）。具备精确的布局理解与指令遵循能力。
推荐场景：海报、广告、多行文案、多语言创意内容、精确文本标题。
不推荐场景：高保真人像 —— Seedream 5 在肤色与光照表现上更优。

Seedream 5 Lite — [bytedance/seedream-5/lite/text-to-image](https://www.runcomfy.com/models/bytedance/seedream-5/lite/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

字节跳动最新一代 Seedream 模型。具备高保真人像肤色、自然光影效果，强东方美学风格。
推荐场景：高保真人像、产品摄影、时尚与生活方式类内容。
不推荐场景：对文字排版精度要求高 —— 请改用 GPT Image 2。

Seedream 4-5 — [bytedance/seedream-4-5/text-to-image](https://www.runcomfy.com/models/bytedance/seedream-4-5/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

之前的 Seedream 主力型号，仍具备出色的写实表现力。
推荐场景：在 Seedream-5 生成批次之间保持形象一致性；作为性价比更高的 Seedream 替代方案。
不推荐场景：新项目创作 —— 建议优先使用 Seedream 5 Lite。

Dreamina 4-0 — [bytedance/dreamina-4-0/text-to-image](https://www.runcomfy.com/models/bytedance/dreamina-4-0/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

字节跳动偏向插画与概念艺术的风格化模型，擅长角色设计与绘画感资产生成。
推荐场景：概念艺术、插画英雄角色、绘画风格素材。
不推荐场景：写实风格图像 —— 请改用 Seedream。

Qwen Image 2512 — [qwen/qwen-image/qwen-image-2512](https://www.runcomfy.com/models/qwen/qwen-image/qwen-image-2512?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

阿里通义最新版本，开源权重，支持 LoRA（/lora 变体）。
推荐使用场景：需要开源权重的工作流，或与 Qwen 对齐的 LoRA 体系。
不推荐使用场景：追求闭源权重的精细画质 —— 请选用 FLUX 2 或 GPT Image 2。

Wan 2-7 — [wan-ai/wan-2-7/text-to-image](https://www.runcomfy.com/models/wan-ai/wan-2-7/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)，[wan-ai/wan-2-7/pro/text-to-image](https://www.runcomfy.com/models/wan-ai/wan-2-7/pro/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

开源权重，可原生搭配 Wan 2-7 视频模型，实现统一栈工作流。
推荐使用场景：构建 Wan 生态系统管线（图像 + 视频同品牌），或有开源权重需求。
不推荐使用场景：对纯图像质量要求极高。

Z-Image Turbo — [tongyi-mai/z-image/turbo](https://www.runcomfy.com/models/tongyi-mai/z-image/turbo?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

亚秒级生成速度，开源权重，原生支持 LoRA /lora 变体。
推荐使用场景：需要快速生成且支持 LoRA 定制的开源权重工作流。
不推荐使用场景：追求闭源权重的精细画质。

图像到图像 / 编辑（i2i）—— 最新优先

Nano Banana Pro Edit — [google/nano-banana-pro/edit](https://www.runcomfy.com/models/google/nano-banana-pro/edit?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

最高画质的 Nano Banana 编辑层级。支持身份保留、多参考图输入。
推荐使用场景：高端 NB 编辑任务，需锁定人物身份的变体。
不推荐使用场景：成本敏感的迭代 —— 可降级使用 Nano Banana 2 Edit。

Nano Banana 2 Edit — google/nano-banana-2/edit *(默认 i2i)*

单次调用支持 1–20 张输入图像，默认保留身份特征，支持空间语言理解（如“右上角”、“左侧物体”）。
推荐使用场景：默认图像编辑，批量身份保留，背景替换，方向性对象增删。
不推荐使用场景：需要精确掩码区域控制 —— 请使用 image-edit 技能（Z-Image Inpaint）。

GPT Image 2 Edit — openai/gpt-image-2/edit

支持最多 10 张参考图，支持多语言图像内文本重写，布局精准重排。
推荐使用场景：多语言标题替换、多参考图组合、布局重排、跨语言翻译下保持品牌身份一致。
不推荐使用场景：基于掩码的修复 —— 请使用 image-edit 技能。

Seedream 5 Lite Edit — [bytedance/seedream-5/lite/edit](https://www.runcomfy.com/models/bytedance/seedream-5/lite/edit?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

最新的 Seedream 编辑层级，强调照片级真实感保留。
推荐使用场景：从 Seedream 文生图生成的图像进行高质量编辑（身份在成对图像间保持一致）。
不推荐使用场景：多语言文本重写。

Seedream 4-5 Edit — [bytedance/seedream-4-5/edit](https://www.runcomfy.com/models/bytedance/seedream-4-5/edit?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

旧版 Seedream 编辑模型。
推荐使用场景：在 4-5 代生成之间保持身份稳定的批量处理。
不推荐使用场景：新项目 —— 请优先选择 Seedream 5 Lite Edit。

Dreamina 4-0 Edit — [bytedance/dreamina-4-0/edit](https://www.runcomfy.com/models/bytedance/dreamina-4-0/edit?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

字节跳动插画类图像编辑模型。
推荐使用场景：编辑由 Dreamina 生成的插画作品。
不推荐使用场景：真实感强的主体图像。

Qwen Image Edit 2511 — [qwen/qwen-image/qwen-image-edit-2511](https://www.runcomfy.com/models/qwen/qwen-image/qwen-image-edit-2511?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

阿里通义开源权重编辑模型。
推荐使用场景：构建开源权重编辑工作流。
不推荐使用场景：追求闭源权重的精细画质。

Wan 2.6 i2i — [wan-ai/wan-v2.6/image-to-image](https://www.runcomfy.com/models/wan-ai/wan-v2.6/image-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

Wan 生态系统的图像到图像转换模型。
推荐使用场景：集成至 Wan 栈管线中。
不推荐使用场景：新项目 —— 属于较老版本；建议优先使用 Nano Banana 或 GPT Image 2。

FLUX Kontext Pro — blackforestlabs/flux-1-kontext/pro/edit

单参考图单指令，最高保真度（“除 X 外全部保留”）。
推荐使用场景：单图局部精准编辑（如“仅将她的雨伞改为橙色”）。
不推荐使用场景：批量处理、多参考图组合、掩码驱动的修复。

需要掩码驱动修复、可控外扩或完整编辑功能？ → 请使用 image-edit 技能。

t2i 路径 1：FLUX 2 Klein — 默认选项

模型：blackforestlabs/flux-2-klein/9b/text-to-image（默认），blackforestlabs/flux-2-klein/4b/text-to-image（亚秒级响应）

目录：[9B](https://www.runcomfy.com/models/blackforestlabs/flux-2-klein/9b/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [4B](https://www.runcomfy.com/models/blackforestlabs/flux-2-klein/4b/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

参数结构（两个版本通用）

字段	类型	必填	默认值	说明
`prompt`	string	是	—	支持约 512 个 token，更长会降低效果；建议采用“主体优先”的陈述句式
`steps`	int	否	25（9B） / 4（4B）	经过步数优化；4–8 步适合构思，约 25 步用于精修，超过 25 步收益有限
`width`	int	否	1024	常见范围 512–1536，最大总像素约 2K；宽高比上限 16:9
`height`	int	否	1024	与 width 保持一致的构图意图

同一接口支持最多 4 张参考图，用于风格迁移或引导构图。字段定义详见 [模型页面](https://www.runcomfy.com/models/blackforestlabs/flux-2-klein/9b/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)。

调用方式

精修 / 最终输出（9B）：

runcomfy run blackforestlabs/flux-2-klein/9b/text-to-image \
  --input '{
    "prompt": "一只小紫色猫坐在覆盖苔藓的石头上，金色时刻轮廓光，浅景深，照片级真实感",
    "steps": 25,
    "width": 1536,
    "height": 864
  }' \
  --output-dir ./out

亚秒级概念生成（4B）：

runcomfy run blackforestlabs/flux-2-klein/4b/text-to-image \
  --input '{"prompt": "一只小紫色猫在日落时分，照片级真实感"}' \
  --output-dir ./out

提示词编写建议

主体在前，场景在后，修饰语在最后。 例如：“一只小紫色猫……坐在苔藓石上……金色时刻，浅景深。”
步骤策略： 创意阶段使用 4–8 步，精修阶段约 25 步。不要超过 28 步——收益递减。
9B 与 4B 的选择： 默认使用 9B；仅在需要亚秒级批量概念生成时才降级到 4B。
多参考图： 支持 1–4 个参考链接；在提示词中明确描述角色关系（如 "主体来自参考图1，配色来自参考图2"）。

t2i 路径 2：GPT Image 2 — 字体与图像内文字

模型： openai/gpt-image-2/text-to-image

目录： [runcomfy.com/models/openai/gpt-image-2](https://www.runcomfy.com/models/openai/gpt-image-2/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

参数结构

字段	类型	必填	默认值	说明
`prompt`	string	是	—	图像内文字需用 `"` 精确引用
`size`	enum	否	`1024_1024`	仅支持三种尺寸：<br>`1024_1024`（1:1），<br>`1024_1536`（2:3 竖版），<br>`1536_1024`（3:2 横版）

调用示例

带精确标题的 Logo / 海报：

runcomfy run openai/gpt-image-2/text-to-image \
  --input '{
    "prompt": "极简产品海报。中心放置粗体标题，准确显示为“AURORA — Spring 2026”，白色无衬线字体，深海军蓝背景。标题下方一行小字以等宽字体显示“runs on water”。采用 3:2 布局。",
    "size": "1536_1024"
  }' \
  --output-dir ./out

多语言支持：

runcomfy run openai/gpt-image-2/text-to-image \
  --input '{
    "prompt": "日式杂志封面。竖向标题准确显示为“今日のおすすめ”，使用粗体日文假名，右对齐，搭配一位身着和服女性的写实肖像。",
    "size": "1024_1536"
  }' \
  --output-dir ./out

提示词编写建议

图像内文字必须精确引用。 如 "标志上的文字准确为 'CLOSED'" —— 若不加引号，模型会进行改写。
为非拉丁文字指定字体类型： 如 "日文假名"、"西里尔字母"、"阿拉伯语从右到左"。未指定将默认转写为罗马音。
布局语言需明确： 如 "左上角"、"居中"、"两行堆叠"、"基线对齐"。
仅支持三种尺寸。 不要传入任意宽高。

t2i 路径 3：Nano Banana 2 — 高速迭代

模型： google/nano-banana-2/text-to-image

目录： [runcomfy.com/models/google/nano-banana-2](https://www.runcomfy.com/models/google/nano-banana-2?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [nano-banana 系列模型](https://www.runcomfy.com/models/collections/nano-banana?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

参数结构

字段	类型	必填	默认值	说明
`prompt`	string	是	—	主体优先的描述
`num_images`	int	否	1	1–4，用于创意轮次时建议设为 4
`seed`	int	否	0	重复使用以保证结果可复现
`aspect_ratio`	enum	否	`auto`	可选：`auto`、`21:9`、`16:9`、`3:2`、`4:3`、`5:4`、`1:1`、`4:5`、`3:4`、`2:3`、`9:16`
`resolution`	enum	否	`1K`	可选：`0.5K`（草稿）、`1K`（默认）、`2K`（终稿）、`4K`（最高）
`output_format`	enum	否	`png`	可选：`png`、`jpeg`、`webp`
`safety_tolerance`	int	否	4	1（严格）至 6（宽松）
`enable_web_search`	bool	否	false	启用网络搜索以增强现实依据（额外成本 + 延迟）

调用示例

默认草稿：

runcomfy run google/nano-banana-2/text-to-image \
  --input '{"prompt": "一个咖啡杯放在大理石台面上，顶部俯拍，温暖的晨光"}' \
  --output-dir ./out

四图批量用于创意构思：

runcomfy run google/nano-banana-2/text-to-image \
  --input '{
    "prompt": "三张陶瓷咖啡杯的照片，置于大理石台面，温暖晨光，俯拍视角，极简风格",
    "num_images": 4,
    "aspect_ratio": "1:1",
    "resolution": "0.5K"
  }' \
  --output-dir ./out

提示词编写建议

主体优先的陈述句式。 如“一个咖啡杯放在大理石上”优于“生成一张有创意的杯子照片”。
**启用 enable_web_search: true：** 当提示词涉及真实产品、地点或人物，且外观需符合现实（如品牌标识、地标建筑）时使用。
**创意阶段使用 0.5K，最终输出才提升至 2K 及以上** —— 4K 成本约为 0.5K 的 16 倍。

t2i 路径 4：Seedream 5 / 4-5 — 照片级旗舰模型

模型： [bytedance/seedream-5/lite/text-to-image](https://www.runcomfy.com/models/bytedance/seedream-5/lite/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [bytedance/seedream-4-5/text-to-image](https://www.runcomfy.com/models/bytedance/seedream-4-5/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

合集： [seedream](https://www.runcomfy.com/models/collections/seedream?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

调用示例

runcomfy run bytedance/seedream-5/lite/text-to-image \
  --input '{"prompt": "85mm 人像，女性站在窗边，柔和自然光，浅景深，照片级真实感"}' \
  --output-dir ./out

字段结构请参考模型页面，CLI 调用时直接传递原样参数。

何时选择 Seedream

照片级人像 / 产品图 —— 皮肤色调和自然光照表现更真实
东亚美学 / 时尚题材 —— 在此类主题上有较强表现力
电影级构图 —— 对镜头语言和光影描述理解良好
与 FLUX 2 对比： Seedream 更偏向照片级真实；FLUX 2 更偏向设计与插画风格

t2i 路由 5：开放权重与特色模型

适用于需要开放权重 / LoRA 支持，或追求不同美学风格的工作流：

模型	端点	适用场景
[`wan-ai/wan-2-7/text-to-image`](https://www.runcomfy.com/models/wan-ai/wan-2-7/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)	`wan-ai/wan-2-7/text-to-image`	Wan 生态系统；可搭配 Wan 2-7 视频模型使用
[`wan-ai/wan-2-7/pro/text-to-image`](https://www.runcomfy.com/models/wan-ai/wan-2-7/pro/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)	`wan-ai/wan-2-7/pro/text-to-image`	Wan Pro 套餐
[`tongyi-mai/z-image/turbo`](https://www.runcomfy.com/models/tongyi-mai/z-image/turbo?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)	`tongyi-mai/z-image/turbo`	亚秒级响应，通过 `/lora` 端点支持 LoRA
[`qwen/qwen-image/qwen-image-2512`](https://www.runcomfy.com/models/qwen/qwen-image/qwen-image-2512?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)	`qwen/qwen-image/qwen-image-2512`	Qwen Image，开放权重，也提供 `/lora` 变体
[`bytedance/dreamina-4-0/text-to-image`](https://www.runcomfy.com/models/bytedance/dreamina-4-0/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)	`bytedance/dreamina-4-0/text-to-image`	偏向插画 / 概念艺术风格

各模型页面提供完整 schema —— 可直接将字段集通过 CLI 原样传递。

i2i — 图像到图像 / 编辑（紧凑版）

适用于单次编辑任务。如需完整编辑功能（掩码驱动的修复、批量编辑、所有附加 schema），请使用专用的 image-edit skill。

i2i 路由 A：Nano Banana 2 编辑 — 默认选项

runcomfy run google/nano-banana-2/edit \
  --input '{
    "prompt": "保持主体身份、姿势和服装不变。将背景改为雨夜霓虹赛博朋克街道。",
    "image_urls": ["https://.../portrait.jpg"]
  }' \
  --output-dir ./out

Schema：prompt，image_urls（1–20 个），number_of_images（1–4），aspect_ratio（默认为 auto），resolution，output_format，seed，enable_web_search。提示词应以保留目标开头，以修改内容结尾。

i2i 路由 B：GPT Image 2 编辑 — 多语言 + 多参考

runcomfy run openai/gpt-image-2/edit \
  --input '{
    "prompt": "保持照片和布局与输入完全一致。仅将标题替换为「今日のおすすめ」，使用粗体日文假名。",
    "images": ["https://.../poster-en.jpg"],
    "size": "auto"
  }' \
  --output-dir ./out

Schema：prompt，images（最多 10 个 HTTPS 链接；第 1 张为主图），size（auto / 1024_1024 / 1024_1536 / 1536_1024）。size: "auto" 会保留原始比例。

i2i 路由 C：FLUX Kontext Pro — 单次精准编辑

runcomfy run blackforestlabs/flux-1-kontext/pro/edit \
  --input '{
    "prompt": "保持人物面部、姿势和服装不变。在她左手添加一把橙色雨伞，并加上轻微微笑。",
    "image": "https://.../portrait.jpg"
  }' \
  --output-dir ./out

Schema：prompt，image（仅支持单个 URL，不接受数组），aspect_ratio，seed。每次调用仅包含一个明确指令；复合编辑建议分多轮迭代完成。

其他可用的 i2i 端点

同品牌 t2i → i2i 配对支持生成后无缝精修，无需切换品牌：

品牌	t2i 端点	i2i / 编辑端点
Seedream 5 Lite	`bytedance/seedream-5/lite/text-to-image`	`bytedance/seedream-5/lite/edit`
Seedream 4-5	`bytedance/seedream-4-5/text-to-image`	`bytedance/seedream-4-5/edit`
Dreamina 4-0	`bytedance/dreamina-4-0/text-to-image`	`bytedance/dreamina-4-0/edit`
Nano Banana Pro	`google/nano-banana-pro/text-to-image`	`google/nano-banana-pro/edit`
Qwen Image	`qwen/qwen-image/qwen-image-2512`	`qwen/qwen-image/qwen-image-edit-2511`
Wan 2-7 / 2.6	`wan-ai/wan-2-7/text-to-image`	`wan-ai/wan-v2.6/image-to-image`

如需查看“最佳图像编辑模型”的完整推荐列表，并了解各模型的对比能力说明，请访问 [best-image-editing-models 收藏集](https://www.runcomfy.com/models/collections/best-image-editing-models?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)。

常见使用模式

品牌宣传海报

标题必须精确显示为 X → 使用路由 2（GPT Image 2），size: "1536_1024" 用于横版布局
使用格式："标题准确显示为 '…'，字体粗细为 [font weight]，字体族为 [font family]"

写实人像

路由 4（Seedream 5 Lite） 适合肤色表现；或 路由 1（FLUX 2 Klein 9B） 配合 steps: 25 及明确的镜头/光影描述

故事板帧批量生成（10+ 个概念）

路由 1（FLUX 2 Klein 4B），steps: 6，每角色固定 seed 以降低形象漂移

多语言发布创意（相同布局，多种语言）

路由 2（GPT Image 2），每种语言调用一次，布局描述保持一致，仅替换引号内的标题文本

概念情绪板（快速生成 10 个变体）

路由 3（Nano Banana 2），resolution: "0.5K"，num_images: 4，通过调整 seed 实现多样性

生成后精修（同一品牌内）

路由 4（Seedream 5 Lite t2i） → Seedream 5 Lite edit，用于后续微调。两者保持形象一致性

带有固定品牌配色的 Logo

路由 2（GPT Image 2） 用于标题处理，若颜色十六进制值不精确，可再通过 Nano Banana 2 Edit（i2i 路由 A） 进行色彩校正

浏览完整模型目录

本技能覆盖高流量模型。完整 RunComfy 图像模型目录按使用场景分类：

[所有图像模型](https://www.runcomfy.com/models?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) — 每个端点均提供 API Schema 选项卡
[nano-banana 系列](https://www.runcomfy.com/models/collections/nano-banana?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)
[seedream 系列](https://www.runcomfy.com/models/collections/seedream?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)
[flux-kontext 系列](https://www.runcomfy.com/models/collections/flux-kontext?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)
[qwen-image 系列](https://www.runcomfy.com/models/collections/qwen-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)
[dreamina 系列](https://www.runcomfy.com/models/collections/dreamina?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)
[最佳图像编辑模型 系列](https://www.runcomfy.com/models/collections/best-image-editing-models?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)
[最近新增 系列](https://www.runcomfy.com/models/collections/recently-added?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) — 最新上线模型

每个模型页面均包含一个 API 选项卡，展示完整的 JSON Schema；可通过 CLI 原样传递字段集。

退出码

代码	含义
0	成功
64	CLI 参数错误
65	输入 JSON 错误或字段不匹配
69	上游服务返回 5xx 错误
75	可重试错误：超时或 429 请求过多
77	未登录或令牌被拒绝

完整参考：[docs.runcomfy.com/cli/troubleshooting](https://docs.runcomfy.com/cli/troubleshooting?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)。

工作原理

该技能将用户请求分类为文本生成图像（t2i）或图像编辑（i2i）路径之一，并调用 runcomfy run <model_id> 命令，传入对应的 JSON 请求体。CLI 将请求发送至 RunComfy 模型 API，轮询任务状态，获取结果，并将所有 .runcomfy.net / .runcomfy.com 的链接下载至 --output-dir 指定目录。按 Ctrl-C 可在退出前取消远程请求。

安全与隐私

仅通过已验证的包管理器安装。本技能建议操作者使用 npm i -g @runcomfy/cli 或 npx -y @runcomfy/cli 安装 CLI。代理不得以任意远程脚本直接注入 shell 执行——若操作者希望使用 docs.runcomfy.com/cli/install 中提供的 curl 安装方式，应先自行审查脚本内容。
令牌存储：runcomfy login 命令将 API 令牌写入 ~/.config/runcomfy/token.json，文件权限设为 0600。在 CI / 容器环境中可使用 RUNCOMFY_TOKEN 环境变量绕过文件读取。切勿在命令行中输出令牌、记录日志或提交到版本控制。
输入边界（Shell 注入风险）：提示词通过 --input 以 JSON 字符串形式传递。CLI 不对提示内容进行 shell 展开，而是直接通过 HTTPS 将 JSON 请求体发送至模型 API。提示内容不会造成 Shell 注入风险，即使包含反引号、引号或 $(...) 表达式。
间接提示注入（第三方内容风险）：参考图像 URL 和 enable_web_search 返回的结果属于不可信来源。这些内容由 RunComfy 模型服务器获取，可能通过嵌入指令（如图像中的文字、EXIF 元数据、网络引导控制）影响生成结果。建议采取以下缓解措施：

- 仅接收用户明确提供的 URL 作为本次任务输入。

- 若生成结果偏离提示，应怀疑参考资源的影响，而非提示本身。

- 默认关闭 enable_web_search；仅在用户明确要求获取现实世界信息时才启用。

出站连接（白名单限制）：仅允许访问 model-api.runcomfy.net 以及 *.runcomfy.net / *.runcomfy.com 域名用于下载生成结果。无遥测上报，无回调机制。
生成文件大小限制：CLI 会终止任何单个下载超过 2 GiB 的请求。
Bash 使用范围：本技能仅调用 runcomfy <子命令>。npm / npx / export RUNCOMFY_TOKEN=... 等命令仅为一次性操作员配置，非每次调用时执行。

参考资料

[runcomfy.com 图像模型列表](https://www.runcomfy.com/models?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) — 所有文本生成图像与图像编辑端点，均附带 API 选项卡
[最佳图像编辑模型 系列](https://www.runcomfy.com/models/collections/best-image-editing-models?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [nano-banana](https://www.runcomfy.com/models/collections/nano-banana?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [seedream](https://www.runcomfy.com/models/collections/seedream?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [flux-kontext](https://www.runcomfy.com/models/collections/flux-kontext?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [qwen-image](https://www.runcomfy.com/models/collections/qwen-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [dreamina](https://www.runcomfy.com/models/collections/dreamina?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) — RunComfy 品牌系列模型
[docs.runcomfy.com/cli](https://docs.runcomfy.com/cli/introduction?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) — CLI 安装、认证与故障排查指南

@kalvinrv

已收录 1 个 Skill

🎨 AI Image Generation — Pro Pack on RunComfy

安装与下载

Skill 说明

🎨 AI 图像生成 — RunComfy Pro 套件

由 RunComfy CLI 驱动

根据用户意图选择合适的模型

文生图（t2i）—— 按最新版本排序

图像到图像 / 编辑（i2i）—— 最新优先

t2i 路径 1：FLUX 2 Klein — 默认选项

参数结构（两个版本通用）

调用方式

提示词编写建议

t2i 路径 2：GPT Image 2 — 字体与图像内文字

参数结构

调用示例

提示词编写建议

t2i 路径 3：Nano Banana 2 — 高速迭代

参数结构

调用示例

提示词编写建议

t2i 路径 4：Seedream 5 / 4-5 — 照片级旗舰模型

调用示例

何时选择 Seedream

t2i 路由 5：开放权重与特色模型

i2i — 图像到图像 / 编辑（紧凑版）

i2i 路由 A：Nano Banana 2 编辑 — 默认选项

i2i 路由 B：GPT Image 2 编辑 — 多语言 + 多参考

i2i 路由 C：FLUX Kontext Pro — 单次精准编辑

其他可用的 i2i 端点

常见使用模式

品牌宣传海报

写实人像

故事板帧批量生成（10+ 个概念）

多语言发布创意（相同布局，多种语言）

概念情绪板（快速生成 10 个变体）

生成后精修（同一品牌内）

带有固定品牌配色的 Logo

浏览完整模型目录

退出码

工作原理

安全与隐私

参考资料

相关推荐

React Design Draft

Free Image Generation Skill

blog-page-generator