🎨 AI Image Generation — Pro Pack on RunComfy

基于 RunComfy CLI 的多模型 AI 图像生成与编辑技能,支持文本/图像生成及精准调优。

已扫描
适合谁
设计师与创意工作者、内容创作者与营销人员
不适合谁
无本地 CLI 使用经验者、无法访问外部 API 或网络环境者
国内可用性
需网络配置。可能需要网络配置或第三方服务可访问。
安装难度
新手友好(★☆☆)。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

openclaw skills install @kalvinrv/ai-image-generation-runcomfy

Skill 说明

命令、参数、文件名以原文为准

🎨 AI 图像生成 — RunComfy Pro 套件

在 RunComfy 上进行 AI 图像生成。 通过 [RunComfy](https://www.runcomfy.com/?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) CLI 使用 11+ 种 AI 模型生成和编辑图像 — 支持文生图与图生图,一次认证,一条命令。本 RunComfy 图像生成技能可根据用户意图自动选择合适模型,并提供已记录的提示词模式及每种模型对应的精确 runcomfy run 调用方式。

[runcomfy.com](https://www.runcomfy.com/?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [浏览所有模型](https://www.runcomfy.com/models?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [CLI 文档](https://docs.runcomfy.com/cli/introduction?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

由 RunComfy CLI 驱动

# 1. 安装(任选其一 — 详情见 runcomfy-cli 技能)
npm i -g @runcomfy/cli                              # 全局安装
npx -y @runcomfy/cli --version                      # 零安装

# 2. 登录(交互式 — 会打开浏览器)
runcomfy login
# 或在 CI / 容器环境中使用:
export RUNCOMFY_TOKEN=<从 runcomfy.com/profile 获取的 token>

# 3. 生成图像
runcomfy run <vendor>/<model>/<endpoint> \
  --input '{"prompt": "..."}' \
  --output-dir ./out

CLI 文档:[安装](https://docs.runcomfy.com/cli/install?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [快速入门](https://docs.runcomfy.com/cli/quickstart?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [命令](https://docs.runcomfy.com/cli/commands?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [认证](https://docs.runcomfy.com/cli/auth?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [故障排查](https://docs.runcomfy.com/cli/troubleshooting?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)


根据用户意图选择合适的模型

文生图(t2i)—— 按最新版本排序

FLUX 2 Klein 9Bblackforestlabs/flux-2-klein/9b/text-to-image *(默认)*

经过步数优化,4–25 步完成,支持原生多参考条件输入,兼具高保真写实与插画风格表现力。

推荐场景:意图不明确、快速迭代、多参考风格化、通用用途。

不推荐场景:图像中包含文字内容 —— 请改用 GPT Image 2

FLUX 2 Klein 4Bblackforestlabs/flux-2-klein/4b/text-to-image

Klein 9B 的亚秒级变体,保持相同功能集。

推荐场景:分镜草图、情绪板、高速批量概念设计。

不推荐场景:最终交付成品 —— 相较于 9B 存在轻微画质下降。

FLUX 2 Pro / Dev / Flash / Turbo / Maxblackforestlabs/flux-2/max,[flux-2-dev](https://www.runcomfy.com/models/blackforestlabs/flux-2-dev/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy),[flux-2-flash](https://www.runcomfy.com/models/blackforestlabs/flux-2-flash?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy),[flux-2-turbo](https://www.runcomfy.com/models/blackforestlabs/flux-2-turbo?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

FLUX 2 基础模型的更高保真度版本,适用于电影级视觉与品牌创作、主视觉画面。

推荐场景:追求高质量成品、品牌宣传项目。

不推荐场景:需要亚秒级响应速度 —— 请改用 Klein 4B

Nano Banana Pro — [google/nano-banana-pro/text-to-image](https://www.runcomfy.com/models/google/nano-banana-pro/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

最高保真度的 Nano Banana 系列模型。基于 Gemini 构建,支持可选网页搜索以获取真实世界参考(如产品、地标)。

推荐场景:对指令遵循要求高的 Nano Banana 风格创作,且需更高画质。

不推荐场景:成本敏感的快速迭代 —— 可降级至 Nano Banana 2

Nano Banana 2google/nano-banana-2/text-to-image

闪电级延迟响应,构图稳定,支持 enable_web_search 标志以实现真实产品或真实人物的精准定位。

推荐场景:快速迭代、四图并列批量生成、含真实世界参照的提示词。

不推荐场景:复杂组合指令 —— 请改用 GPT Image 2

GPT Image 2openai/gpt-image-2/text-to-image

在图像内文字渲染方面表现最佳(日文假名、西里尔字母、阿拉伯语等)。具备精确的布局理解与指令遵循能力。

推荐场景:海报、广告、多行文案、多语言创意内容、精确文本标题。

不推荐场景:高保真人像 —— Seedream 5 在肤色与光照表现上更优。

Seedream 5 Lite — [bytedance/seedream-5/lite/text-to-image](https://www.runcomfy.com/models/bytedance/seedream-5/lite/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

字节跳动最新一代 Seedream 模型。具备高保真人像肤色、自然光影效果,强东方美学风格。

推荐场景:高保真人像、产品摄影、时尚与生活方式类内容。

不推荐场景:对文字排版精度要求高 —— 请改用 GPT Image 2

Seedream 4-5 — [bytedance/seedream-4-5/text-to-image](https://www.runcomfy.com/models/bytedance/seedream-4-5/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

之前的 Seedream 主力型号,仍具备出色的写实表现力。

推荐场景:在 Seedream-5 生成批次之间保持形象一致性;作为性价比更高的 Seedream 替代方案。

不推荐场景:新项目创作 —— 建议优先使用 Seedream 5 Lite

Dreamina 4-0 — [bytedance/dreamina-4-0/text-to-image](https://www.runcomfy.com/models/bytedance/dreamina-4-0/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

字节跳动偏向插画与概念艺术的风格化模型,擅长角色设计与绘画感资产生成。

推荐场景:概念艺术、插画英雄角色、绘画风格素材。

不推荐场景:写实风格图像 —— 请改用 Seedream

Qwen Image 2512 — [qwen/qwen-image/qwen-image-2512](https://www.runcomfy.com/models/qwen/qwen-image/qwen-image-2512?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

阿里通义最新版本,开源权重,支持 LoRA(/lora 变体)。

推荐使用场景:需要开源权重的工作流,或与 Qwen 对齐的 LoRA 体系。

不推荐使用场景:追求闭源权重的精细画质 —— 请选用 FLUX 2GPT Image 2

Wan 2-7 — [wan-ai/wan-2-7/text-to-image](https://www.runcomfy.com/models/wan-ai/wan-2-7/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy),[wan-ai/wan-2-7/pro/text-to-image](https://www.runcomfy.com/models/wan-ai/wan-2-7/pro/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

开源权重,可原生搭配 Wan 2-7 视频模型,实现统一栈工作流。

推荐使用场景:构建 Wan 生态系统管线(图像 + 视频同品牌),或有开源权重需求。

不推荐使用场景:对纯图像质量要求极高。

Z-Image Turbo — [tongyi-mai/z-image/turbo](https://www.runcomfy.com/models/tongyi-mai/z-image/turbo?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

亚秒级生成速度,开源权重,原生支持 LoRA /lora 变体。

推荐使用场景:需要快速生成且支持 LoRA 定制的开源权重工作流。

不推荐使用场景:追求闭源权重的精细画质。

图像到图像 / 编辑(i2i)—— 最新优先

Nano Banana Pro Edit — [google/nano-banana-pro/edit](https://www.runcomfy.com/models/google/nano-banana-pro/edit?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

最高画质的 Nano Banana 编辑层级。支持身份保留、多参考图输入。

推荐使用场景:高端 NB 编辑任务,需锁定人物身份的变体。

不推荐使用场景:成本敏感的迭代 —— 可降级使用 Nano Banana 2 Edit

Nano Banana 2 Editgoogle/nano-banana-2/edit *(默认 i2i)*

单次调用支持 1–20 张输入图像,默认保留身份特征,支持空间语言理解(如“右上角”、“左侧物体”)。

推荐使用场景:默认图像编辑,批量身份保留,背景替换,方向性对象增删。

不推荐使用场景:需要精确掩码区域控制 —— 请使用 image-edit 技能(Z-Image Inpaint)。

GPT Image 2 Editopenai/gpt-image-2/edit

支持最多 10 张参考图,支持多语言图像内文本重写,布局精准重排。

推荐使用场景:多语言标题替换、多参考图组合、布局重排、跨语言翻译下保持品牌身份一致。

不推荐使用场景:基于掩码的修复 —— 请使用 image-edit 技能。

Seedream 5 Lite Edit — [bytedance/seedream-5/lite/edit](https://www.runcomfy.com/models/bytedance/seedream-5/lite/edit?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

最新的 Seedream 编辑层级,强调照片级真实感保留。

推荐使用场景:从 Seedream 文生图生成的图像进行高质量编辑(身份在成对图像间保持一致)。

不推荐使用场景:多语言文本重写。

Seedream 4-5 Edit — [bytedance/seedream-4-5/edit](https://www.runcomfy.com/models/bytedance/seedream-4-5/edit?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

旧版 Seedream 编辑模型。

推荐使用场景:在 4-5 代生成之间保持身份稳定的批量处理。

不推荐使用场景:新项目 —— 请优先选择 Seedream 5 Lite Edit

Dreamina 4-0 Edit — [bytedance/dreamina-4-0/edit](https://www.runcomfy.com/models/bytedance/dreamina-4-0/edit?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

字节跳动插画类图像编辑模型。

推荐使用场景:编辑由 Dreamina 生成的插画作品。

不推荐使用场景:真实感强的主体图像。

Qwen Image Edit 2511 — [qwen/qwen-image/qwen-image-edit-2511](https://www.runcomfy.com/models/qwen/qwen-image/qwen-image-edit-2511?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

阿里通义开源权重编辑模型。

推荐使用场景:构建开源权重编辑工作流。

不推荐使用场景:追求闭源权重的精细画质。

Wan 2.6 i2i — [wan-ai/wan-v2.6/image-to-image](https://www.runcomfy.com/models/wan-ai/wan-v2.6/image-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

Wan 生态系统的图像到图像转换模型。

推荐使用场景:集成至 Wan 栈管线中。

不推荐使用场景:新项目 —— 属于较老版本;建议优先使用 Nano Banana 或 GPT Image 2。

FLUX Kontext Problackforestlabs/flux-1-kontext/pro/edit

单参考图单指令,最高保真度(“除 X 外全部保留”)。

推荐使用场景:单图局部精准编辑(如“仅将她的雨伞改为橙色”)。

不推荐使用场景:批量处理、多参考图组合、掩码驱动的修复。

需要掩码驱动修复、可控外扩或完整编辑功能? → 请使用 image-edit 技能。


t2i 路径 1:FLUX 2 Klein — 默认选项

模型blackforestlabs/flux-2-klein/9b/text-to-image(默认),blackforestlabs/flux-2-klein/4b/text-to-image(亚秒级响应)

目录:[9B](https://www.runcomfy.com/models/blackforestlabs/flux-2-klein/9b/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [4B](https://www.runcomfy.com/models/blackforestlabs/flux-2-klein/4b/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

参数结构(两个版本通用)

字段类型必填默认值说明
promptstring支持约 512 个 token,更长会降低效果;建议采用“主体优先”的陈述句式
stepsint25(9B) / 4(4B)经过步数优化;4–8 步适合构思,约 25 步用于精修,超过 25 步收益有限
widthint1024常见范围 512–1536,最大总像素约 2K;宽高比上限 16:9
heightint1024与 width 保持一致的构图意图

同一接口支持最多 4 张参考图,用于风格迁移或引导构图。字段定义详见 [模型页面](https://www.runcomfy.com/models/blackforestlabs/flux-2-klein/9b/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)。

调用方式

精修 / 最终输出(9B):

runcomfy run blackforestlabs/flux-2-klein/9b/text-to-image \
  --input '{
    "prompt": "一只小紫色猫坐在覆盖苔藓的石头上,金色时刻轮廓光,浅景深,照片级真实感",
    "steps": 25,
    "width": 1536,
    "height": 864
  }' \
  --output-dir ./out

亚秒级概念生成(4B):

runcomfy run blackforestlabs/flux-2-klein/4b/text-to-image \
  --input '{"prompt": "一只小紫色猫在日落时分,照片级真实感"}' \
  --output-dir ./out

提示词编写建议

  • 主体在前,场景在后,修饰语在最后。 例如:“一只小紫色猫……坐在苔藓石上……金色时刻,浅景深。”
  • 步骤策略: 创意阶段使用 4–8 步,精修阶段约 25 步。不要超过 28 步——收益递减。
  • 9B 与 4B 的选择: 默认使用 9B;仅在需要亚秒级批量概念生成时才降级到 4B。
  • 多参考图: 支持 1–4 个参考链接;在提示词中明确描述角色关系(如 "主体来自参考图1,配色来自参考图2")。

t2i 路径 2:GPT Image 2 — 字体与图像内文字

模型: openai/gpt-image-2/text-to-image

目录: [runcomfy.com/models/openai/gpt-image-2](https://www.runcomfy.com/models/openai/gpt-image-2/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

参数结构

字段类型必填默认值说明
promptstring图像内文字需用 " 精确引用
sizeenum1024_1024仅支持三种尺寸:<br>1024_1024(1:1),<br>1024_1536(2:3 竖版),<br>1536_1024(3:2 横版)

调用示例

带精确标题的 Logo / 海报:

runcomfy run openai/gpt-image-2/text-to-image \
  --input '{
    "prompt": "极简产品海报。中心放置粗体标题,准确显示为“AURORA — Spring 2026”,白色无衬线字体,深海军蓝背景。标题下方一行小字以等宽字体显示“runs on water”。采用 3:2 布局。",
    "size": "1536_1024"
  }' \
  --output-dir ./out

多语言支持:

runcomfy run openai/gpt-image-2/text-to-image \
  --input '{
    "prompt": "日式杂志封面。竖向标题准确显示为“今日のおすすめ”,使用粗体日文假名,右对齐,搭配一位身着和服女性的写实肖像。",
    "size": "1024_1536"
  }' \
  --output-dir ./out

提示词编写建议

  • 图像内文字必须精确引用。"标志上的文字准确为 'CLOSED'" —— 若不加引号,模型会进行改写。
  • 为非拉丁文字指定字体类型:"日文假名""西里尔字母""阿拉伯语从右到左"。未指定将默认转写为罗马音。
  • 布局语言需明确:"左上角""居中""两行堆叠""基线对齐"
  • 仅支持三种尺寸。 不要传入任意宽高。

t2i 路径 3:Nano Banana 2 — 高速迭代

模型: google/nano-banana-2/text-to-image

目录: [runcomfy.com/models/google/nano-banana-2](https://www.runcomfy.com/models/google/nano-banana-2?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [nano-banana 系列模型](https://www.runcomfy.com/models/collections/nano-banana?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

参数结构

字段类型必填默认值说明
promptstring主体优先的描述
num_imagesint11–4,用于创意轮次时建议设为 4
seedint0重复使用以保证结果可复现
aspect_ratioenumauto可选:auto21:916:93:24:35:41:14:53:42:39:16
resolutionenum1K可选:0.5K(草稿)、1K(默认)、2K(终稿)、4K(最高)
output_formatenumpng可选:pngjpegwebp
safety_toleranceint41(严格)至 6(宽松)
enable_web_searchboolfalse启用网络搜索以增强现实依据(额外成本 + 延迟)

调用示例

默认草稿:

runcomfy run google/nano-banana-2/text-to-image \
  --input '{"prompt": "一个咖啡杯放在大理石台面上,顶部俯拍,温暖的晨光"}' \
  --output-dir ./out

四图批量用于创意构思:

runcomfy run google/nano-banana-2/text-to-image \
  --input '{
    "prompt": "三张陶瓷咖啡杯的照片,置于大理石台面,温暖晨光,俯拍视角,极简风格",
    "num_images": 4,
    "aspect_ratio": "1:1",
    "resolution": "0.5K"
  }' \
  --output-dir ./out

提示词编写建议

  • 主体优先的陈述句式。 如“一个咖啡杯放在大理石上”优于“生成一张有创意的杯子照片”。
  • **启用 enable_web_search: true:** 当提示词涉及真实产品、地点或人物,且外观需符合现实(如品牌标识、地标建筑)时使用。
  • **创意阶段使用 0.5K,最终输出才提升至 2K 及以上** —— 4K 成本约为 0.5K 的 16 倍。

t2i 路径 4:Seedream 5 / 4-5 — 照片级旗舰模型

模型: [bytedance/seedream-5/lite/text-to-image](https://www.runcomfy.com/models/bytedance/seedream-5/lite/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [bytedance/seedream-4-5/text-to-image](https://www.runcomfy.com/models/bytedance/seedream-4-5/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

合集: [seedream](https://www.runcomfy.com/models/collections/seedream?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)

调用示例

runcomfy run bytedance/seedream-5/lite/text-to-image \
  --input '{"prompt": "85mm 人像,女性站在窗边,柔和自然光,浅景深,照片级真实感"}' \
  --output-dir ./out

字段结构请参考模型页面,CLI 调用时直接传递原样参数。

何时选择 Seedream

  • 照片级人像 / 产品图 —— 皮肤色调和自然光照表现更真实
  • 东亚美学 / 时尚题材 —— 在此类主题上有较强表现力
  • 电影级构图 —— 对镜头语言和光影描述理解良好
  • 与 FLUX 2 对比: Seedream 更偏向照片级真实;FLUX 2 更偏向设计与插画风格

t2i 路由 5:开放权重与特色模型

适用于需要开放权重 / LoRA 支持,或追求不同美学风格的工作流:

模型端点适用场景
[wan-ai/wan-2-7/text-to-image](https://www.runcomfy.com/models/wan-ai/wan-2-7/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)wan-ai/wan-2-7/text-to-imageWan 生态系统;可搭配 Wan 2-7 视频模型使用
[wan-ai/wan-2-7/pro/text-to-image](https://www.runcomfy.com/models/wan-ai/wan-2-7/pro/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)wan-ai/wan-2-7/pro/text-to-imageWan Pro 套餐
[tongyi-mai/z-image/turbo](https://www.runcomfy.com/models/tongyi-mai/z-image/turbo?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)tongyi-mai/z-image/turbo亚秒级响应,通过 /lora 端点支持 LoRA
[qwen/qwen-image/qwen-image-2512](https://www.runcomfy.com/models/qwen/qwen-image/qwen-image-2512?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)qwen/qwen-image/qwen-image-2512Qwen Image,开放权重,也提供 /lora 变体
[bytedance/dreamina-4-0/text-to-image](https://www.runcomfy.com/models/bytedance/dreamina-4-0/text-to-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)bytedance/dreamina-4-0/text-to-image偏向插画 / 概念艺术风格

各模型页面提供完整 schema —— 可直接将字段集通过 CLI 原样传递。


i2i — 图像到图像 / 编辑(紧凑版)

适用于单次编辑任务。如需完整编辑功能(掩码驱动的修复、批量编辑、所有附加 schema),请使用专用的 image-edit skill。

i2i 路由 A:Nano Banana 2 编辑 — 默认选项

runcomfy run google/nano-banana-2/edit \
  --input '{
    "prompt": "保持主体身份、姿势和服装不变。将背景改为雨夜霓虹赛博朋克街道。",
    "image_urls": ["https://.../portrait.jpg"]
  }' \
  --output-dir ./out

Schema:promptimage_urls(1–20 个),number_of_images(1–4),aspect_ratio(默认为 auto),resolutionoutput_formatseedenable_web_search。提示词应以保留目标开头,以修改内容结尾。

i2i 路由 B:GPT Image 2 编辑 — 多语言 + 多参考

runcomfy run openai/gpt-image-2/edit \
  --input '{
    "prompt": "保持照片和布局与输入完全一致。仅将标题替换为「今日のおすすめ」,使用粗体日文假名。",
    "images": ["https://.../poster-en.jpg"],
    "size": "auto"
  }' \
  --output-dir ./out

Schema:promptimages(最多 10 个 HTTPS 链接;第 1 张为主图),sizeauto / 1024_1024 / 1024_1536 / 1536_1024)。size: "auto" 会保留原始比例。

i2i 路由 C:FLUX Kontext Pro — 单次精准编辑

runcomfy run blackforestlabs/flux-1-kontext/pro/edit \
  --input '{
    "prompt": "保持人物面部、姿势和服装不变。在她左手添加一把橙色雨伞,并加上轻微微笑。",
    "image": "https://.../portrait.jpg"
  }' \
  --output-dir ./out

Schema:promptimage(仅支持单个 URL,不接受数组),aspect_ratioseed。每次调用仅包含一个明确指令;复合编辑建议分多轮迭代完成。

其他可用的 i2i 端点

同品牌 t2i → i2i 配对支持生成后无缝精修,无需切换品牌:

品牌t2i 端点i2i / 编辑端点
Seedream 5 Litebytedance/seedream-5/lite/text-to-imagebytedance/seedream-5/lite/edit
Seedream 4-5bytedance/seedream-4-5/text-to-imagebytedance/seedream-4-5/edit
Dreamina 4-0bytedance/dreamina-4-0/text-to-imagebytedance/dreamina-4-0/edit
Nano Banana Progoogle/nano-banana-pro/text-to-imagegoogle/nano-banana-pro/edit
Qwen Imageqwen/qwen-image/qwen-image-2512qwen/qwen-image/qwen-image-edit-2511
Wan 2-7 / 2.6wan-ai/wan-2-7/text-to-imagewan-ai/wan-v2.6/image-to-image

如需查看“最佳图像编辑模型”的完整推荐列表,并了解各模型的对比能力说明,请访问 [best-image-editing-models 收藏集](https://www.runcomfy.com/models/collections/best-image-editing-models?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)。


常见使用模式

品牌宣传海报

  • 标题必须精确显示为 X → 使用路由 2(GPT Image 2)size: "1536_1024" 用于横版布局
  • 使用格式:"标题准确显示为 '…',字体粗细为 [font weight],字体族为 [font family]"

写实人像

  • 路由 4(Seedream 5 Lite) 适合肤色表现;或 路由 1(FLUX 2 Klein 9B) 配合 steps: 25 及明确的镜头/光影描述

故事板帧批量生成(10+ 个概念)

  • 路由 1(FLUX 2 Klein 4B)steps: 6,每角色固定 seed 以降低形象漂移

多语言发布创意(相同布局,多种语言)

  • 路由 2(GPT Image 2),每种语言调用一次,布局描述保持一致,仅替换引号内的标题文本

概念情绪板(快速生成 10 个变体)

  • 路由 3(Nano Banana 2)resolution: "0.5K"num_images: 4,通过调整 seed 实现多样性

生成后精修(同一品牌内)

  • 路由 4(Seedream 5 Lite t2i)Seedream 5 Lite edit,用于后续微调。两者保持形象一致性
  • 路由 2(GPT Image 2) 用于标题处理,若颜色十六进制值不精确,可再通过 Nano Banana 2 Edit(i2i 路由 A) 进行色彩校正

浏览完整模型目录

本技能覆盖高流量模型。完整 RunComfy 图像模型目录按使用场景分类:

  • [所有图像模型](https://www.runcomfy.com/models?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) — 每个端点均提供 API Schema 选项卡
  • [nano-banana 系列](https://www.runcomfy.com/models/collections/nano-banana?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)
  • [seedream 系列](https://www.runcomfy.com/models/collections/seedream?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)
  • [flux-kontext 系列](https://www.runcomfy.com/models/collections/flux-kontext?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)
  • [qwen-image 系列](https://www.runcomfy.com/models/collections/qwen-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)
  • [dreamina 系列](https://www.runcomfy.com/models/collections/dreamina?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)
  • [最佳图像编辑模型 系列](https://www.runcomfy.com/models/collections/best-image-editing-models?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)
  • [最近新增 系列](https://www.runcomfy.com/models/collections/recently-added?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) — 最新上线模型

每个模型页面均包含一个 API 选项卡,展示完整的 JSON Schema;可通过 CLI 原样传递字段集。


退出码

代码含义
0成功
64CLI 参数错误
65输入 JSON 错误或字段不匹配
69上游服务返回 5xx 错误
75可重试错误:超时或 429 请求过多
77未登录或令牌被拒绝

完整参考:[docs.runcomfy.com/cli/troubleshooting](https://docs.runcomfy.com/cli/troubleshooting?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy)。


工作原理

该技能将用户请求分类为文本生成图像(t2i)或图像编辑(i2i)路径之一,并调用 runcomfy run <model_id> 命令,传入对应的 JSON 请求体。CLI 将请求发送至 RunComfy 模型 API,轮询任务状态,获取结果,并将所有 .runcomfy.net / .runcomfy.com 的链接下载至 --output-dir 指定目录。按 Ctrl-C 可在退出前取消远程请求。

安全与隐私

  • 仅通过已验证的包管理器安装。本技能建议操作者使用 npm i -g @runcomfy/clinpx -y @runcomfy/cli 安装 CLI。代理不得以任意远程脚本直接注入 shell 执行——若操作者希望使用 docs.runcomfy.com/cli/install 中提供的 curl 安装方式,应先自行审查脚本内容。
  • 令牌存储runcomfy login 命令将 API 令牌写入 ~/.config/runcomfy/token.json,文件权限设为 0600。在 CI / 容器环境中可使用 RUNCOMFY_TOKEN 环境变量绕过文件读取。切勿在命令行中输出令牌、记录日志或提交到版本控制。
  • 输入边界(Shell 注入风险):提示词通过 --input 以 JSON 字符串形式传递。CLI 不对提示内容进行 shell 展开,而是直接通过 HTTPS 将 JSON 请求体发送至模型 API。提示内容不会造成 Shell 注入风险,即使包含反引号、引号或 $(...) 表达式。
  • 间接提示注入(第三方内容风险):参考图像 URL 和 enable_web_search 返回的结果属于不可信来源。这些内容由 RunComfy 模型服务器获取,可能通过嵌入指令(如图像中的文字、EXIF 元数据、网络引导控制)影响生成结果。建议采取以下缓解措施:

- 仅接收用户明确提供的 URL 作为本次任务输入。

- 若生成结果偏离提示,应怀疑参考资源的影响,而非提示本身。

- 默认关闭 enable_web_search;仅在用户明确要求获取现实世界信息时才启用。

  • 出站连接(白名单限制):仅允许访问 model-api.runcomfy.net 以及 *.runcomfy.net / *.runcomfy.com 域名用于下载生成结果。无遥测上报,无回调机制。
  • 生成文件大小限制:CLI 会终止任何单个下载超过 2 GiB 的请求。
  • Bash 使用范围:本技能仅调用 runcomfy <子命令>npm / npx / export RUNCOMFY_TOKEN=... 等命令仅为一次性操作员配置,非每次调用时执行。

参考资料

  • [runcomfy.com 图像模型列表](https://www.runcomfy.com/models?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) — 所有文本生成图像与图像编辑端点,均附带 API 选项卡
  • [最佳图像编辑模型 系列](https://www.runcomfy.com/models/collections/best-image-editing-models?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [nano-banana](https://www.runcomfy.com/models/collections/nano-banana?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [seedream](https://www.runcomfy.com/models/collections/seedream?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [flux-kontext](https://www.runcomfy.com/models/collections/flux-kontext?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [qwen-image](https://www.runcomfy.com/models/collections/qwen-image?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) · [dreamina](https://www.runcomfy.com/models/collections/dreamina?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) — RunComfy 品牌系列模型
  • [docs.runcomfy.com/cli](https://docs.runcomfy.com/cli/introduction?utm_source=clawhub&utm_medium=skill&utm_campaign=ai-image-generation-runcomfy) — CLI 安装、认证与故障排查指南
K
@kalvinrv

已收录 1 个 Skill

相关推荐