Alibabacloud Bailian Image Creator

基于阿里云DashScope API的AI图像生成与编辑技能，支持多模型调用与自动化执行。

已扫描

项目

内容

适合谁

设计师与创意工作者、AI内容生产者

不适合谁

无网络环境用户、不熟悉API调用的初学者

国内可用性

需网络配置。可能需要网络配置或第三方服务可访问。

安装难度

新手友好（★☆☆）。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

复制命令安装

openclaw skills install @sdk-team/alibabacloud-bailian-image-creator

官方 ZIP下载官方 ZIP

Skill 说明

命令、参数、文件名以原文为准

AI 图像生成器

基于阿里云 DashScope API 构建的专业级 AI 图像生成技能。

警告：在执行任何图像任务前，必须阅读并遵守“强制规则”部分。违反规则将导致任务失败。

强制规则

首要原则：必须使用现有脚本

**所有图像生成、编辑和理解任务必须且只能通过运行 scripts/ 目录中的现有脚本完成。**

禁止编写自己的 API 调用代码 —— 不得创建新的 Python 脚本来调用 DashScope API。必须使用下方“任务到脚本映射”表中指定的脚本
禁止使用 PIL/Pillow 或其他本地库 进行图像生成或编辑（仅允许用于尺寸验证等辅助操作）
禁止使用第三方 API —— 包括但不限于 Pollinations.ai、Stability.ai、DALL-E、Midjourney
禁止创建模拟/伪脚本 —— 不得以任何方式绕过真实的 API 调用
禁止使用已弃用的模型 —— wanx-v1、wanx-v2、wan2.6-image 等旧版模型已停止支持
禁止混用 API —— Qwen 模型（qwen-*）只能使用 MultiModalConversation.call()，Wanx 模型（wan2.7-*）只能使用 ImageGeneration.call()
禁止使用 curl 调用 DashScope REST API —— 必须通过提供的脚本调用，不得用 Shell 脚本替代
禁止生成占位/空白图像 —— 不得使用硬编码字节流、空白画布或 PIL 缩放图像冒充 API 生成的图像
禁止在 API 调用失败时谎报成功 —— 必须如实报告失败原因，不得生成虚假的成功报告

任务到脚本映射（唯一执行方式）

根据用户请求关键词，在下表中查找对应脚本。不允许使用其他方法：

用户请求关键词	脚本	API	默认模型
Wanx、wan2.7、参考图像 + 生成、风格融合、多图融合、车体涂鸦、虚拟试穿	`wanx_generate.py`	`ImageGeneration.call()`	`wan2.7-image`
4K 高清文生图	`wanx_generate.py`	`ImageGeneration.call()`	`wan2.7-image-pro`
一组连贯的图像、图像系列生成	`wanx_generate.py`	`ImageGeneration.call()`	`wan2.7-image-pro`
文生图、生成图像、画一张图（无参考图像）	`text_to_image.py`	`MultiModalConversation.call()`	`qwen-image-2.0-pro`
编辑图像（URL 输入）	`image_edit.py`	`MultiModalConversation.call()`	`qwen-image-edit-max`
编辑图像（本地文件）	`image_edit_base64.py`	`MultiModalConversation.call()`	`qwen-image-edit-max`
分析/理解图像内容、描述图像	`image_understanding.py`	`chat.completions.create()`	`qwen3.5-plus`

歧义优先级规则（当多个关键词同时匹配时）：

用户提及 “Wanx” 或 “wan2.7” → 直接使用 wanx_generate.py，无论是否包含“生成图像”等词语
用户提供 参考图像 URL 并请求生成新图像 → 使用 wanx_generate.py（Wanx 支持多图参考输入）
仅有文字描述，无参考图像 → 使用 text_to_image.py

允许的模型：

脚本	允许模型
`text_to_image.py`	`qwen-image-2.0-pro`、`qwen-image-2.0`
`wanx_generate.py`	`wan2.7-image-pro`、`wan2.7-image`
`image_edit.py` / `image_edit_base64.py`	`qwen-image-edit-max`、`qwen-image-2.0-pro`、`qwen-image-edit-plus`、`qwen-image-edit`
`image_understanding.py`	`qwen3.5-plus`、`qwen-vl-max`、`qwen-vl-plus`

API 密钥安全管理

**脚本会自动通过 api_key.py 处理密钥获取。Agent 不应手动提取、设置或传递 API Key 值。**

密钥获取自动化：脚本内部调用 api_key.py，自动从配置文件或环境变量中获取密钥，或通过 CLI 自动生成。Agent 只需运行脚本命令
禁止任何形式的密钥硬编码：包括 api_key = "sk-..."、export DASHSCOPE_API_KEY="sk-..."，以及在 Shell 脚本中赋值
禁止从 CLI 输出中提取密钥：aliyun modelstudio create-api-key 返回的密钥值由 api_key.py 自动保存。Agent 不得将该值写入任何脚本、变量或文件
禁止在任何输出中暴露密钥：包括生成的脚本、Shell 命令、日志文件（summary.md、task_summary.md、execution_log.md 等），以及终端输出中以 sk- 开头的字符串
禁止从配置文件读取或打印密钥：不得使用 cat ~/.aliyun/config.json、jq、python -c 等命令从配置文件中读取并输出 API Key 值
禁止直接调用 CLI 密钥命令：不得直接运行 aliyun modelstudio create-api-key 或 aliyun modelstudio list-api-keys。这些命令仅由 api_key.py 内部调用
任务完成前强制自检：运行 grep -rn "sk-" <output_directory>/ 检查所有输出文件；若发现以 sk- 开头的字符串（不包括 "sk-xxx" 占位符），立即删除受影响文件并重新生成

API 调用结果验证

技能：阿里云百炼图像生成器

版本：0.0.1

分块：2/4

状态检查

检查状态码：API 响应的 status_code 必须为 200，否则立即中止任务
检查输出内容：响应必须包含有效的图片 URL（以 http 开头）。若无有效 URL，则视为失败
禁止虚构结果：不得生成模拟数据、虚假成功报告或占位图片 URL
禁止模拟操作：不得创建模拟脚本或伪造 API 调用以绕过真实调用
失败时的正确处理方式：

- 输出错误信息（状态码、错误码、错误描述）

- 停止执行后续步骤

- 若为密钥问题，api_key.py 将自动重试创建

- 若重试仍失败，需如实报告真实错误原因，不得隐瞒

输出验证（在报告任务完成前必须执行）

检查输出文件：确认输出目录中存在图片文件，且文件大小合理（通常大于 10KB）
密钥泄露扫描：运行 grep -rn "sk-" <output_directory>/ 检查所有输出文件（包括日志、摘要、脚本）。如发现泄露，立即删除并重新生成
禁止虚假声明：若实际 API 调用失败或未执行，不得在任务总结中声称成功（例如使用勾选标记）
空白图像检测：若输出图片为纯色、空白或仅为输入图的简单缩放版本，视为任务失败

输出尺寸控制

模型系列	尺寸格式	支持值
`qwen-image-2.0-pro` / `qwen-image-2.0`（文生图）	`"width*height"`	`10241024`、`7201280`、`1280720`、`1440720`、`720*1440`
`qwen-image-edit-*` / `qwen-image-2.0-pro`（编辑类）	`"width*height"`	宽度和高度均在 [512, 2048] 范围内，可自由组合
`wan2.7-image-pro`（文生图）	预设层级	`1K`、`2K`、`4K`
`wan2.7-image-pro`（编辑/系列生成）	预设层级	`1K`、`2K`
`wan2.7-image`	预设层级	`1K`、`2K`

映射规则：

用户请求精确像素（如 1280x720）→ 选择 Qwen 系列，设置 size='1280*720'
用户请求竖屏/横屏 → 使用 Qwen 文生图最接近的固定尺寸（如竖屏 → 720*1280）
Wanx 模型 → size 只能为 1K/2K/4K，不可使用像素值

执行流程

步骤 1：安装依赖

pip install -r scripts/requirements.txt

步骤 2：根据“任务-脚本映射”表选择并运行脚本

选择逻辑：首先判断用户是否提及“Wanx”/“wan2.7”或提供参考图片链接 → 若是，使用 wanx_generate.py；否则按映射表中的其他关键词匹配。

API 密钥由脚本自动管理（三级获取顺序：配置文件 → 环境变量 → 自动生成）。无需手动处理密钥。Agent 仅需执行下表中的命令。不得自行编写脚本、设置环境变量或使用 curl 直接调用 API。

场景	命令	示例
文生图（Qwen）	`python scripts/text_to_image.py <prompt> [size] [model]`	`python scripts/text_to_image.py '一只橙色猫咪坐在窗台，8K' 1024*1024 qwen-image-2.0-pro`
文生图 / 多图融合（Wanx）	`python scripts/wanx_generate.py <prompt> [ref_image_URLs...]`	`python scripts/wanx_generate.py '将图片2的涂鸦绘制到图片1的车上' url1 url2`
图像编辑（URL 输入）	`python scripts/image_edit.py <instruction> <image_URL1> [URL2] [URL3]`	`python scripts/image_edit.py '将背景改为白色' https://example.com/photo.png`
图像编辑（本地文件）	`python scripts/image_edit_base64.py <instruction> <local_image1> [image2] [image3]`	`python scripts/image_edit_base64.py '将背景改为白色' ./photo.png`
图像理解	`python scripts/image_understanding.py <image_URL> [question]`	`python scripts/image_understanding.py https://example.com/photo.jpg '这张图里有什么？'`

步骤 3：返回结果

脚本将输出生成的图片 URL 列表；text_to_image.py 还会自动将图片下载至当前目录。

模型选择指南

条件	推荐模型	原因
需要准确呈现图像中的文字	`qwen-image-2.0-pro`	Qwen 系列具备最强的文字渲染能力
需要 4K 超高清画质	`wan2.7-image-pro`	唯一支持 4K 的 Wanx 专业文生图模型
需要一组风格一致的图像	`wan2.7-image-pro` + `enable_sequential`	Wanx 独有的图像序列生成能力
产品/工业设计编辑	`qwen-image-edit-max`	更强的几何推理与人物一致性表现
多图参考 + 组合创作	`wan2.7-image`	Wanx 支持灵活的多图参考编辑
图像内容分析/Q&A	`qwen3.5-plus`	通用多模态理解能力，成本较低
复杂视觉推理	`qwen-vl-max`	更强的视觉理解能力
成本优先	`qwen-image-2.0` / `wan2.7-image`	标准版本，价格更低
无特殊要求（默认）	`qwen-image-2.0-pro`	整体能力最均衡

提示词设计指南

详细指南请参见 [提示词设计指南](references/prompt-guide.md)

提示词结构公式：[主体描述] + [场景/环境] + [光照/氛围] + [构图/视角] + [艺术风格] + [质量参数]

完整示例：

一位30岁的亚洲男性侦探站在东京雨夜的街道上，身穿深灰色风衣，手持黑色雨伞，霓虹红蓝灯光映照在脸上，雨滴沿着伞边缘滑落，地面积水反射出璀璨的城市灯光，伦勃朗式布光，体积雾效，电影级构图，35mm变形镜头，胶片颗粒感，情绪化氛围，高细节，超写实，8K

负面提示模板（Qwen 系列支持 negative_prompt，Wanx 系列不支持）：

低质量，模糊，像素化，过度饱和，手部畸形，多余手指，面部扭曲，诡异谷效应，文字，水印，logo，签名，裁切，超出画面范围，最差质量

参考信息

环境与依赖

包	版本约束	用途
`dashscope`	`==1.25.16`	文本生成图像、图像编辑、Wanx 生成
`openai`	`==2.23.0`	图像理解（兼容 OpenAI 接口）

API 密钥配置

此技能通过 scripts/api_key.py 管理 DashScope API 密钥，可自动验证密钥格式（识别无效密钥如 sk-sp-）。

获取优先级：~/.aliyun/config.json > 系统环境变量 DASHSCOPE_API_KEY > 通过阿里云 CLI 自动生成

方法一：阿里云 CLI 配置文件（推荐）

在 ~/.aliyun/config.json 中当前配置文件下添加 dashscope 字段：

{
  "current": "default",
  "profiles": [
    {
      "name": "default",
      "mode": "AK",
      "access_key_id": "...",
      "access_key_secret": "...",
      "dashscope": {
        "api_key": "sk-xxx",
        "api_key_id": "4359606"
      }
    }
  ]
}

方法二：系统环境变量

export DASHSCOPE_API_KEY=sk-xxx

项目	说明
密钥格式	`sk-xxx`（标准 DashScope API 密钥）
不支持	`sk-sp-xxx`（编码计划密钥，不支持图像生成）
获取密钥	https://help.aliyun.com/zh/model-studio/get-api-key
安全建议	永远不要硬编码；使用 `from api_key import get_api_key`；永远不要将完整的 API 密钥输出到终端、日志或任何文件中

阿里云 CLI 配置（API 密钥自动生成/删除）

scripts/api_key.py 通过 aliyun modelstudio 命令实现 API 密钥的创建与删除。使用前请完成以下设置：

# 启用 AI 模式（允许 Agent 调用 CLI）
aliyun configure ai-mode enable

# 设置 User-Agent
aliyun configure ai-mode set-user-agent --user-agent "AlibabaCloud-Agent-Skills/alibabacloud-bailian-image-creator"

# 更新插件至最新版本
aliyun plugin update

# 安装 ModelStudio 插件（如未安装）
aliyun plugin install --names aliyun-cli-modelstudio --enable-pre

# 任务完成后禁用 AI 模式
aliyun configure ai-mode disable

命令	用途	调用位置
`aliyun modelstudio list-workspaces`	获取 Bailian 工作区 ID	`api_key.py: generate_api_key()`
`aliyun modelstudio create-api-key`	创建 DashScope API 密钥	`api_key.py: generate_api_key()`
`aliyun modelstudio list-api-keys`	列出现有 API 密钥（用于限额回收）	`api_key.py: generate_api_key()`
`aliyun modelstudio delete-api-key`	删除云端 API 密钥	`api_key.py: delete_api_key()` / `generate_api_key()`

区域与 API 地址

区域	DashScope API	OpenAI 兼容模式
北京（中国）	`https://dashscope.aliyuncs.com/api/v1`	`https://dashscope.aliyuncs.com/compatible-mode/v1`
新加坡	`https://dashscope-intl.aliyuncs.com/api/v1`	`https://dashscope-intl.aliyuncs.com/compatible-mode/v1`
弗吉尼亚（美国）	`https://dashscope-us.aliyuncs.com/api/v1`	`https://dashscope-us.aliyuncs.com/compatible-mode/v1`

注意：API 密钥在不同区域之间不可通用。

脚本参数参考

text_to_image.py —— 文本生成图像（Qwen 系列）

参数	说明
`size`	仅支持 `10241024`、`7201280`、`1280720`、`1440720`、`720*1440`
`prompt_extend`	启用时自动优化提示词
`negative_prompt`	用于避免生成不良内容的负面提示
`watermark`	是否添加水印

image_edit.py / image_edit_base64.py —— 图像编辑（Qwen 系列）

参数	类型	说明
`n`	int	输出图像数量，1-6（`qwen-image-edit` 固定为 1）
`size`	str	输出分辨率，格式为 `"width*height"`，范围 [512, 2048]
`negative_prompt`	str	负面提示
`prompt_extend`	bool	智能提示词重写，默认为真
`watermark`	bool	是否添加水印，默认为假
`seed`	int	随机种子 [0, 2147483647]，用于结果复现

编辑模型对比：

模型	优势	使用场景
`qwen-image-edit-max`	强大的几何推理能力，角色一致性好	产品设计、精准编辑
`qwen-image-2.0-pro`	强大的文本渲染能力，真实感强	通用编辑、文字编辑
`qwen-image-edit-plus`	支持多图输出和自定义分辨率	通用编辑
`qwen-image-edit`	基础版，固定单图输出	简单编辑

常见分辨率推荐：

宽高比	推荐分辨率
1:1	`10241024`、`15361536`
2:3	`7681152`、`10241536`
3:2	`1152768`、`15361024`
3:4	`9601280`、`10801440`
4:3	`1280960`、`14401080`
9:16	`7201280`、`10801920`
16:9	`1280720`、`19201080`
21:9	`1344576`、`2048872`

图像输入方式：

HTTP/HTTPS URL："https://example.com/image.png"
Base64 编码："data:image/png;base64,..." —— 参见 scripts/image_edit_base64.py
输入：1-3 张参考图；输出：1-6 张图像（由 n 参数控制）

wanx_generate.py —— Wanx 图像生成

参数说明

参数	说明
`size`	可选值：`1K`、`2K`、`4K`（仅 `wan2.7-image-pro` 支持 4K 高清输出）
`enable_sequential`	系列模式，生成 1 至 12 张风格一致的图像
`thinking_mode`	默认为 `true`，可提升推理质量（会增加延迟）
`n`	普通模式下为 1-4 张，系列模式下为 1-12 张

模型对比

模型	优势
`wan2.7-image-pro`	专业版，支持文本生成图像，最高支持 4K 分辨率
`wan2.7-image`	标准版，生成速度更快

image_understanding.py —— 图像理解功能

使用兼容 OpenAI 的接口调用 DashScope。默认模型为 qwen3.5-plus（通用理解），也可选择 qwen-vl-max（复杂推理场景）。

定价信息

模型	单价（人民币）	备注
qwen-image-2.0-pro	CN price	专业版，最强的文字渲染与真实感表现
qwen-image-edit-max	CN price	专业版，图像生成与编辑融合
qwen-image-2.0	CN price	标准版
qwen-image-edit-plus	CN price	标准编辑功能
wan2.7-image-pro	CN price	Wanx 专业版
wan2.7-image	CN price	Wanx 标准版

新用户在激活 Bailian 后可获得 100 枚免费图像积分（有效期 90 天）。账单查看地址：[https://usercenter2.aliyun.com/finance/expense-center/overview](https://usercenter2.aliyun.com/finance/expense-center/overview)

最佳实践

使用 prompt_extend=True 让模型自动优化提示词
Qwen 系列支持 negative_prompt，Wanx 系列不支持该参数
根据实际需求选择合适的图像尺寸，避免不必要的大图生成
使用 n 参数一次性生成多张图像，便于筛选
在线图片使用 URL，小文件本地图片使用 Base64 编码，大文件推荐使用 file:// 协议

错误处理

脚本内置错误处理逻辑。如遇问题，请参考：[错误码文档](https://help.aliyun.com/zh/model-studio/developer-reference/error-code)

脚本功能一览

脚本	功能	说明
`text_to_image.py`	文本生成图像	根据文字描述生成图像，支持自动下载
`image_edit.py`	图像编辑	支持 URL、本地文件和 Base64 输入方式
`image_edit_base64.py`	Base64 图像编辑	展示 Base64 编码的使用方法
`base64_tool.py`	Base64 工具	命令行工具，用于图像与 Base64 编码互转
`wanx_generate.py`	Wanx 图像生成	使用 `wan2.7-image` 模型进行生成
`image_understanding.py`	图像理解	分析图像内容并回答相关问题

@sdk-team

已收录 5 个 Skill