Alibabacloud Bailian Image Creator

基于阿里云DashScope API的AI图像生成与编辑技能,支持多模型调用与自动化执行。

已扫描
适合谁
设计师与创意工作者、AI内容生产者
不适合谁
无网络环境用户、不熟悉API调用的初学者
国内可用性
需网络配置。可能需要网络配置或第三方服务可访问。
安装难度
新手友好(★☆☆)。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

openclaw skills install @sdk-team/alibabacloud-bailian-image-creator

Skill 说明

命令、参数、文件名以原文为准

AI 图像生成器

基于阿里云 DashScope API 构建的专业级 AI 图像生成技能。

警告:在执行任何图像任务前,必须阅读并遵守“强制规则”部分。违反规则将导致任务失败。

强制规则

首要原则:必须使用现有脚本

**所有图像生成、编辑和理解任务必须且只能通过运行 scripts/ 目录中的现有脚本完成。**

  • 禁止编写自己的 API 调用代码 —— 不得创建新的 Python 脚本来调用 DashScope API。必须使用下方“任务到脚本映射”表中指定的脚本
  • 禁止使用 PIL/Pillow 或其他本地库 进行图像生成或编辑(仅允许用于尺寸验证等辅助操作)
  • 禁止使用第三方 API —— 包括但不限于 Pollinations.ai、Stability.ai、DALL-E、Midjourney
  • 禁止创建模拟/伪脚本 —— 不得以任何方式绕过真实的 API 调用
  • 禁止使用已弃用的模型 —— wanx-v1wanx-v2wan2.6-image 等旧版模型已停止支持
  • 禁止混用 API —— Qwen 模型(qwen-*)只能使用 MultiModalConversation.call(),Wanx 模型(wan2.7-*)只能使用 ImageGeneration.call()
  • 禁止使用 curl 调用 DashScope REST API —— 必须通过提供的脚本调用,不得用 Shell 脚本替代
  • 禁止生成占位/空白图像 —— 不得使用硬编码字节流、空白画布或 PIL 缩放图像冒充 API 生成的图像
  • 禁止在 API 调用失败时谎报成功 —— 必须如实报告失败原因,不得生成虚假的成功报告

任务到脚本映射(唯一执行方式)

根据用户请求关键词,在下表中查找对应脚本。不允许使用其他方法

用户请求关键词脚本API默认模型
Wanx、wan2.7、参考图像 + 生成、风格融合、多图融合、车体涂鸦、虚拟试穿wanx_generate.pyImageGeneration.call()wan2.7-image
4K 高清文生图wanx_generate.pyImageGeneration.call()wan2.7-image-pro
一组连贯的图像、图像系列生成wanx_generate.pyImageGeneration.call()wan2.7-image-pro
文生图、生成图像、画一张图(无参考图像)text_to_image.pyMultiModalConversation.call()qwen-image-2.0-pro
编辑图像(URL 输入)image_edit.pyMultiModalConversation.call()qwen-image-edit-max
编辑图像(本地文件)image_edit_base64.pyMultiModalConversation.call()qwen-image-edit-max
分析/理解图像内容、描述图像image_understanding.pychat.completions.create()qwen3.5-plus

歧义优先级规则(当多个关键词同时匹配时):

  1. 用户提及 “Wanx” 或 “wan2.7” → 直接使用 wanx_generate.py,无论是否包含“生成图像”等词语
  2. 用户提供 参考图像 URL 并请求生成新图像 → 使用 wanx_generate.py(Wanx 支持多图参考输入)
  3. 仅有文字描述,无参考图像 → 使用 text_to_image.py

允许的模型

脚本允许模型
text_to_image.pyqwen-image-2.0-proqwen-image-2.0
wanx_generate.pywan2.7-image-prowan2.7-image
image_edit.py / image_edit_base64.pyqwen-image-edit-maxqwen-image-2.0-proqwen-image-edit-plusqwen-image-edit
image_understanding.pyqwen3.5-plusqwen-vl-maxqwen-vl-plus

API 密钥安全管理

**脚本会自动通过 api_key.py 处理密钥获取。Agent 不应手动提取、设置或传递 API Key 值。**

  1. 密钥获取自动化:脚本内部调用 api_key.py,自动从配置文件或环境变量中获取密钥,或通过 CLI 自动生成。Agent 只需运行脚本命令
  2. 禁止任何形式的密钥硬编码:包括 api_key = "sk-..."export DASHSCOPE_API_KEY="sk-...",以及在 Shell 脚本中赋值
  3. 禁止从 CLI 输出中提取密钥aliyun modelstudio create-api-key 返回的密钥值由 api_key.py 自动保存。Agent 不得将该值写入任何脚本、变量或文件
  4. 禁止在任何输出中暴露密钥:包括生成的脚本、Shell 命令、日志文件(summary.md、task_summary.md、execution_log.md 等),以及终端输出中以 sk- 开头的字符串
  5. 禁止从配置文件读取或打印密钥:不得使用 cat ~/.aliyun/config.jsonjqpython -c 等命令从配置文件中读取并输出 API Key 值
  6. 禁止直接调用 CLI 密钥命令:不得直接运行 aliyun modelstudio create-api-keyaliyun modelstudio list-api-keys。这些命令仅由 api_key.py 内部调用
  7. 任务完成前强制自检:运行 grep -rn "sk-" <output_directory>/ 检查所有输出文件;若发现以 sk- 开头的字符串(不包括 "sk-xxx" 占位符),立即删除受影响文件并重新生成

API 调用结果验证

技能:阿里云百炼图像生成器

版本:0.0.1

分块:2/4

状态检查

  1. 检查状态码:API 响应的 status_code 必须为 200,否则立即中止任务
  2. 检查输出内容:响应必须包含有效的图片 URL(以 http 开头)。若无有效 URL,则视为失败
  3. 禁止虚构结果:不得生成模拟数据、虚假成功报告或占位图片 URL
  4. 禁止模拟操作:不得创建模拟脚本或伪造 API 调用以绕过真实调用
  5. 失败时的正确处理方式

- 输出错误信息(状态码、错误码、错误描述)

- 停止执行后续步骤

- 若为密钥问题,api_key.py 将自动重试创建

- 若重试仍失败,需如实报告真实错误原因,不得隐瞒

输出验证(在报告任务完成前必须执行)

  1. 检查输出文件:确认输出目录中存在图片文件,且文件大小合理(通常大于 10KB)
  2. 密钥泄露扫描:运行 grep -rn "sk-" <output_directory>/ 检查所有输出文件(包括日志、摘要、脚本)。如发现泄露,立即删除并重新生成
  3. 禁止虚假声明:若实际 API 调用失败或未执行,不得在任务总结中声称成功(例如使用勾选标记)
  4. 空白图像检测:若输出图片为纯色、空白或仅为输入图的简单缩放版本,视为任务失败

输出尺寸控制

模型系列尺寸格式支持值
qwen-image-2.0-pro / qwen-image-2.0(文生图)"width*height"1024*1024720*12801280*7201440*720720*1440
qwen-image-edit-* / qwen-image-2.0-pro(编辑类)"width*height"宽度和高度均在 [512, 2048] 范围内,可自由组合
wan2.7-image-pro(文生图)预设层级1K2K4K
wan2.7-image-pro(编辑/系列生成)预设层级1K2K
wan2.7-image预设层级1K2K

映射规则

  1. 用户请求精确像素(如 1280x720)→ 选择 Qwen 系列,设置 size='1280*720'
  2. 用户请求竖屏/横屏 → 使用 Qwen 文生图最接近的固定尺寸(如竖屏 → 720*1280
  3. Wanx 模型 → size 只能为 1K/2K/4K,不可使用像素值

执行流程

步骤 1:安装依赖

pip install -r scripts/requirements.txt

步骤 2:根据“任务-脚本映射”表选择并运行脚本

选择逻辑:首先判断用户是否提及“Wanx”/“wan2.7”或提供参考图片链接 → 若是,使用 wanx_generate.py;否则按映射表中的其他关键词匹配。

API 密钥由脚本自动管理(三级获取顺序:配置文件 → 环境变量 → 自动生成)。无需手动处理密钥。Agent 仅需执行下表中的命令。不得自行编写脚本、设置环境变量或使用 curl 直接调用 API。

场景命令示例
文生图(Qwen)python scripts/text_to_image.py <prompt> [size] [model]python scripts/text_to_image.py '一只橙色猫咪坐在窗台,8K' 1024*1024 qwen-image-2.0-pro
文生图 / 多图融合(Wanx)python scripts/wanx_generate.py <prompt> [ref_image_URLs...]python scripts/wanx_generate.py '将图片2的涂鸦绘制到图片1的车上' url1 url2
图像编辑(URL 输入)python scripts/image_edit.py <instruction> <image_URL1> [URL2] [URL3]python scripts/image_edit.py '将背景改为白色' https://example.com/photo.png
图像编辑(本地文件)python scripts/image_edit_base64.py <instruction> <local_image1> [image2] [image3]python scripts/image_edit_base64.py '将背景改为白色' ./photo.png
图像理解python scripts/image_understanding.py <image_URL> [question]python scripts/image_understanding.py https://example.com/photo.jpg '这张图里有什么?'

步骤 3:返回结果

脚本将输出生成的图片 URL 列表;text_to_image.py 还会自动将图片下载至当前目录。


模型选择指南

条件推荐模型原因
需要准确呈现图像中的文字qwen-image-2.0-proQwen 系列具备最强的文字渲染能力
需要 4K 超高清画质wan2.7-image-pro唯一支持 4K 的 Wanx 专业文生图模型
需要一组风格一致的图像wan2.7-image-pro + enable_sequentialWanx 独有的图像序列生成能力
产品/工业设计编辑qwen-image-edit-max更强的几何推理与人物一致性表现
多图参考 + 组合创作wan2.7-imageWanx 支持灵活的多图参考编辑
图像内容分析/Q&Aqwen3.5-plus通用多模态理解能力,成本较低
复杂视觉推理qwen-vl-max更强的视觉理解能力
成本优先qwen-image-2.0 / wan2.7-image标准版本,价格更低
无特殊要求(默认)qwen-image-2.0-pro整体能力最均衡

提示词设计指南

详细指南请参见 [提示词设计指南](references/prompt-guide.md)

提示词结构公式:[主体描述] + [场景/环境] + [光照/氛围] + [构图/视角] + [艺术风格] + [质量参数]

完整示例

一位30岁的亚洲男性侦探站在东京雨夜的街道上,身穿深灰色风衣,手持黑色雨伞,霓虹红蓝灯光映照在脸上,雨滴沿着伞边缘滑落,地面积水反射出璀璨的城市灯光,伦勃朗式布光,体积雾效,电影级构图,35mm变形镜头,胶片颗粒感,情绪化氛围,高细节,超写实,8K

负面提示模板(Qwen 系列支持 negative_prompt,Wanx 系列不支持):

低质量,模糊,像素化,过度饱和,手部畸形,多余手指,面部扭曲,诡异谷效应,文字,水印,logo,签名,裁切,超出画面范围,最差质量

参考信息

环境与依赖

版本约束用途
dashscope==1.25.16文本生成图像、图像编辑、Wanx 生成
openai==2.23.0图像理解(兼容 OpenAI 接口)

API 密钥配置

此技能通过 scripts/api_key.py 管理 DashScope API 密钥,可自动验证密钥格式(识别无效密钥如 sk-sp-)。

获取优先级~/.aliyun/config.json > 系统环境变量 DASHSCOPE_API_KEY > 通过阿里云 CLI 自动生成

方法一:阿里云 CLI 配置文件(推荐)

~/.aliyun/config.json 中当前配置文件下添加 dashscope 字段:

{
  "current": "default",
  "profiles": [
    {
      "name": "default",
      "mode": "AK",
      "access_key_id": "...",
      "access_key_secret": "...",
      "dashscope": {
        "api_key": "sk-xxx",
        "api_key_id": "4359606"
      }
    }
  ]
}

方法二:系统环境变量

export DASHSCOPE_API_KEY=sk-xxx
项目说明
密钥格式sk-xxx(标准 DashScope API 密钥)
不支持sk-sp-xxx(编码计划密钥,不支持图像生成)
获取密钥https://help.aliyun.com/zh/model-studio/get-api-key
安全建议永远不要硬编码;使用 from api_key import get_api_key永远不要将完整的 API 密钥输出到终端、日志或任何文件中

阿里云 CLI 配置(API 密钥自动生成/删除)

scripts/api_key.py 通过 aliyun modelstudio 命令实现 API 密钥的创建与删除。使用前请完成以下设置:

# 启用 AI 模式(允许 Agent 调用 CLI)
aliyun configure ai-mode enable

# 设置 User-Agent
aliyun configure ai-mode set-user-agent --user-agent "AlibabaCloud-Agent-Skills/alibabacloud-bailian-image-creator"

# 更新插件至最新版本
aliyun plugin update

# 安装 ModelStudio 插件(如未安装)
aliyun plugin install --names aliyun-cli-modelstudio --enable-pre

# 任务完成后禁用 AI 模式
aliyun configure ai-mode disable
命令用途调用位置
aliyun modelstudio list-workspaces获取 Bailian 工作区 IDapi_key.py: generate_api_key()
aliyun modelstudio create-api-key创建 DashScope API 密钥api_key.py: generate_api_key()
aliyun modelstudio list-api-keys列出现有 API 密钥(用于限额回收)api_key.py: generate_api_key()
aliyun modelstudio delete-api-key删除云端 API 密钥api_key.py: delete_api_key() / generate_api_key()

区域与 API 地址

区域DashScope APIOpenAI 兼容模式
北京(中国)https://dashscope.aliyuncs.com/api/v1https://dashscope.aliyuncs.com/compatible-mode/v1
新加坡https://dashscope-intl.aliyuncs.com/api/v1https://dashscope-intl.aliyuncs.com/compatible-mode/v1
弗吉尼亚(美国)https://dashscope-us.aliyuncs.com/api/v1https://dashscope-us.aliyuncs.com/compatible-mode/v1

注意:API 密钥在不同区域之间不可通用。

脚本参数参考

text_to_image.py —— 文本生成图像(Qwen 系列)

参数说明
size仅支持 1024*1024720*12801280*7201440*720720*1440
prompt_extend启用时自动优化提示词
negative_prompt用于避免生成不良内容的负面提示
watermark是否添加水印

image_edit.py / image_edit_base64.py —— 图像编辑(Qwen 系列)

参数类型说明
nint输出图像数量,1-6(qwen-image-edit 固定为 1)
sizestr输出分辨率,格式为 "width*height",范围 [512, 2048]
negative_promptstr负面提示
prompt_extendbool智能提示词重写,默认为真
watermarkbool是否添加水印,默认为假
seedint随机种子 [0, 2147483647],用于结果复现

编辑模型对比

模型优势使用场景
qwen-image-edit-max强大的几何推理能力,角色一致性好产品设计、精准编辑
qwen-image-2.0-pro强大的文本渲染能力,真实感强通用编辑、文字编辑
qwen-image-edit-plus支持多图输出和自定义分辨率通用编辑
qwen-image-edit基础版,固定单图输出简单编辑

常见分辨率推荐

宽高比推荐分辨率
1:11024*10241536*1536
2:3768*11521024*1536
3:21152*7681536*1024
3:4960*12801080*1440
4:31280*9601440*1080
9:16720*12801080*1920
16:91280*7201920*1080
21:91344*5762048*872

图像输入方式

  • HTTP/HTTPS URL"https://example.com/image.png"
  • Base64 编码"data:image/png;base64,..." —— 参见 scripts/image_edit_base64.py
  • 输入:1-3 张参考图;输出:1-6 张图像(由 n 参数控制)

wanx_generate.py —— Wanx 图像生成

参数说明

参数说明
size可选值:1K2K4K(仅 wan2.7-image-pro 支持 4K 高清输出)
enable_sequential系列模式,生成 1 至 12 张风格一致的图像
thinking_mode默认为 true,可提升推理质量(会增加延迟)
n普通模式下为 1-4 张,系列模式下为 1-12 张

模型对比

模型优势
wan2.7-image-pro专业版,支持文本生成图像,最高支持 4K 分辨率
wan2.7-image标准版,生成速度更快

image_understanding.py —— 图像理解功能

使用兼容 OpenAI 的接口调用 DashScope。默认模型为 qwen3.5-plus(通用理解),也可选择 qwen-vl-max(复杂推理场景)。


定价信息

模型单价(人民币)备注
qwen-image-2.0-proCN price专业版,最强的文字渲染与真实感表现
qwen-image-edit-maxCN price专业版,图像生成与编辑融合
qwen-image-2.0CN price标准版
qwen-image-edit-plusCN price标准编辑功能
wan2.7-image-proCN priceWanx 专业版
wan2.7-imageCN priceWanx 标准版

新用户在激活 Bailian 后可获得 100 枚免费图像积分(有效期 90 天)。账单查看地址:[https://usercenter2.aliyun.com/finance/expense-center/overview](https://usercenter2.aliyun.com/finance/expense-center/overview)


最佳实践

  1. 使用 prompt_extend=True 让模型自动优化提示词
  2. Qwen 系列支持 negative_prompt,Wanx 系列不支持该参数
  3. 根据实际需求选择合适的图像尺寸,避免不必要的大图生成
  4. 使用 n 参数一次性生成多张图像,便于筛选
  5. 在线图片使用 URL,小文件本地图片使用 Base64 编码,大文件推荐使用 file:// 协议

错误处理

脚本内置错误处理逻辑。如遇问题,请参考:[错误码文档](https://help.aliyun.com/zh/model-studio/developer-reference/error-code)


相关资源

  • [提示词设计指南](references/prompt-guide.md) —— 专业提示词构建方法
  • [API 文档](references/api-docs.md) —— 详细参数说明
  • [模型列表](references/models.md) —— 支持的模型及其功能
  • [错误码参考](references/error-codes.md) —— 常见错误及解决方案
  • [示例脚本](scripts/) —— 可直接使用的代码示例

脚本功能一览

脚本功能说明
text_to_image.py文本生成图像根据文字描述生成图像,支持自动下载
image_edit.py图像编辑支持 URL、本地文件和 Base64 输入方式
image_edit_base64.pyBase64 图像编辑展示 Base64 编码的使用方法
base64_tool.pyBase64 工具命令行工具,用于图像与 Base64 编码互转
wanx_generate.pyWanx 图像生成使用 wan2.7-image 模型进行生成
image_understanding.py图像理解分析图像内容并回答相关问题
ST
@sdk-team

已收录 5 个 Skill

相关推荐