Social Poster Hardened
通过 VibePost API 发布内容至社交媒体,支持 Twitter/X 等平台。
基于阿里云DashScope API的AI图像生成与编辑技能,支持多模型调用与自动化执行。
openclaw skills install @sdk-team/alibabacloud-bailian-image-creator命令、参数、文件名以原文为准
基于阿里云 DashScope API 构建的专业级 AI 图像生成技能。
警告:在执行任何图像任务前,必须阅读并遵守“强制规则”部分。违反规则将导致任务失败。
**所有图像生成、编辑和理解任务必须且只能通过运行 scripts/ 目录中的现有脚本完成。**
wanx-v1、wanx-v2、wan2.6-image 等旧版模型已停止支持MultiModalConversation.call(),Wanx 模型(wan2.7-*)只能使用 ImageGeneration.call()根据用户请求关键词,在下表中查找对应脚本。不允许使用其他方法:
| 用户请求关键词 | 脚本 | API | 默认模型 |
|---|---|---|---|
| Wanx、wan2.7、参考图像 + 生成、风格融合、多图融合、车体涂鸦、虚拟试穿 | wanx_generate.py | ImageGeneration.call() | wan2.7-image |
| 4K 高清文生图 | wanx_generate.py | ImageGeneration.call() | wan2.7-image-pro |
| 一组连贯的图像、图像系列生成 | wanx_generate.py | ImageGeneration.call() | wan2.7-image-pro |
| 文生图、生成图像、画一张图(无参考图像) | text_to_image.py | MultiModalConversation.call() | qwen-image-2.0-pro |
| 编辑图像(URL 输入) | image_edit.py | MultiModalConversation.call() | qwen-image-edit-max |
| 编辑图像(本地文件) | image_edit_base64.py | MultiModalConversation.call() | qwen-image-edit-max |
| 分析/理解图像内容、描述图像 | image_understanding.py | chat.completions.create() | qwen3.5-plus |
歧义优先级规则(当多个关键词同时匹配时):
wanx_generate.py,无论是否包含“生成图像”等词语wanx_generate.py(Wanx 支持多图参考输入)text_to_image.py允许的模型:
| 脚本 | 允许模型 |
|---|---|
text_to_image.py | qwen-image-2.0-pro、qwen-image-2.0 |
wanx_generate.py | wan2.7-image-pro、wan2.7-image |
image_edit.py / image_edit_base64.py | qwen-image-edit-max、qwen-image-2.0-pro、qwen-image-edit-plus、qwen-image-edit |
image_understanding.py | qwen3.5-plus、qwen-vl-max、qwen-vl-plus |
**脚本会自动通过 api_key.py 处理密钥获取。Agent 不应手动提取、设置或传递 API Key 值。**
api_key.py,自动从配置文件或环境变量中获取密钥,或通过 CLI 自动生成。Agent 只需运行脚本命令api_key = "sk-..."、export DASHSCOPE_API_KEY="sk-...",以及在 Shell 脚本中赋值aliyun modelstudio create-api-key 返回的密钥值由 api_key.py 自动保存。Agent 不得将该值写入任何脚本、变量或文件sk- 开头的字符串cat ~/.aliyun/config.json、jq、python -c 等命令从配置文件中读取并输出 API Key 值aliyun modelstudio create-api-key 或 aliyun modelstudio list-api-keys。这些命令仅由 api_key.py 内部调用grep -rn "sk-" <output_directory>/ 检查所有输出文件;若发现以 sk- 开头的字符串(不包括 "sk-xxx" 占位符),立即删除受影响文件并重新生成技能:阿里云百炼图像生成器
版本:0.0.1
分块:2/4
status_code 必须为 200,否则立即中止任务http 开头)。若无有效 URL,则视为失败- 输出错误信息(状态码、错误码、错误描述)
- 停止执行后续步骤
- 若为密钥问题,api_key.py 将自动重试创建
- 若重试仍失败,需如实报告真实错误原因,不得隐瞒
grep -rn "sk-" <output_directory>/ 检查所有输出文件(包括日志、摘要、脚本)。如发现泄露,立即删除并重新生成| 模型系列 | 尺寸格式 | 支持值 |
|---|---|---|
qwen-image-2.0-pro / qwen-image-2.0(文生图) | "width*height" | 1024*1024、720*1280、1280*720、1440*720、720*1440 |
qwen-image-edit-* / qwen-image-2.0-pro(编辑类) | "width*height" | 宽度和高度均在 [512, 2048] 范围内,可自由组合 |
wan2.7-image-pro(文生图) | 预设层级 | 1K、2K、4K |
wan2.7-image-pro(编辑/系列生成) | 预设层级 | 1K、2K |
wan2.7-image | 预设层级 | 1K、2K |
映射规则:
1280x720)→ 选择 Qwen 系列,设置 size='1280*720'720*1280)size 只能为 1K/2K/4K,不可使用像素值pip install -r scripts/requirements.txt选择逻辑:首先判断用户是否提及“Wanx”/“wan2.7”或提供参考图片链接 → 若是,使用 wanx_generate.py;否则按映射表中的其他关键词匹配。
API 密钥由脚本自动管理(三级获取顺序:配置文件 → 环境变量 → 自动生成)。无需手动处理密钥。Agent 仅需执行下表中的命令。不得自行编写脚本、设置环境变量或使用 curl 直接调用 API。
| 场景 | 命令 | 示例 |
|---|---|---|
| 文生图(Qwen) | python scripts/text_to_image.py <prompt> [size] [model] | python scripts/text_to_image.py '一只橙色猫咪坐在窗台,8K' 1024*1024 qwen-image-2.0-pro |
| 文生图 / 多图融合(Wanx) | python scripts/wanx_generate.py <prompt> [ref_image_URLs...] | python scripts/wanx_generate.py '将图片2的涂鸦绘制到图片1的车上' url1 url2 |
| 图像编辑(URL 输入) | python scripts/image_edit.py <instruction> <image_URL1> [URL2] [URL3] | python scripts/image_edit.py '将背景改为白色' https://example.com/photo.png |
| 图像编辑(本地文件) | python scripts/image_edit_base64.py <instruction> <local_image1> [image2] [image3] | python scripts/image_edit_base64.py '将背景改为白色' ./photo.png |
| 图像理解 | python scripts/image_understanding.py <image_URL> [question] | python scripts/image_understanding.py https://example.com/photo.jpg '这张图里有什么?' |
脚本将输出生成的图片 URL 列表;text_to_image.py 还会自动将图片下载至当前目录。
| 条件 | 推荐模型 | 原因 |
|---|---|---|
| 需要准确呈现图像中的文字 | qwen-image-2.0-pro | Qwen 系列具备最强的文字渲染能力 |
| 需要 4K 超高清画质 | wan2.7-image-pro | 唯一支持 4K 的 Wanx 专业文生图模型 |
| 需要一组风格一致的图像 | wan2.7-image-pro + enable_sequential | Wanx 独有的图像序列生成能力 |
| 产品/工业设计编辑 | qwen-image-edit-max | 更强的几何推理与人物一致性表现 |
| 多图参考 + 组合创作 | wan2.7-image | Wanx 支持灵活的多图参考编辑 |
| 图像内容分析/Q&A | qwen3.5-plus | 通用多模态理解能力,成本较低 |
| 复杂视觉推理 | qwen-vl-max | 更强的视觉理解能力 |
| 成本优先 | qwen-image-2.0 / wan2.7-image | 标准版本,价格更低 |
| 无特殊要求(默认) | qwen-image-2.0-pro | 整体能力最均衡 |
详细指南请参见 [提示词设计指南](references/prompt-guide.md)
提示词结构公式:[主体描述] + [场景/环境] + [光照/氛围] + [构图/视角] + [艺术风格] + [质量参数]
完整示例:
一位30岁的亚洲男性侦探站在东京雨夜的街道上,身穿深灰色风衣,手持黑色雨伞,霓虹红蓝灯光映照在脸上,雨滴沿着伞边缘滑落,地面积水反射出璀璨的城市灯光,伦勃朗式布光,体积雾效,电影级构图,35mm变形镜头,胶片颗粒感,情绪化氛围,高细节,超写实,8K负面提示模板(Qwen 系列支持 negative_prompt,Wanx 系列不支持):
低质量,模糊,像素化,过度饱和,手部畸形,多余手指,面部扭曲,诡异谷效应,文字,水印,logo,签名,裁切,超出画面范围,最差质量| 包 | 版本约束 | 用途 |
|---|---|---|
dashscope | ==1.25.16 | 文本生成图像、图像编辑、Wanx 生成 |
openai | ==2.23.0 | 图像理解(兼容 OpenAI 接口) |
此技能通过 scripts/api_key.py 管理 DashScope API 密钥,可自动验证密钥格式(识别无效密钥如 sk-sp-)。
获取优先级:~/.aliyun/config.json > 系统环境变量 DASHSCOPE_API_KEY > 通过阿里云 CLI 自动生成
方法一:阿里云 CLI 配置文件(推荐)
在 ~/.aliyun/config.json 中当前配置文件下添加 dashscope 字段:
{
"current": "default",
"profiles": [
{
"name": "default",
"mode": "AK",
"access_key_id": "...",
"access_key_secret": "...",
"dashscope": {
"api_key": "sk-xxx",
"api_key_id": "4359606"
}
}
]
}方法二:系统环境变量
export DASHSCOPE_API_KEY=sk-xxx| 项目 | 说明 |
|---|---|
| 密钥格式 | sk-xxx(标准 DashScope API 密钥) |
| 不支持 | sk-sp-xxx(编码计划密钥,不支持图像生成) |
| 获取密钥 | https://help.aliyun.com/zh/model-studio/get-api-key |
| 安全建议 | 永远不要硬编码;使用 from api_key import get_api_key;永远不要将完整的 API 密钥输出到终端、日志或任何文件中 |
scripts/api_key.py 通过 aliyun modelstudio 命令实现 API 密钥的创建与删除。使用前请完成以下设置:
# 启用 AI 模式(允许 Agent 调用 CLI)
aliyun configure ai-mode enable
# 设置 User-Agent
aliyun configure ai-mode set-user-agent --user-agent "AlibabaCloud-Agent-Skills/alibabacloud-bailian-image-creator"
# 更新插件至最新版本
aliyun plugin update
# 安装 ModelStudio 插件(如未安装)
aliyun plugin install --names aliyun-cli-modelstudio --enable-pre
# 任务完成后禁用 AI 模式
aliyun configure ai-mode disable| 命令 | 用途 | 调用位置 |
|---|---|---|
aliyun modelstudio list-workspaces | 获取 Bailian 工作区 ID | api_key.py: generate_api_key() |
aliyun modelstudio create-api-key | 创建 DashScope API 密钥 | api_key.py: generate_api_key() |
aliyun modelstudio list-api-keys | 列出现有 API 密钥(用于限额回收) | api_key.py: generate_api_key() |
aliyun modelstudio delete-api-key | 删除云端 API 密钥 | api_key.py: delete_api_key() / generate_api_key() |
| 区域 | DashScope API | OpenAI 兼容模式 |
|---|---|---|
| 北京(中国) | https://dashscope.aliyuncs.com/api/v1 | https://dashscope.aliyuncs.com/compatible-mode/v1 |
| 新加坡 | https://dashscope-intl.aliyuncs.com/api/v1 | https://dashscope-intl.aliyuncs.com/compatible-mode/v1 |
| 弗吉尼亚(美国) | https://dashscope-us.aliyuncs.com/api/v1 | https://dashscope-us.aliyuncs.com/compatible-mode/v1 |
注意:API 密钥在不同区域之间不可通用。
| 参数 | 说明 |
|---|---|
size | 仅支持 1024*1024、720*1280、1280*720、1440*720、720*1440 |
prompt_extend | 启用时自动优化提示词 |
negative_prompt | 用于避免生成不良内容的负面提示 |
watermark | 是否添加水印 |
| 参数 | 类型 | 说明 |
|---|---|---|
n | int | 输出图像数量,1-6(qwen-image-edit 固定为 1) |
size | str | 输出分辨率,格式为 "width*height",范围 [512, 2048] |
negative_prompt | str | 负面提示 |
prompt_extend | bool | 智能提示词重写,默认为真 |
watermark | bool | 是否添加水印,默认为假 |
seed | int | 随机种子 [0, 2147483647],用于结果复现 |
编辑模型对比:
| 模型 | 优势 | 使用场景 |
|---|---|---|
qwen-image-edit-max | 强大的几何推理能力,角色一致性好 | 产品设计、精准编辑 |
qwen-image-2.0-pro | 强大的文本渲染能力,真实感强 | 通用编辑、文字编辑 |
qwen-image-edit-plus | 支持多图输出和自定义分辨率 | 通用编辑 |
qwen-image-edit | 基础版,固定单图输出 | 简单编辑 |
常见分辨率推荐:
| 宽高比 | 推荐分辨率 |
|---|---|
| 1:1 | 1024*1024、1536*1536 |
| 2:3 | 768*1152、1024*1536 |
| 3:2 | 1152*768、1536*1024 |
| 3:4 | 960*1280、1080*1440 |
| 4:3 | 1280*960、1440*1080 |
| 9:16 | 720*1280、1080*1920 |
| 16:9 | 1280*720、1920*1080 |
| 21:9 | 1344*576、2048*872 |
图像输入方式:
"https://example.com/image.png""data:image/png;base64,..." —— 参见 scripts/image_edit_base64.pyn 参数控制)| 参数 | 说明 |
|---|---|
size | 可选值:1K、2K、4K(仅 wan2.7-image-pro 支持 4K 高清输出) |
enable_sequential | 系列模式,生成 1 至 12 张风格一致的图像 |
thinking_mode | 默认为 true,可提升推理质量(会增加延迟) |
n | 普通模式下为 1-4 张,系列模式下为 1-12 张 |
| 模型 | 优势 |
|---|---|
wan2.7-image-pro | 专业版,支持文本生成图像,最高支持 4K 分辨率 |
wan2.7-image | 标准版,生成速度更快 |
使用兼容 OpenAI 的接口调用 DashScope。默认模型为 qwen3.5-plus(通用理解),也可选择 qwen-vl-max(复杂推理场景)。
| 模型 | 单价(人民币) | 备注 |
|---|---|---|
| qwen-image-2.0-pro | CN price | 专业版,最强的文字渲染与真实感表现 |
| qwen-image-edit-max | CN price | 专业版,图像生成与编辑融合 |
| qwen-image-2.0 | CN price | 标准版 |
| qwen-image-edit-plus | CN price | 标准编辑功能 |
| wan2.7-image-pro | CN price | Wanx 专业版 |
| wan2.7-image | CN price | Wanx 标准版 |
新用户在激活 Bailian 后可获得 100 枚免费图像积分(有效期 90 天)。账单查看地址:[https://usercenter2.aliyun.com/finance/expense-center/overview](https://usercenter2.aliyun.com/finance/expense-center/overview)
prompt_extend=True 让模型自动优化提示词negative_prompt,Wanx 系列不支持该参数n 参数一次性生成多张图像,便于筛选file:// 协议脚本内置错误处理逻辑。如遇问题,请参考:[错误码文档](https://help.aliyun.com/zh/model-studio/developer-reference/error-code)
| 脚本 | 功能 | 说明 |
|---|---|---|
text_to_image.py | 文本生成图像 | 根据文字描述生成图像,支持自动下载 |
image_edit.py | 图像编辑 | 支持 URL、本地文件和 Base64 输入方式 |
image_edit_base64.py | Base64 图像编辑 | 展示 Base64 编码的使用方法 |
base64_tool.py | Base64 工具 | 命令行工具,用于图像与 Base64 编码互转 |
wanx_generate.py | Wanx 图像生成 | 使用 wan2.7-image 模型进行生成 |
image_understanding.py | 图像理解 | 分析图像内容并回答相关问题 |
已收录 5 个 Skill