seedream(doubao)-image-generation

通过火山引擎豆包API实现文本/图像生成,支持多种分辨率与格式。

已扫描
适合谁
设计师、内容创作者
不适合谁
无网络环境用户、无需图像生成的普通办公人员
国内可用性
需网络配置。可能需要网络配置或第三方服务可访问。
安装难度
新手友好(★☆☆)。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

openclaw skills install @cp7553479/seedream-image-generation

Skill 说明

命令、参数、文件名以原文为准

Seedream 图像生成技能

此技能提供调用火山引擎 Ark 大模型服务平台图像生成模型(Seedream)的方法。

选择运行环境

脚本提供了 Python 和 JavaScript 两种实现:

  • 如果您的运行环境主要是 Node.js/TypeScript 或 Web 模块,请使用 seedream.js
  • 如果您的运行环境涉及复杂数据分析、批量调度,或为纯 Python 环境,请使用 seedream.py

支持的模型参数(模型 ID / 端点 ID)

调用时,model 参数需为 Ark 控制台中部署的端点 ID(例如:ep-202X...),该端点必须基于以下基础图像生成模型之一:

  • doubao-seedream-5-0-260128
  • doubao-seedream-4-5-251128
  • doubao-seedream-4-0-250828

脚本参数

调用图像生成功能时,需传入特定参数以控制生成行为。可用参数如下:

  • model *(字符串,可选)*:对应模型的端点 ID。默认值为 doubao-seedream-5-0-260128
  • prompt *(字符串,必填)*:用于生成图像的文本描述。
  • image *(字符串或字符串列表,可选)*:本地图像路径或图像路径列表,用于图像到图像生成。脚本会读取本地文件,将其转换为 base64 编码,并作为请求的 image 字段发送。
  • watermark *(布尔值,可选)*:是否添加火山引擎 AI 水印。未提供时默认为 false
  • optimize_prompt_options *(对象,可选)*:配置自动提示优化选项。格式为 JSON 对象。例如:{"mode": "standard"}
  • tools *(对象列表,可选)*:模型能力选项,格式为 JSON。示例:[{"type": "web_search"}]
  • output_format *(字符串,可选)*:输出图像格式。支持选项包括 pngjpeg
  • sequential_image_generation *(字符串,可选)*:连续图像生成策略(例如:"auto")。
  • download_dir *(字符串,可选)*:保存生成图像的本地目录。若不提供,则不会本地下载图像,仅返回 API 响应结果。

推荐的宽高设置

分辨率宽高比尺寸
2K1:12048x2048
4:32304x1728
3:41728x2304
16:92848x1600
9:161600x2848
3:22496x1664
2:31664x2496
21:93136x1344
3K1:13072x3072
4:33456x2592
3:42592x3456
16:94096x2304
9:162304x4096
2:32496x3744
3:23744x2496
21:94704x2016

使用示例

Python 示例:

cd <current_skill_dir>
python3 seedream.py \
  --prompt "一只在阳光下晒太阳的可爱橘猫" \
  --model "ep-xxxxx..." \
  --size "1024x1024" \
  --watermark "false" \
  --output_format "png"

Node.js 示例:

cd <current_skill_dir>
node seedream.js \
  --prompt "一只在阳光下晒太阳的可爱橘猫" \
  --model "ep-xxxxx..." \
  --size "1024x1024" \
  --watermark "false" \
  --output_format "png"

图像到图像生成示例(Python):

cd <current_skill_dir>
python3 seedream.py \
  --prompt "将这张产品照片转为干净白底的电商图片" \
  --image "/path/to/source.png" \
  --model "ep-xxxxx..."

高级示例(含工具与提示优化,Python):

cd <current_skill_dir>
python3 seedream.py \
  --prompt "一个未来感十足的城市景观" \
  --model "ep-xxxxx..." \
  --optimize_prompt_options '{"mode": "standard"}' \
  --tools '[{"type": "web_search"}]'

如需更详细的 API 文档,请访问:[https://www.volcengine.com/docs/82379/1541523?lang=zh](https://www.volcengine.com/docs/82379/1541523?lang=zh)

如需查看完整的模型 ID 列表或确认最新模型 ID,请访问:[https://www.volcengine.com/docs/82379/1330310?lang=zh#36969059](https://www.volcengine.com/docs/82379/1330310?lang=zh#36969059),并更新本文件 seedream-image-generation/SKILL.md 中的“支持的模型参数”部分。

C
@cp7553479

已收录 1 个 Skill

相关推荐