Skill for Tencent Cloud HunYuan Text-to-Image Generation (混元生图). Provides AI image generation from text prompts using the HunYuan large model. Supports refer...
本 Skill 提供混元生图能力,基于腾讯混元大模型,将文本描述快速生成 AI 图像。支持垫图引导、自定义分辨率和 prompt 改写优化。
| 场景 | 脚本 | 说明 |
|---|---|---|
| 一站式生图 | main.py | 提交任务 + 自动轮询,推荐使用 |
| 仅提交任务 | submit_job.py | 仅提交,返回 JobId |
| 仅查询任务 | query_job.py | 根据 JobId 查询/轮询结果 |
用户要求生成图片 → main.py(一站式,最简单推荐)
用户要求提交后自行查询 → submit_job.py + query_job.py(分步操作)
用户已有 JobId 要查结果 → query_job.py(单独查询)
如果用户未指定使用哪种模式,Agent 应默认使用
main.py一站式脚本。
本 Skill 需要腾讯云 API 密钥才能正常工作。
Linux / macOS:
export TENCENTCLOUD_SECRET_ID="你的SecretId"
export TENCENTCLOUD_SECRET_KEY="你的SecretKey"
如需持久化:
echo 'export TENCENTCLOUD_SECRET_ID="你的SecretId"' >> ~/.zshrc
echo 'export TENCENTCLOUD_SECRET_KEY="你的SecretKey"' >> ~/.zshrc
source ~/.zshrc
Windows (PowerShell):
$env:TENCENTCLOUD_SECRET_ID = "你的SecretId"
$env:TENCENTCLOUD_SECRET_KEY = "你的SecretKey"
⚠️ 安全提示:切勿将密钥硬编码在代码中。
⚠️ 本节是 Agent(AI 模型)的核心执行规范。当用户请求生成图片时,Agent 必须严格按照以下步骤自主执行,无需询问用户确认。
main.py(一站式),除非用户明确要求分步操作。main.py(推荐)适用场景:用户请求生成图片,自动提交并等待结果
python3 <SKILL_DIR>/scripts/main.py "文本描述"
可选参数:
--images <URL1> <URL2> ...:垫图 URL 列表,最多 3 张(jpg/jpeg/png/webp,base64 后 ≤ 10MB)--resolution <W:H>:分辨率,默认 1024:1024。宽高在 [512, 2048],面积 ≤ 1024×1024--seed <N>:随机种子(正整数,不传则随机)--revise <0|1>:Prompt 改写,默认开启(1)。关闭(0)需自行改写 prompt,否则影响效果。改写增加约 20s--no-poll:仅提交任务不等待结果(返回 JobId)输出示例:
{
"job_id": "job-xxxxxxxxxxxx",
"status": "success",
"result_image": "https://aiart-xxx.cos.ap-guangzhou.myqcloud.com/xxx.png",
"revised_prompt": "一只可爱的橘色猫咪在充满鲜花的花园里愉快地玩耍,阳光明媚,色彩鲜艳"
}
注意:生成图 URL 有效期为 1 小时,请及时保存。普通生图通常 10~30 秒完成,开启 Revise 会额外增加约 20s。
submit_job.py适用场景:仅需提交任务获取 JobId,后续手动查询
python3 <SKILL_DIR>/scripts/submit_job.py "文本描述"
可选参数:与 main.py 相同(除 --poll-interval、--max-poll-time、--no-poll 外)
输出示例:
{
"job_id": "job-xxxxxxxxxxxx",
"request_id": "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx",
"message": "Task submitted successfully. Use query_job.py to poll for results."
}
query_job.py适用场景:根据 JobId 查询任务状态和结果
python3 <SKILL_DIR>/scripts/query_job.py "job-xxxxxxxxxxxx"
可选参数:
--poll-interval <N>:轮询间隔秒数,默认 5--max-poll-time <N>:最大轮询时间秒数,默认 300--no-poll:仅查询一次,不轮询输出示例:
{
"job_id": "job-xxxxxxxxxxxx",
"status": "success",
"result_image": "https://aiart-xxx.cos.ap-guangzhou.myqcloud.com/xxx.png"
}
# 基础生图
python3 /path/to/scripts/main.py "一只可爱的猫咪在花园里玩耍"
# 带垫图引导的生图
python3 /path/to/scripts/main.py --images "https://example.com/ref1.jpg" "https://example.com/ref2.png" "参考这些图片风格,画一幅山水画"
# 自定义分辨率(横版)
python3 /path/to/scripts/main.py --resolution 1024:768 "壮丽的山水画"
# 固定种子(可复现)
python3 /path/to/scripts/main.py --seed 42 "星空下的城堡"
# 关闭 prompt 改写(不推荐,除非自行改写 prompt)
python3 /path/to/scripts/main.py --revise 0 "详细描述的prompt内容..."
# 仅提交任务
python3 /path/to/scripts/main.py --no-poll "一幅水墨画"
# 查询已有任务
python3 /path/to/scripts/query_job.py "job-xxxxxxxxxxxx"
# 通过 stdin 传入 JSON 参数
echo '{"prompt":"一只猫","images":["https://xxx.jpg"],"resolution":"1024:1024"}' | python3 /path/to/scripts/main.py --stdin
| 约束 | 说明 |
|---|---|
| 宽度范围 | [512, 2048] 像素 |
| 高度范围 | [512, 2048] 像素 |
| 面积上限 | 宽 × 高 ≤ 1024 × 1024 = 1,048,576 像素 |
| 默认值 | 1024:1024 |
常用组合:
| 分辨率 | 比例 | 说明 |
|---|---|---|
| 1024:1024 | 1:1 | 默认方图 |
| 768:1024 | 3:4 | 竖版 |
| 1024:768 | 4:3 | 横版 |
| 512:1024 | 1:2 | 竖版长图 |
| 1024:512 | 2:1 | 横版长图 |
result_image URL 并返回给用户详细的参数说明、错误码等信息请参阅 references/ 目录下的文档:
scripts/main.py — 一站式生图,提交任务 + 自动轮询等待结果scripts/submit_job.py — 仅提交生图任务,返回 JobIdscripts/query_job.py — 根据 JobId 查询/轮询任务状态和结果tencentcloud-sdk-python(腾讯云 SDK)安装依赖(可选 - 脚本会自动安装):
pip install tencentcloud-sdk-python
ZIP package — ready to use