image-gen

使用 AI 生成图片，支持多种模型和风格。Use when user wants to 生成图片, 画图, 创建图像, AI绘图, 生成一张图, generate image, create image, draw picture, AI art, 编辑图片, 修改图片, edit image, modify image.

Skill file

Preview skill file↓↑

---
name: image-gen
description: 使用 AI 生成图片，支持多种模型和风格。Use when user wants to 生成图片, 画图, 创建图像, AI绘图, 生成一张图, generate image, create image, draw picture, AI art, 编辑图片, 修改图片, edit image, modify image.
---

# Image Generator

使用 AI 生成图片，支持多种模型和自定义选项。也支持传入图片进行二次编辑。

## Prerequisites

1. `MAX_API_KEY` 环境变量（Max 自动注入）
2. Bun 1.0+（Max v0.0.27+ 内置，无需额外安装）

## Instructions

你是一个 AI 图片生成助手。请按以下步骤操作：

### Step 1: 检查环境变量

首先验证 `MAX_API_KEY` 是否已设置：

```bash
[ -n "$MAX_API_KEY" ] && echo "API_KEY_SET" || echo "API_KEY_NOT_SET"
```

如果未设置，告诉用户：「请在 Max 设置中配置 Max API Key。」

### Step 2: 检查 Bun 安装

```bash
which bun && bun --version || echo "NOT_INSTALLED"
```

Bun 已内置于 Max 中，通常不需要额外安装。如果未找到，告诉用户重启 Max 应用。

### Step 3: 收集用户需求

**⚠️ 必须：使用 AskUserQuestion 工具收集用户的图片生成需求。不要跳过这一步。**

使用 AskUserQuestion 工具收集以下信息：

1. **输入图片（可选）**：是否基于现有图片进行编辑
   - 选项：
     - "不需要 - 纯文本生成新图片 (Recommended)"
     - "有图片 - 我想编辑一张现有图片"
   - 如果用户选择编辑图片，询问图片路径

2. **图片描述（Prompt）**：让用户描述想要生成/编辑的图片
   - 让用户手动输入详细描述
   - 如果是编辑模式，提示用户描述想要的修改效果
   - 提示用户：描述越详细，生成效果越好

3. **模型选择**：选择使用哪个 AI 模型
   - 选项：
     - "Gemini 2.5 Flash Image - Google 图片生成模型 (Recommended)"
     - "Seedream 4.5 - 字节跳动高质量模型"

4. **图片比例**：选择输出比例
   - 选项：
     - "1:1 - 正方形 (Recommended)"
     - "4:3 - 横向"
     - "3:4 - 纵向"
     - "16:9 - 横向宽屏"
     - "9:16 - 纵向竖屏"

5. **生成数量**：生成几张图片？
   - 选项：
     - "1 张 (Recommended)"
     - "2 张"
     - "4 张"

6. **保存位置**：图片保存到哪里？
   - 建议默认：当前目录，文件名为 `generated_image_时间戳.png`
   - 让用户可以自定义路径

### Step 4: 执行脚本

使用 skill 目录下的 `image-gen.js` 脚本：

```bash
bun /path/to/skills/image-gen/image-gen.js "MODEL" "PROMPT" "ASPECT_RATIO" NUM_IMAGES "OUTPUT_DIR" "INPUT_IMAGE"
```

参数说明：
- MODEL: gemini-pro / seedream
- PROMPT: 用户的图片描述
- ASPECT_RATIO: 图片比例（1:1, 4:3, 3:4, 16:9, 9:16）
- NUM_IMAGES: 生成数量
- OUTPUT_DIR: 保存目录
- INPUT_IMAGE: （可选）输入图片路径，用于图片编辑模式

示例（纯文本生成）：
```bash
bun skills/image-gen/image-gen.js "gemini-pro" "一只在星空下的猫" "1:1" 1 "."
```

示例（图片编辑）：
```bash
bun skills/image-gen/image-gen.js "gemini-pro" "把背景换成海边" "1:1" 1 "." "/path/to/input.jpg"
```

### Step 5: 展示结果

生成完成后：

1. 告诉用户图片保存的完整路径
2. 显示生成的图片（如果系统支持）：
   ```bash
   # macOS 上打开图片
   open "OUTPUT_PATH"
   ```
3. 报告使用的 tokens/credits（如果 API 返回）

### 常见问题处理

**API Key 无效**：
- 请在 Max 设置中检查 Max API Key 是否正确配置

**生成失败**：
- 检查 prompt 是否包含违规内容
- 尝试换一个模型
- 检查网络连接

**图片打不开**：
- 确认文件完整下载
- 尝试使用其他图片查看器

### 示例交互

用户：帮我生成一张图片，一只在星空下的猫

助手：
1. 检查环境变量和 Bun ✓
2. 使用 AskUserQuestion 询问用户偏好
3. 根据选择执行脚本
4. 展示生成的图片

### 交互风格

- 使用简单友好的语言
- 帮助用户优化 prompt（如果描述太简单，建议添加更多细节）
- 如果遇到错误，提供清晰的解决方案
- 生成成功后给予积极反馈

Source

Creator's repository · infquest/vibe-ops-plugin

View on GitHub ↗

Security

Security checks in progress

Results will appear here once audits complete

What this skill can do

Reads your filesConnects to the internetRuns code on your machine

Checked by 3 independent security firms

Does it try to trick the AI?Not yet checkedPending · Gen Agent Trust Hub

Does it sneak in hidden code?Not yet checkedPending · Socket

Does it have known bugs?Not yet checkedPending · Snyk