AI генерация изображений в baoyu workflow.
npx -y skills add jimliu/baoyu-skills --skill baoyu-image-gen --agent claude-codeГенерация изображений через официальные API: OpenAI GPT Image 2, Azure OpenAI, Google, OpenRouter, DashScope (阿里通义万象), Z.AI GLM-Image, MiniMax, Jimeng (即梦), Seedream (豆包), Replicate и Agnes. Поддерживает text-to-image, референсные изображения, соотношения сторон и пакетную генерацию из сохранённых файлов промптов.
При необходимости задать вопрос пользователю — приоритет инструментов: встроенный (AskUserQuestion или аналог) → нумерованное текстовое сообщение. Объединяйте вопросы в один вызов, если инструмент поддерживает несколько.
До генерации изображений ОБЯЗАТЕЛЬНО наличие EXTEND.md. Пути поиска (первый найденный):
| Путь | Область |
|---|---|
.baoyu-skills/baoyu-image-gen/EXTEND.md | Проект |
${XDG_CONFIG_HOME:-$HOME/.config}/baoyu-skills/baoyu-image-gen/EXTEND.md | XDG |
$HOME/.baoyu-skills/baoyu-image-gen/EXTEND.md | Домашняя директория |
Найден → загрузить, разобрать, применить. Не найден → запустить первоначальную настройку (references/config/first-time-setup.md): через AskUserQuestion собрать провайдера + модель + качество + путь сохранения. Сохранить EXTEND.md, затем продолжить. Не генерировать до завершения.
Ключи EXTEND.md: провайдер по умолчанию, качество, соотношение сторон, размер, диалект OpenAI image API, модели по умолчанию, лимит воркеров пакетного режима, лимиты батча по провайдерам. Схема: references/config/preferences-schema.md.
Когда пользователь хочет сохранить идентичность реального человека/персонажа/объекта из референсных изображений — не заменять референс длинным общим описанием. Предпочтительные формулировки:
| Провайдер | Ключевые модели | Особенности |
|---|---|---|
| OpenAI | gpt-image-1, dall-e-3 | Лучшее качество следования инструкциям |
| imagen-3.0-generate | Фотореализм | |
| DashScope | wanx2.1-t2i-turbo | Быстро, китайский контент |
| Jimeng | high_aes_general_v21 | Аниме, иллюстрации |
| Seedream | seedream-3.0 | Художественные стили |
| Replicate | flux-1.1-pro и др. | Гибкость, open-source модели |
# Одно изображение
${BUN_X} {baseDir}/scripts/main.ts "a serene mountain lake at dawn"
# Пакетный режим из файла промптов
${BUN_X} {baseDir}/scripts/main.ts --batch prompts.json
# Референсное изображение
${BUN_X} {baseDir}/scripts/main.ts "same person, outdoor scene" --reference portrait.jpg
| Формат | Значение | Применение |
|---|---|---|
1:1 | Квадрат | Профили, иконки |
16:9 | Широкоформатный | Обложки, YouTube |
9:16 | Вертикальный | Instagram, TikTok |
4:3 | Стандартный | Статьи, презентации |
2.35:1 | Кинематографический | Баннеры |