Флагманская текст-в-видео модель Wan-AI через RunComfy CLI: клипы 2–15 секунд в 720p с управлением движением и настройкой длительности.
npx -y skills add agentspace-so/runcomfy-agent-skills --skill wan-2-7 --agent claude-codeФлагманская видеомодель Wan 2.7 от Wan-AI — с мультиреференсным кондиционированием и синхронизацией губ через аудио — на RunComfy Model API.
npx skills add agentspace-so/runcomfy-skills --skill wan-2-7 -g
| Задача | Используйте |
|---|---|
| Синхронизация губ под вашу аудиодорожку | Wan 2.7 (audio_url) |
| Мультиреференсное тонкое управление движением | Wan 2.7 |
| Плавные переходы, точная физика движения | Wan 2.7 |
| Лучшая модель по слепому голосованию | HappyHorse 1.0 |
| Мультимодальный кинематограф с image+video+audio + генерацией голоса в одном проходе | Seedance 2.0 Pro |
| Кинематографическое редактирование движения на существующих материалах | Kling Video O1 |
| Ультрабыстрая итерация | LTX 2 |
npm i -g @runcomfy/cliruncomfy login (device-code через браузер)RUNCOMFY_TOKEN=<token>wan-ai/wan-2-7/text-to-video| Поле | Тип | Обязательно | По умолчанию | Примечания |
|---|---|---|---|---|
prompt | string | да | — | До ~5000 символов / ~1500 токенов |
audio_url | string | нет | — | WAV/MP3, 3–30с, ≤15МБ. Управляет синхронизацией губ. Без него — автогенерация фоновой музыки. |
aspect_ratio | enum | нет | 16:9 | 16:9, 9:16, 1:1, 4:3, 3:4 |
resolution | enum | нет | 1080p | 720p или 1080p |
duration | enum | нет | 5 | 2–15 секунд (целые) |
negative_prompt | string | нет | — | До 500 символов. Конкретные вещи для исключения. |
enable_prompt_expansion | bool | нет | true | Авторасширение коротких промптов. Отключите для буквального контроля. |
seed | int | нет | — | 0..2³¹-1. Для вариантов с одним seed. |
runcomfy run wan-ai/wan-2-7/text-to-video \
--input '{"prompt": "промпт пользователя"}' \
--output-dir /абсолютный/путь
runcomfy run wan-ai/wan-2-7/text-to-video \
--input '{
"prompt": "Medium close-up of the spokesperson, warm key light, locked tripod, slight breathing motion.",
"audio_url": "https://.../voiceover.mp3",
"duration": 12,
"aspect_ratio": "9:16"
}' \
--output-dir /абсолютный/путь
runcomfy run wan-ai/wan-2-7/text-to-video \
--input '{
"prompt": "точно то, что нужно",
"enable_prompt_expansion": false,
"negative_prompt": "no subtitles, no flicker, no distorted hands"
}' \
--output-dir /абсолютный/путь
Камера + движение обычным языком. «Slow dolly in», «locked tripod, low angle», «handheld follow», «crane move from above». Ставьте план на первое место.
Одно основное действие на клип. Не нагромождайте конкурирующие действия. Выберите один бит.
Используйте negative_prompt для конкретных проблем. Хорошо: «no subtitles, no watermark, no flicker». Плохо (расплывчато): «no bad lighting».
Расширение промпта включено по умолчанию. Короткие промпты авторасширяются. Для строгих брендовых текстов — отключайте через enable_prompt_expansion: false.
Спецификации аудио важны. audio_url должен быть 3–30с, ≤15МБ, WAV/MP3. Файлы вне диапазона отклоняются. Совпадайте длину аудио с длительностью клипа.
Антипаттерны: статичные описания (движение будет размытым); расплывчатые отрицания; аудио вне спецификации; промпты >5000 символов.
| Сценарий | Почему Wan 2.7 |
|---|---|
| Синхронизированная реклама с кастомной озвучкой | audio_url принимает вашу дорожку |
| Варианты дублирования на разных языках | Тот же промпт, разный audio_url для каждого языка |
| Мультиреференсное управление движением | До 5 референсных медиа (image / video / voice) |
| Плавные переходы + физика движения | Сильные праймеры физически-осознанного движения |
| Чистый вывод с negative_prompt | Целевое исключение проблем |
| Код | Значение |
|---|---|
| 0 | успех |
| 64 | неверные аргументы CLI |
| 65 | неверный JSON / несоответствие схемы |
| 69 | ошибка сервера (5xx) |
| 75 | таймаут / 429 |
| 77 | не авторизован |