6 endpoints Kling 3.0 в одном скилле: Standard, Pro и 4K тиры в режимах текст-в-видео и изображение-в-видео через RunComfy CLI.
npx -y skills add doany-ai/skills --skill kling-3-0 --agent claude-codeKling 3.0 — третье поколение кинематографической видеомодели Kuaishou Technology. Многоплановое видео с синхронизированным нативным аудио, консистентной идентичностью персонажей между планами и физически осознанным движением.
npx skills add agentspace-so/runcomfy-agent-skills --skill kling-3-0 -g
Kling 3.0 — V3-поколение Kling. Поддерживает клипы до 15 секунд, нативный 4K на тарифе 4K и унифицированную систему мультипромптных сегментов для нескольких отдельных сцен с управляемыми переходами в одной генерации. Выпускается в трёх тарифах рендеринга, каждый доступен в режимах text-to-video и image-to-video:
| Эндпоинт | Разрешение | Цена (без аудио) | Цена (с аудио) |
|---|---|---|---|
kling/kling-3.0/standard/text-to-video | до 1080p | $0.084/с | $0.126/с |
kling/kling-3.0/standard/image-to-video | до 1080p | $0.084/с | $0.126/с |
kling/kling-3.0/pro/text-to-video | 1080p | $0.112/с | $0.168/с |
kling/kling-3.0/pro/image-to-video | 1080p | $0.112/с | $0.168/с |
kling/kling-3.0/4k/text-to-video | 3840×2160 | $0.42/с | $0.42/с |
kling/kling-3.0/4k/image-to-video | 3840×2160 | $0.42/с | $0.42/с |
Тариф 4K одинаково стоит независимо от аудио. Standard и Pro берут ~50% больше за секунду при включённом аудио.
Выбор режима: t2v — только промпт, Kling 3.0 генерирует внешний вид с нуля. i2v — промпт + исходное изображение, Kling 3.0 анимирует его.
npm i -g @runcomfy/cliruncomfy loginRUNCOMFY_TOKEN=<token>| Поле | Тип | Обязательно | По умолчанию | Примечания |
|---|---|---|---|---|
prompt | string | да | — | Описание сцены, движения, камеры. Многосегментные промпты через нумерацию планов. |
image_url | string | да (только i2v) | — | HTTPS URL исходного изображения. JPEG/PNG/WebP. |
tail_image_url | string | нет (только i2v) | — | Опциональное конечное изображение для управляемого перехода начало→конец |
negative_prompt | string | нет | — | Элементы для исключения из вывода |
duration | int | нет | 5 | 3–15 секунд на генерацию |
aspect_ratio | enum | нет | 16:9 | 16:9, 9:16, 1:1, 4:3, 3:4, 21:9 |
cfg_scale | float | нет | 0.5 | Сила следования промпту. Выше = строже. 0.7–0.9 для стилизованного; 0.3–0.4 для естественного движения. |
generate_audio | bool | нет | false | Синхронизированное аудио в одном проходе. +стоимость на Standard/Pro; фиксированная на 4K. |
seed | int | нет | — | Воспроизводимость |
runcomfy run kling/kling-3.0/standard/text-to-video \
--input '{"prompt": "промпт", "duration": 5, "aspect_ratio": "16:9"}' \
--output-dir /абсолютный/путь
runcomfy run kling/kling-3.0/standard/image-to-video \
--input '{"prompt": "описание движения", "image_url": "https://.../source.jpg", "duration": 5}' \
--output-dir /абсолютный/путь
runcomfy run kling/kling-3.0/pro/text-to-video \
--input '{"prompt": "промпт", "duration": 8, "aspect_ratio": "16:9", "generate_audio": true}' \
--output-dir /абсолютный/путь
runcomfy run kling/kling-3.0/pro/image-to-video \
--input '{"prompt": "описание движения", "image_url": "https://.../subject.jpg", "duration": 8, "generate_audio": true}' \
--output-dir /абсолютный/путь
runcomfy run kling/kling-3.0/4k/text-to-video \
--input '{"prompt": "промпт", "duration": 10, "aspect_ratio": "16:9", "generate_audio": true}' \
--output-dir /абсолютный/путь
runcomfy run kling/kling-3.0/4k/image-to-video \
--input '{"prompt": "описание движения", "image_url": "https://.../source-4k.jpg", "duration": 10, "generate_audio": true}' \
--output-dir /абсолютный/путь
Начинайте с языка движения и камеры. «Wide shot, slow push-in», «tracking shot, low angle», «handheld follow» — Kling 3.0 читает их как реальные директивы. Ставьте на первое место.
Многоплановая съёмка в одной генерации. Нумеруйте планы: «Shot 1: wide of the cafe at dusk. Shot 2: medium close-up of the barista. Shot 3: tight on the espresso pour.» Kling 3.0 сохранит идентичность (лицо, гардероб, реквизит) между планами.
Якоря идентичности для i2v. Переформулируйте что должно оставаться стабильным: «preserve the subject's face, pose, and clothing; only the camera moves and the background changes.»
tail_image_url для управляемых концовок. Для Kling 3.0 i2v передайте конечное изображение для фиксации финального кадра. Kling 3.0 интерполирует движение от источника к финалу.
generate_audio: true для диалога в одном проходе. Описывайте ожидаемое аудио: «warm friendly tone, English voiceover» или «city ambience, distant traffic, no dialogue».
Антипаттерны: конфликтующие стилевые cues; запрос >15с (→ 422); соотношения сторон вне поддерживаемых; для 4K — агрессивный многоплановый нарратив без предварительной проверки на Standard (~$6.30 за генерацию).
| Сценарий | Лучший эндпоинт Kling 3.0 |
|---|---|
| Кинематографические брендовые истории 1080p с консистентными персонажами | Kling V3.0 Pro (t2v или i2v) |
| Нативные 4K-героические фильмы и большеэкранный кинематограф | Kling V3.0 4K (t2v или i2v) |
| Дешёвая итерация, социальные короткие, A/B-варианты | Kling 3.0 Standard t2v |
| Анимация брендовых ассетов, продуктовых фото, персонажного арта | Kling 3.0 Standard i2v или Pro i2v |
| Многоплановая реклама с синхронизированным диалогом в одном проходе | Kling V3.0 Pro с generate_audio: true |
| Премиальные готовые мастера 4K с нативным аудио | Kling V3.0 4K с generate_audio: true |
Максимальная длительность? 15 секунд на генерацию на всех тарифах.
Поддерживается ли многоплановая съёмка в одной генерации? Да. Нумеруйте планы («Shot 1:», «Shot 2:» и т.д.) — Kling 3.0 сохранит идентичность персонажей.
Поддерживает ли Kling 3.0 i2v конечное изображение? Да. tail_image_url фиксирует финальный кадр.
Отличия от Kling 2.x? Более сильное многоплановое сохранение идентичности, максимальная длительность 15с (против 10с у 2.x), нативный 4K, унифицированный мультипромптный сегментный ввод на всех тарифах.
| Код | Значение |
|---|---|
| 0 | генерация успешна |
| 64 | неверные аргументы CLI |
| 65 | неверный JSON / несоответствие схемы |
| 69 | ошибка сервера (5xx) |
| 75 | таймаут / 429 |
| 77 | не авторизован |