- Kuaishou представила Kling 3.0 — видео-ИИ, который самостоятельно режиссирует клипы, выбирая ракурсы и переходы.
- Новая версия поддерживает режим Multi-Shot с одновременной генерацией до шести камер и монтажем 15-секундного видео за один проход.
- Расширена языковая озвучка, добавлены японский, корейский и испанский, а качество генерации улучшено до 4K с сохранением консистентности персонажей.
Китайская компания Kuaishou анонсировала релиз новой версии видеогенератора Kling 3.0, который представляет собой значительный шаг в развитии искусственного интеллекта в области автоматического видеомонтажа. Главная особенность обновлённой модели — возможность самостоятельно режиссировать видеоролики: она распределяет до шести виртуальных камер в одной сцене, выбирает оптимальные ракурсы и плавно переключается между ними, а также добавляет переходы без участия пользователя. Такой режим получил название Multi-Shot и позиционируется разработчиками как «AI-режиссёр». Для получения результата достаточно лишь описать сцену текстом — ИИ сам решит, где применить общий план, где — крупный, и как правильно организовать монтажную последовательность кадров. Ранее подобные ролики приходилось создавать вручную, объединяя по отдельности сгенерированные фрагменты. Сейчас Kling 3.0 способен выдавать готовое 15-секундное видео с несколькими склейками в одном цикле генерации, что значительно упрощает и ускоряет процесс.
Kling 3.0 представлен сразу в трёх вариантах: Video 3.0 генерирует клипы длиной до 15 секунд — это в полтора раза дольше, чем у предыдущей версии; Video 3.0 Omni дополнительно создаёт синхронизированный со звуком контент, включая диалоги, музыку и звуковые эффекты, интегрируя аудиодорожки непосредственно в видеоряд; Image 3.0 Omni специализируется на выдаче изображений в разрешении 4K и поддерживает серийную генерацию, что позволяет сохранить стиль и персонажей на нескольких кадрах подряд.
Особое внимание в разработке уделено консистентности визуального образа. По словам представителей Kuaishou, персонажи выглядят одинаково реалистично и естественно при смене ракурсов — с общего плана на крупный и обратно, избегая типичных для ранних версий AI-видео «плавающих лиц» и несостыковок в деталях. Что касается озвучки, Kling 3.0 расширил языковую поддержку и теперь умеет работать не только с английским и китайским, но и с японским, корейским и испанским языками, что значительно увеличивает аудиторию пользователей.
Ранний доступ к Kling 3.0 для подписчиков Ultra стартовал 4 февраля, а уже с 5 февраля появится API для интеграции технологии в сторонние приложения и сервисы. Таким образом, новый видео-ИИ призван не только упростить создание динамичного видеоконтента, но и сделать этот процесс более интеллектуальным, синхронизированным и удобным для пользователей без профильных навыков монтажа.
