- Kuaishou представила Kling O1 — универсальную мультимодальную модель для создания и редактирования видео в одном интерфейсе.
- Модель поддерживает семь типов задач: генерация и трансформация видео, стилизация, добавление и удаление объектов, а также продление клипов.
- Kling O1 работает с видео разрешением до 1080p, длительностью до 10 секунд с возможностью продления до 2 минут, включая нативную генерацию синхронизированного аудио.
Компания Kuaishou анонсировала выход Kling O1 (Omni One) — первой унифицированной мультимодальной модели, которая объединяет все этапы работы с видео в одном удобном пайплайне. В отличие от традиционных инструментов, где необходимо переключаться между режимами по созданию, редактированию и продлению видео, Kling O1 предлагает единый мультимодальный визуальный язык (MVL), позволяющий работать со всем функционалом сквозным образом.
Модель поддерживает семь основных функций: генерация видео по текстовому описанию, создание по ключевым кадрам, работа с референсными изображениями, добавление и удаление объектов, стилизация, трансформация контента и продление роликов. Пользователи могут одновременно загрузить до десяти референсных изображений — Kling O1 сохраняет консистентность персонажей, предметов и сцен, что уже принесло ей прозвище «Nano Banana Pro для видео».
Особенностью новой модели является возможность редактирования через простые текстовые команды, например: «убери прохожих», «смени день на закат», «замени кота на волка» или «добавь огонь». Модель сама определяет, какие элементы необходимо изменить, без необходимости ручного выделения масок или работы с каждым кадром отдельно. Дополнительно введён режим Start/End Frame, позволяющий задать начальный и конечный кадр, между которыми Kling O1 создаст плавный переход.
Технически Kling O1 поддерживает формат видео до 1080p с частотой 30 кадров в секунду. Продолжительность видеороликов составляет до 10 секунд с возможностью продления до двух минут. Также модель интегрирует нативную аудиогенерацию, автоматически синхронизируя звуковое сопровождение с визуальными элементами — например, звук дождя соответствует сцене с дождём, а шум толпы — городской улице.
В настоящее время Kling O1 доступна в бета-версии, где стоимость составляет 10 Inspiration Points за секунду видео. Финальные цены будут объявлены при публичном релизе.
