Kling O1: универсальная модель Nano Banana Pro для видеосъемки Обложка: Skyread

Kling O1: универсальная модель Nano Banana Pro для видеосъемки

Новости
Главное:

  • Kuaishou представила Kling O1 — универсальную мультимодальную модель для создания и редактирования видео в одном интерфейсе.
  • Модель поддерживает семь типов задач: генерация и трансформация видео, стилизация, добавление и удаление объектов, а также продление клипов.
  • Kling O1 работает с видео разрешением до 1080p, длительностью до 10 секунд с возможностью продления до 2 минут, включая нативную генерацию синхронизированного аудио.

Компания Kuaishou анонсировала выход Kling O1 (Omni One) — первой унифицированной мультимодальной модели, которая объединяет все этапы работы с видео в одном удобном пайплайне. В отличие от традиционных инструментов, где необходимо переключаться между режимами по созданию, редактированию и продлению видео, Kling O1 предлагает единый мультимодальный визуальный язык (MVL), позволяющий работать со всем функционалом сквозным образом.

Модель поддерживает семь основных функций: генерация видео по текстовому описанию, создание по ключевым кадрам, работа с референсными изображениями, добавление и удаление объектов, стилизация, трансформация контента и продление роликов. Пользователи могут одновременно загрузить до десяти референсных изображений — Kling O1 сохраняет консистентность персонажей, предметов и сцен, что уже принесло ей прозвище «Nano Banana Pro для видео».

Особенностью новой модели является возможность редактирования через простые текстовые команды, например: «убери прохожих», «смени день на закат», «замени кота на волка» или «добавь огонь». Модель сама определяет, какие элементы необходимо изменить, без необходимости ручного выделения масок или работы с каждым кадром отдельно. Дополнительно введён режим Start/End Frame, позволяющий задать начальный и конечный кадр, между которыми Kling O1 создаст плавный переход.

Технически Kling O1 поддерживает формат видео до 1080p с частотой 30 кадров в секунду. Продолжительность видеороликов составляет до 10 секунд с возможностью продления до двух минут. Также модель интегрирует нативную аудиогенерацию, автоматически синхронизируя звуковое сопровождение с визуальными элементами — например, звук дождя соответствует сцене с дождём, а шум толпы — городской улице.

В настоящее время Kling O1 доступна в бета-версии, где стоимость составляет 10 Inspiration Points за секунду видео. Финальные цены будут объявлены при публичном релизе.

Tagged