- Модель Kandinsky 5.0 Pro заняла 14-е место в рейтинге LMArena Text-to-Video, став лучшей среди открытых видеомоделей.
- Kandinsky 5.0 Pro обладает 19 миллиардами параметров и способна генерировать HD-видео с разрешением 1280×768 и длительностью до 10 секунд.
- Код и веса модели доступны на GitHub под лицензией MIT, что позволяет её свободно использовать в коммерческих целях.
Модель искусственного интеллекта Kandinsky 5.0 Pro, разработанная российскими специалистами, получила признание в международном рейтинге LMArena Text-to-Video, заняв 14-е место. Это является лучшим результатом среди всех моделей с открытым исходным кодом и свободной лицензией. В списке выше расположились исключительно проприетарные разработки крупных мировых компаний, таких как Google, Kuaishou, MiniMax и ByteDance.
Kandinsky 5.0 Pro представляет собой крупную нейросетевую модель с 19 миллиардами параметров. Она ориентирована на создание качественного видео в HD-разрешении 1280×768 пикселей при 24 кадрах в секунду. Максимальная продолжительность создаваемого ролика составляет 10 секунд. Помимо этого, модель поддерживает обработку текстовых запросов на русском и английском языках, а также управление движением камеры. Видео может генерироваться как по текстовому описанию, так и на основе исходного изображения.
В рамках семейства Kandinsky 5.0 существует также облегчённая версия Video Lite с 2 миллиардами параметров, которая тоже попала в рейтинг LMArena, заняв 22-е место. Обе версии распространяются под лицензией MIT, что обеспечивает как свободный доступ к исходному коду, так и возможность использования в коммерческих проектах. Технический отчёт по данным моделям был опубликован в открытом доступе на платформе arXiv в ноябре 2025 года, а включение в рейтинг состоялось в декабре того же года.
Достижения российской команды в области глубокого обучения и видеогенерации подтверждают глобальные тенденции в развитии ИИ, подчеркивая важность открытых технологий и свободного доступа для стимулирования инноваций. Доступность таких моделей может значительно расширить возможности разработчиков и творческих специалистов в различных сферах.
