- Создание видео с помощью ИИ потребляет значительно больше электроэнергии, чем ожидалось.
- Расходы на электроэнергию растут квадратично с увеличением длительности ролика, частоты кадров и разрешения, а не линейно, как считалось ранее.
- Для снижения энергозатрат рекомендовано оптимизировать видеомодели, использовать кэширование и уменьшать количество повторных вычислений без потери качества.
Исследование, проведённое командой Hugging Face, выявило, что создание видео с помощью искусственного интеллекта (ИИ) связано с гораздо более значительными затратами электроэнергии, чем предполагается многими сервисами. В отличие от традиционного подхода, где цена формируется по принципу линейной зависимости от продолжительности ролика, реальные энергозатраты растут почти вчетверо при удвоении его длительности или увеличении разрешения кадра.
Эксперты провели замеры на открытых видеомоделях, включая WAN2.1-T2V, и обнаружили, что затраты электроэнергии пропорциональны квадрату количества кадров (учитывая длительность и частоту кадров) и размеру кадра (его разрешению). При этом увеличение числа шагов денойзинга приводит к росту затрат в линейной зависимости.
Основной причиной такого квадратичного роста является внутренняя архитектура видеомоделей — диффузионный трансформер применяет механизм внимания (attention), который сопоставляет каждый элемент изображения со всеми остальными. При увеличении разрешения или числа кадров количество этих сравнений возрастает не линейно, а квадратично, что и приводит к резкому возрастанию энергопотребления.
Авторы исследования подчёркивают, что снижение разрешения, длительности и частоты кадров остаётся самым очевидным способом сократить энергозатраты, однако это неизбежно отражается на качестве видео и ограничивает возможности для творчества. В связи с этим они рекомендуют разработчикам видеомоделей сосредоточиться на оптимизации процессов: внедрять кэширование повторяющихся или статичных фрагментов, избегать повторных вычислений одних и тех же участков, а также сокращать излишние операции в конвейере обработки.
Данные меры позволят снизить потребление электроэнергии без заметного ухудшения конечного качества создаваемого видео и обеспечат более эффективное использование ресурсов при дальнейшем развитии ИИ-технологий в области генерации видео.