ByteDance временно отключила генерацию голоса по фото в Seedance 2

Главное:

ByteDance запустила Seedance 2.0 — ИИ-генератор видео, работающий с изображениями, видео, аудио и текстом одновременно.
Функция генерации голоса по фото в Seedance 2.0 была приостановлена из-за опасений безопасности и потенциального злоупотребления.
Для создания цифровых аватаров теперь требуется прохождение верификации с записью собственного изображения и голоса в реальном времени.

Китайская компания ByteDance представила обновлённую версию своего видеогенератора на базе искусственного интеллекта Seedance 2.0, которая умеет обрабатывать до четырёх типов входных данных одновременно — изображения, видео, аудио и текст. Этот инструмент позволяет пользователям создавать короткие видеоролики продолжительностью от 4 до 15 секунд, автоматически сопровождающиеся звуковыми эффектами или музыкой. Особенностью Seedance 2.0 является возможность использования эталонных изображений и видеороликов для воспроизведения съёмочных эффектов, замены персонажей и дополнения существующих клипов, обеспечивая высокий уровень видео- и аудиогенерации с разрешением до 2K.

Тем не менее, один из функционалов платформы вызвал серьёзные опасения у общества и экспертов. Речь идёт о функции преобразования фотографии лица в голос. Как выяснилось, модель способна синтезировать голос, практически идентичный реальному голосу человека по единственному фото, и при этом без использования каких-либо голосовых сэмплов или прямых авторизованных данных. Это способствовало развитию опасений относительно потенциальных злоупотреблений технологией, таких как создание дипфейков, мошенничество или шантаж на основе подделки голосовых данных.

Вследствие этого 9 февраля ByteDance объявила о приостановке данной опции в Seedance 2.0 в целях безопасности и предупреждения возможных рисков. Вместо этого в приложениях Jimeng и Doubao, связанных с платформой, был введён обязательный этап проверки пользователей, включающий запись собственного изображения и голоса в режиме реального времени для создания цифровых аватаров. Эти меры направлены на поддержание безопасной и устойчивой творческой среды и предотвращение злоупотреблений.

Seedance 2.0 в настоящее время остаётся на этапе тестирования, и, по мнению специалистов, в дальнейшем он может найти широкое применение, например, в создании короткометражных фильмов и анимации. Ранее, в июне 2025 года, ByteDance уже продемонстрировала успешность Seedance 1.0, который уверенно лидировал в категориях преобразования текста и изображения в видео по сравнению с конкурентами от Google, Kuaishou и OpenAI.