«Сбер» на конференции AI Journey 2023 представил Kandinsky Video. Это первая в стране нейросеть, которая может генерировать короткие видео.
Kandinsky Video умеет создавать 8-секундные ролики с разрешением 512×512 пикселей, разным соотношением сторон и частотой кадров 30 к/с. Нейросеть использует последнюю модель Kandinsky 3.0, чтобы генерировать сотни кадров, которые затем складываются и плавно переходят друг в друга.
Первые работы Kandinsky Video:
ИИ-видео представляют собой непрерывную сцену с движением как объекта, так и фона. Именно это отличает видеоролики Kandinsky Video от анимационных роликов, в которых динамика достигается за счет моделирования пролета камеры относительно статичной сцены.
По данным Сбера, Kandinsky Video обучена на базе данных, состоящей из 300 000 пар «текст-видео». Генерация короткого ролика занимает до трех минут.
Как опробовать Kandinsky Video первым?
Пока нейросеть доступна ограниченному числу пользователей. В будущем сервис станет доступен всем. Сейчас юзеры могут оставить заявку в Telegram-боте по ссылке и ждать, когда им придет приглашение. Сроки его получения индивидуальны. Также оценить возможности нейросети Kandinsky Video можно на платформе fusionbrain.ai.
Трансляция AI Journey 2023 есть на YouTube. Конференция проходит с 22 по 24 ноября.