Компания Яндекс анонсировала бета-версию новой нейронной сети YandexART (Vi). С ее помощью можно генерировать 5-секундные видео. Модель способна воспроизводить плавные движения объектов на экране, такие как бег собаки, падение листьев с деревьев или взрыв фейерверка. Сообщается, что нейросеть доступна для всех: начиная от простых пользователей и заканчивая дизайнерами или другими специалистами. Воспользоваться YandexART (Vi) получится в приложении Шедеврум.
Отмечается, что первая версия модели для создания коротких видео была показана в августе 2023 года. Если прошлое решение генерировало анимации с эффектом движущейся камеры, то сейчас акцент сделан на движении объектов. Кроме того, исправлен момент со значительным изменением кадров — теперь YandexART (Vi) учитывает связь между ними, а за счет воссоздания реалистичных движений итоговый результат выглядит максимально цельным и «живым». Всё благодаря обучению нейросети на роликах с активно движущимися объектами (авто, животные
Плавность видеороликам обеспечивают незаметно сменяющие друг друга кадры. Сами же ролики создаются на основе текстовых описаний. Перед генерацией нейросеть делает картинку, чтобы пользователь мог оценить ее, и если всё соответствует задумке, YandexART (Vi) начинает создавать анимацию — из цифрового шума образуя кадр за кадром, опираясь на превью и текстовый запрос.
Пользователи в сети отмечают, что до лидеров в отрасли, таких как Gen 3 или Sora, нейросети еще далеко. Тем не менее это отличная альтернатива, которая постоянно развивается и совершенствуется.
Ранее мы рассказывали, как японская реклама McDonald's произвела фурор в соцсетях. Она была полностью сгенерирована нейросетями.