Сбер поделился итогами прошлого года в сфере нейросетей. Генеративная модель Kandinsky создала более 200 млн генераций по текстовым запросам, а ее аудитория превысила 12 млн уникальных пользователей. Модель заняла первое место по темпу роста и стала второй после Stable Diffusion по популярности среди разработчиков по версии AI-ресурса Hugging Face, где собраны лучшие open source-решения.
Kandinsky понимает запросы из широкого списка тем более чем на 100 языках. Пользователи могут создавать фотореалистичные изображения в неограниченном количестве, применяя самые разные стили.
Модель также умеет менять отдельные объекты и целые области на картинке, смешивать несколько рисунков, дорисовывать изображение, создавать картины в режиме бесконечного полотна (inpainting/outpainting). Нейросеть хорошо знает отечественный культурный код: архитектурные достопримечательности, объекты и элементы народного искусства.
Кроме того, пользователи Kandinsky могут создавать четырехсекундные анимационные ролики и полноценные видео длиной до восьми секунд. Таким образом, генеративная модель Сбера помогает реализовать практически любую творческую задумку.
Как использовать
Оценить возможности нейросети можно на платформе fusionbrain.ai, в Telegram- и в VK-ботах, на сайте rudalle.ru. Модель работает в сервисе GigaChat, доступна в мобильных приложениях СберБанк Онлайн и Салют, а также на умных устройствах Sber по голосовой команде «Запусти художника». Сгенерировать анимацию и видеоролики можно на платформе fusionbrain.ai и в Telegram-боте — для этого нужно оставить заявку на доступ.
Модель разработали и обучили исследователи Sber AI при партнерской поддержке ученых из Института искусственного интеллекта AIRI на объединенном датасете Sber AI и компании SberDevices.