Что из себя представляет ИИ-генератор изображений от «Сбера»

Новая нейронка способна всего за несколько секунд создавать высококачественные изображения по текстовому описанию, а также менять их, смешивать и дорисовывать недостающие части. Приятный бонус — поддержка русского языка.
Такую картинку нейросеть Kandinsky 2.1 создала по запросу Hi-Tech Mail.ru
Такую картинку нейросеть Kandinsky 2.1 создала по запросу Hi-Tech Mail.ru

Kandinsky 2.1 — новая генеративная модель Сбера. Работает так же, как и многие современные популярные ИИ-генераторы изображений вроде Midjourney и Stable Diffusion. Модель умеет рисовать в разных стилях и понимает запросы на 101 языке, в том числе на русском и английском.

Что может Kandinsky 2.1

  • Создавать картинки по текстовому описанию;
  • Смешивать несколько рисунков;
  • Менять рисунки по текстовому описанию;
  • Генерировать изображения, похожие на заданное;
  • Дорисовывать недостающие части картинки;
  • Формировать изображения в режиме бесконечного полотна (inpainting/outpainting).

Нейросеть разработали и обучили исследователи Sber AI при партнерской поддержке ученых из Института искусственного интеллекта AIRI на объединенном датасете Sber AI и компании SberDevices. В отличие от предыдущей версии, Kandinsky 2.1 обучалась на большем количестве картинок. Среди них были и традиционно сложные для нейросетей варианты. К ним относятся арты с текстом и лицами людей. Впрочем, проблемы с ними еще есть:

Такую картинку нейросеть Kandinsky 2.1 создала по запросу Hi-Tech Mail.ru
Такую картинку нейросеть Kandinsky 2.1 создала по запросу Hi-Tech Mail.ru

Модель умеет визуализировать любой контент и может применяться в различных отраслях. К примеру, в банковской сфере ее получится использовать для создания персонализированных маркетинговых решений, ярких образов продуктов, привлечения и удержания внимания клиентов.

Думаю, у каждого найдется задача для Kandinsky 2.1, и поэтому улучшенная модель, как и ее предыдущая версия, находится в открытом доступе: протестировать ее может любой желающий, причем бесплатно.
Александр Ведяхин
первый заместитель председателя правления Сбербанка

Как попробовать

Нейросеть доступна на разных площадках. Оценить ее возможности бесплатно можно:

возможности Kandinsky 2.1
возможности Kandinsky 2.1
возможности Kandinsky 2.1
возможности Kandinsky 2.1
возможности Kandinsky 2.1
Все эти картинки созданы с помощью Kandinsky 2.1. Источник: пресс-служба Сбера