Kandinsky 2.1 — новая генеративная модель Сбера. Работает так же, как и многие современные популярные ИИ-генераторы изображений вроде Midjourney и Stable Diffusion. Модель умеет рисовать в разных стилях и понимает запросы на 101 языке, в том числе на русском и английском.
Что может Kandinsky 2.1
- Создавать картинки по текстовому описанию;
- Смешивать несколько рисунков;
- Менять рисунки по текстовому описанию;
- Генерировать изображения, похожие на заданное;
- Дорисовывать недостающие части картинки;
- Формировать изображения в режиме бесконечного полотна (inpainting/outpainting).
Нейросеть разработали и обучили исследователи Sber AI при партнерской поддержке ученых из Института искусственного интеллекта AIRI на объединенном датасете Sber AI и компании SberDevices. В отличие от предыдущей версии, Kandinsky 2.1 обучалась на большем количестве картинок. Среди них были и традиционно сложные для нейросетей варианты. К ним относятся арты с текстом и лицами людей. Впрочем, проблемы с ними еще есть:
Модель умеет визуализировать любой контент и может применяться в различных отраслях. К примеру, в банковской сфере ее получится использовать для создания персонализированных маркетинговых решений, ярких образов продуктов, привлечения и удержания внимания клиентов.
Думаю, у каждого найдется задача для Kandinsky 2.1, и поэтому улучшенная модель, как и ее предыдущая версия, находится в открытом доступе: протестировать ее может любой желающий, причем бесплатно.
Как попробовать
Нейросеть доступна на разных площадках. Оценить ее возможности бесплатно можно:
- на промо-странице модели;
- при помощи команды «Запусти художника» на умных устройствах Sber и в мобильном приложении Салют;
- на платформе ML Space в хабе предобученных моделей и датасетов DataHub;
- на платформе Fusion Brain;
- в Telegram-боте.