Что такое Kandinsky
Так называют генеративную модель Сбера. Принцип работы напоминает популярные ИИ-генераторы изображений, включая Midjourney и Stable Diffusion. Вводишь текстовый запрос — получаешь картинку. Модель умеет рисовать в разных стилях и понимает написанное на 101 языке, в том числе на русском.
В апреле пользователям стала доступна модель Kandinsky 2.1, теперь Сбер выпустил ее обновленную версию.
Как изменилась нейросеть
Kandinsky 2.2 обучена на большем наборе данных — использовали 1,5 млрд пар «текст-изображение». Для справки: в первой версии было на 300 млн пар меньше. В результате нейросеть научилась лучше понимать запрос и выдавать более реалистичные изображения.
Как вам айфон 2030 года? Kandinsky 2.2 сгенерировала его по просьбе Hi-Tech Mail.ru. На наш взгляд, гаджет будущего получился очень громоздким:
В новую версию нейросети встроили ControlNet — структурный блок управляемых изменений. Он позволяет менять отдельные элементы на созданных изображениях с сохранением исходной композиции.
Другим приятным нововведением стала возможность генерировать стикеры. Пример с котиками:
Как попробовать
Kandinsky 2.2 уже доступна на разных площадках. Оценить ее возможности бесплатно можно:
- на сайте Сбера;
- при помощи команды «Запусти художника» на умных устройствах Sber и в мобильном приложении Салют;
- на платформе ML Space в хабе предобученных моделей и датасетов DataHub;
- на платформе Fusion Brain;
- в Telegram-боте.
Лучшие технологии и гаджеты по версии Time: