Сервис работает на базе нейросети Kandinsky. В нем можно объединять фрукты, овощи, различные сорта мяса и сладости. На выходе получается забавная картинка. Поиграться можно здесь.
Напомним, Kandinsky — это обновленный инструмент ruDALL-E (разработка «Сбера») для создания картинок по текстовому описанию. Нейросеть поддерживает русский язык.
Как работает Kandinsky
По данным «Сбера», создание изображений при помощи Kandinsky происходит в три этапа. Сначала одна нейросеть (непосредственно Kandinsky), используя текстовое описание, генерирует заданное число изображений. Затем вторая (ruCLIP Large) выбирает наиболее удачные и максимально соответствующие заданному текстовому описанию картинки, а потом третья увеличивает их в размере (доступны как диффузионная модель, так и генеративно-состязательная модель Real-ESRGAN).
В итоге получается набор сгенерированных изображений с высокой степенью детализации. Посмотрите, что еще удалось создать с помощью Kandinsky: