Нейросеть Kandinsky от Сбера научилась генерировать изображения с текстом на русском

Новую версию ИИ-художника уже может использовать каждый.
Редактор Hi-Tech Mail
Нейросеть Kandinsky от Сбера научилась генерировать изображения с текстом на русском
Источник: Сбер

Сбер представил обновленную версию нейросети Kandinsky Image — теперь генератор изображений умеет создавать картинки с надписями на русском языке.

Отныне Kandinsky Image поддерживает создание текста на кириллице, вписанный в контекст изображения. То есть надписи генерируются не просто поверх картинки, а органично сочетаются с окружением, материалами и освещением. Например, можно создать изображение с текстом, нарисованным на стене, выпиленным из дерева, отлитым из металла, вышитым, связанным или выложенным лепестками роз.

Нейросеть Kandinsky от Сбера научилась генерировать изображения с текстом на русском
Источник: Сбер
Нейросеть Kandinsky от Сбера научилась генерировать изображения с текстом на русском
Источник: Сбер
Нейросеть Kandinsky от Сбера научилась генерировать изображения с текстом на русском
Источник: Сбер

Разработчики сообщили, что для новой функции Kandinsky Image пришлось дообучить на базе данных из 10 млн изображений с русским текстом, написанным самыми разными способами, чтобы модель различала печатные, прописные и какие угодно буквы.

На данный момент процесс обучения продолжается — нейросеть все еще может генерировать с ошибками, особенно если требуется картинка с длинной надписью. Однако в «Сбере» предоставляют гарантию — неудачные генерации не расходуют дневной лимит, так как их можно «вернуть» в течение 14 дней с момента создания.

Нейросеть Kandinsky от Сбера научилась генерировать изображения с текстом на русском
Нейросеть Kandinsky от Сбера научилась генерировать изображения с текстом на русском
Нейросеть Kandinsky от Сбера научилась генерировать изображения с текстом на русском

Потестировать новую версию Kandinsky Image самостоятельно уже можно в Telegram-боте Kandinsky и во всех ботах GigaChat (Telegram, ВКонтакте, Одноклассники, MAX), а также в веб-версии.