
Сбер представил обновленную версию нейросети Kandinsky Image — теперь генератор изображений умеет создавать картинки с надписями на русском языке.
Отныне Kandinsky Image поддерживает создание текста на кириллице, вписанный в контекст изображения. То есть надписи генерируются не просто поверх картинки, а органично сочетаются с окружением, материалами и освещением. Например, можно создать изображение с текстом, нарисованным на стене, выпиленным из дерева, отлитым из металла, вышитым, связанным или выложенным лепестками роз.



Разработчики сообщили, что для новой функции Kandinsky Image пришлось дообучить на базе данных из 10 млн изображений с русским текстом, написанным самыми разными способами, чтобы модель различала печатные, прописные и какие угодно буквы.
На данный момент процесс обучения продолжается — нейросеть все еще может генерировать с ошибками, особенно если требуется картинка с длинной надписью. Однако в «Сбере» предоставляют гарантию — неудачные генерации не расходуют дневной лимит, так как их можно «вернуть» в течение 14 дней с момента создания.



Потестировать новую версию Kandinsky Image самостоятельно уже можно в Telegram-боте Kandinsky и во всех ботах GigaChat (Telegram, ВКонтакте, Одноклассники, MAX), а также в веб-версии.

