Нейросеть ruDALL-E создал «Сбер». Она считается первой в мире разработкой, способной генерировать изображения на основе текстового описания на русском языке. Об этом сообщает пресс-служба «Сбера».
Создание изображений при помощи ruDALL-E происходит так: сначала одна нейросеть принимает текст на вход и генерирует заданное число картинок, затем следующая выбирает, какие из них наиболее удачны и максимально соответствуют описанию, а третья увеличивает их в размере без потери качества. Таким образом можно получить неограниченное количество новых изображений, подходящих под указанные характеристики.
Hi-Tech Mail.ru испытал ruDALL-E с помощью не самого простого запроса, попросив показать «новый смартфон с камерой в виде звезды». Получился очень концептуальный гаджет (если это, конечно, гаджет) с необычной заставкой. Описать это как-то иначе трудно — оцените сами:
Стоит отметить, что картинка создавалась больше 50 минут. Возможно, более легкие запросы обрабатываются за меньшее время, и нейросеть справляется с ними лучше. По крайней мере, галерея изображений из стандартных фраз вроде «зеленое поле» и «шикарная гостиная» выглядит сносно:
Разработчики предлагают использовать нейронную сеть ruDALL-E для создания вариантов дизайна интерьера, стоковых изображений или векторных иллюстраций, материалов для рекламы, копирайтинга, архитектурного и промышленного дизайна.
Смотрите также:
Ранее в сети «оживили» портреты героев «Союзмультфильма» с помощью нейронной сети. Особенно удачно вышел Карлсон (он есть в двух вариантах), хотя у всех героев получились невероятно реалистичные лица. За основу были взяты рисунки художника из Томска по имени Евгений Швенк. Он перерисовывает советских персонажей, добавляя им более реалистичные черты лица.
Это тоже интересно: