Если вы хоть раз создавали презентацию, то знаете, насколько мучительно иногда подбирать картинки в сети. С нейросетями это не проблема: можно написать пару слов и подходящее изображение готово. А если оно вам не понравится, то можно изменить детали или создать новое.
Составили топ нейросетей для генерации изображений в 2024 году и дали пару советов о том, как составлять для них текстовые подсказки (промты).
Критерии отбора
Редакция Hi-Tech Mail.ru протестировала российские и зарубежные, платные и бесплатные нейросети, способные генерировать изображения по текстовому промту. Составили рейтинг по следующим критериям в порядке важности:
Качество генерируемого изображения. Картинка должна соответствовать текстовому промту и быть визуально привлекательной и детальной.
Скорость работы. Нейросеть должна быстро генерировать изображение, желательно в пределах 30 секунд.
Ограничения и лимиты. Некоторые сервисы работают в России только через VPN и/или требуют зарубежную банковскую карту.
Стабильность работы. Сервис не должен подвисать или перезагружаться.
Примечание: Мы не заметили, что российские нейросети Kandisky и Шедеврум лучше работают с промтами на русском языке. Поэтому в работе с ними мы использовали англоязычный промт для чистоты эксперимента.
Рейтинг топ-10 лучших нейросетей для генерации изображений
Расположили нейросети по совокупности признаков, которые, по нашему мнению, отличают лучшие сервисы от просто хороших: главным критерием было качество результата и соответствие изображения текстовому промту. Затем мы смотрели на дружелюбность интерфейса, арсенал сторонних функций, стоимость и доступность из России.
1. Midjourney
Лучший инструмент для генерации изображений не только по нашему мнению, но и по мнению сообщества художников. Создан выходцем из NASA и Leap Motion. Работает через бот в Discord и за один раз генерирует четыре изображения. В мае 2024 года Midjourney стала доступна в веб-версии для тех, кто сгенерировал более 100 изображений.
Midjourney ценят за создание изображений с художественной и живописной эстетикой. Иногда кажется, что нейросеть создаёт настолько реалистичные изображения, что их можно принять за фотографию. Проблема Midjourney — в не самом дружелюбном интерфейсе и сложности в освоении для новичков. А еще с недавнего времени полностью отсутствует бесплатная версия.
Примеры сгенерированных изображений
Так выглядят коты в космосе по версии Midjourney, сгенерированные по запросу «cat in space, photorealistic, ultrarealistic».
Характеристики
Форма запроса | Текстовый промт, стороннее изображение, мультипромт (текст + изображение) |
Стоимость | От $10 до $120 в месяц, бесплатной или пробной версии нет |
Язык запросов | Английский, испанский, французский, немецкий, итальянский, португальский, голландский |
Ограничения | Для использования в России нужен VPN и зарубежная карта |
Обязательная регистрация | Да |
Лимит генерируемых картинок | Есть лимит по времени генерации — 200 минут в базовом тарифе за $10 в месяц |
Совмещение изображений | Да |
Время обработки запроса | 30 секунд |
Кадрирование изображения | Да |
Вид изображений | Генерация нового изображения, обработка стороннего изображения |
Плюсы и минусы
Плюсы
- Генерирует одни из самых качественных и эстетичных изображений
- Позволяет редактировать и улучшать сгенерированные картинки
- Поддерживает большое количество художественных стилей
- Большое коммьюнити
Минусы
- Нет бесплатной версии
- Требует зарубежную банковскую карту
- Сгенерированные изображения доступны публично
- Работает через Discord
2. Kandinsky
Российская разработка от «Сбера», которая отличается высоким качеством генерации и большим количеством способов использования: через сайт fusionbrain.ai, телеграм-бот, с помощью фреймворка diffusers, в навыке Салют «Включи художника», на сайте rudalle.ru, в боте в VK.
Kandinsky позволяет создать не только статичные изображения, а еще анимацию и видео. В нейросети есть преднастроенные стили, быстрая Flash-версия и функция дорисовки изображения.
Примеры сгенерированных изображений
Так выглядит кот в космосе по версии Kandinsky, сгенерированный по запросу «cat in space, photorealistic, ultrarealistic».
Характеристики
Форма запроса | Текстовая |
Стоимость | Бесплатная |
Язык запросов | Русский и английский |
Ограничения | Нет |
Обязательная регистрация | Да |
Лимит генерируемых картинок | Нет |
Совмещение изображений | Да |
Время обработки запроса | Дольше 1 минуты |
Кадрирование изображения | Да |
Вид изображений | Генерация нового изображения, обработка стороннего изображения |
Плюсы и минусы
Плюсы
- Не требует оплаты
- Множество «точек входа»: сайт, боты, голосовой помощник Салют
- Хорошее качество генерации изображения
- Множество опций: преднастроенные стили, ластик, изменение готового изображения
- Есть функция улучшения промта
Минусы
- Медленная скорость генерации изображения в обычном режиме
- Иногда при изменении промта нейросеть не генерирует новое изображение, приходится перезагружать страницу
3. DALL·E
Генеративная модель от компании OpenAI, которая работает внутри чат-бота ChatGPT. Доступ к нейросети можно получить только в рамках платной подписки ChatGPT Plus. В DALL·E 3 есть два режима. В «естественном» нейросеть генерирует изображения в стиле реализма предыдущей версии DALL·E 2. В «ярком» картинки DALL·E 3 получаются гипер-реалистичными и драматичными.
Примеры сгенерированных изображений
Так выглядит кот в космосе по версии DALL·E 3, сгенерированный по запросу «cat in space, photorealistic, ultrarealistic».
Характеристики
Форма запроса | Текстовая |
Стоимость | От $20 в месяц |
Язык запросов | Мультиязычная |
Ограничения | Для использования в России нужен VPN и зарубежная карта |
Обязательная регистрация | Да |
Лимит генерируемых картинок | 40 изображений каждые 3 часа |
Совмещение изображений | Нет |
Время обработки запроса | 10 секунд |
Кадрирование изображения | Да |
Вид изображений | Генерация нового изображения |
Плюсы и минусы
Плюсы
- Высокая степень креативности и проработки изображения
- Два стиля — естественный и яркий
- Бесплатная для обладателей подписки ChatGPT Plus
Минусы
- Нельзя воспользоваться без платной подписки ChatGPT Plus
- Строгая политика использования изображения
- Мало возможностей кастомизации готовой картинки
- Нет возможности использовать свое изображение
4. Microsoft Designer (бывший Bing Image Creator)
Инструмент генерации изображения, встроенный в ИИ-чат-бот Microsoft Copilot. Еще можно получить доступ через сайдбар в браузере Microsoft Edge — но для обоих случаев потребуется VPN.
Microsoft Designer работает на базе модели DALL·E от OpenAI, но результаты по нашим ощущениям чуть хуже. Зато за доступ к нейросети не нужно платить.
Примеры сгенерированных изображений
Так выглядят коты в космосе по версии Microsoft Designer, сгенерированные по запросу «cat in space, photorealistic, ultrarealistic».
Характеристики
Форма запроса | Текстовая |
Стоимость | Бесплатная |
Язык запросов | Английский |
Ограничения | Для использования в России нужен VPN |
Обязательная регистрация | Да |
Лимит генерируемых картинок | Есть лимит по суточной генерации, но точных цифр нет |
Совмещение изображений | Нет |
Время обработки запроса | 10 секунд |
Кадрирование изображения | Да |
Вид изображений | Генерация нового изображения |
Плюсы и минусы
Плюсы
- Использует мощную модель DALL·E от OpenAI
- Интуитивно понятный интерфейс
- Множество функций и возможностей кастомизации
- Интеграция с продуктами Microsoft
- Бесплатный доступ
Минусы
- Ограниченное суточное использование
- Доступ только на английском языке
- Для пользователей из России нужен VPN
- Возможность введения платной подписки в будущем
5. Jasper Art
Еще одна нейросеть для генерации изображений по текстовому промту. Создатели подчеркивают, что картинки можно использовать для коммерческих целей.
Примеры сгенерированных изображений
Так выглядят коты в космосе по версии Jasper Art, сгенерированные по запросу «cat in space, photorealistic, ultrarealistic».
Характеристики
Форма запроса | Текстовый промт, стороннее изображение |
Стоимость | $49 и $69 в месяц, есть семидневный триал |
Язык запросов | Английский |
Ограничения | Для триала требует ввести зарубежную карту |
Обязательная регистрация | Да |
Лимит генерируемых картинок | Нет |
Совмещение изображений | Нет |
Время обработки запроса | Меньше 10 секунд |
Кадрирование изображения | Да |
Вид изображений | Генерация нового изображения, обработка имеющегося |
Плюсы и минусы
Плюсы
- Быстрая скорость генерации изображения
- Нет ограничений по количеству сгенерированных картинок
- Одной из лучших по «цене-качеству» относительно других нейросетей
Минусы
- Низкие возможности кастомизации изображения
- Ограниченный реализм готовых изображений
- Слишком узнаваемо, что результат был сгенерирован нейросетью
6. DreamStudio SDXL
Это онлайн-интерфейс ИИ-модели от компании Stable Diffusion. У нейросети есть платная и бесплатная версия, однако в бесплатной на картинках добавляется водяной знак. По сравнению с другими платформами на основе модели Stable Diffusion, у DreamStudio ниже скорость работы и менее дружелюбный интерфейс, зато сервис предоставляет прямой доступ к мощной модели SDXL 1.0.
Примеры сгенерированных изображений
Так выглядят коты в космосе по версии DreamStudio, сгенерированные по запросу «cat in space, photorealistic, ultrarealistic».
Характеристики
Форма запроса | Текстовый промт, стороннее изображение |
Стоимость | $10 за 1000 кредитов (примерно 500 изображений). Далее можно покупать кредиты на любую сумму от $10 |
Язык запросов | Английский |
Ограничения | Нет |
Обязательная регистрация | Да |
Лимит генерируемых картинок | 120 изображений бесплатно, далее $10 за 500 изображений |
Совмещение изображений | Нет |
Время обработки запроса | Меньше 10 секунд |
Кадрирование изображения | Да |
Вид изображений | Генерация нового изображения, обработка имеющегося |
Плюсы и минусы
Плюсы
- Большие возможности кастомизировать изображения
- Множество настроек
- Бесплатные стартовые кредиты
Минусы
- Экспорт только в формате PNG
- Изображение ограничено разрешением 1024х1024
- Возможность сгенерировать только 10 изображений за раз
- Слишком однотипные изображения в режиме коллажа
7. NightCafe AI
Сервис в первую очередь фокусируется на создании коммьюнити и предлагает на выбор сразу несколько ИИ-моделей: Stable Diffusion, DALL-E 2, Neural Style Transfer, VQGAN+CLIP и CLIP Guided Diffusion.
Примеры сгенерированных изображений
Так выглядит кот в космосе по версии NightCafe AI, сгенерированный по запросу «cat in space, photorealistic, ultrarealistic».
Характеристики
Форма запроса | Текстовая |
Стоимость | от $0 до $50 в месяц |
Язык запросов | Английский |
Ограничения | Нет |
Обязательная регистрация | Нет |
Лимит генерируемых картинок | 8 изображений бесплатно, далее $6 за 200 изображений |
Совмещение изображений | Да |
Время обработки запроса | Меньше 10 секунд |
Кадрирование изображения | Да |
Вид изображений | Генерация нового изображения |
Плюсы и минусы
Плюсы
- Использует несколько ИИ моделей на выбор
- Большое коммьюнити, можно вдохновляться чужими работами
- Возможность сгенерировать до 16 изображений по одному промту
Минусы
- Без регистрации и бесплатно можно создать только 8 изображений
- Пользователи отмечают долгое ожидание в очереди на генерацию
- Ограниченная кастомизация изображения
8. «Шедеврум»
Сайт: https://shedevrum.ai/
Нейросеть от «Яндекса» работает только в одноименном мобильном приложении, которая работает как соцсеть. При генерации необходимо опубликовать свое изображение в общей ленте — там же можно видеть работы других и подписываться на понравившихся авторов.
В июне 2023 года разработчики внедрили в сервис нейросеть YandexGPT, которая лучше распознает текстовые запросы пользователей.
Фишка «Шедеврума» — «фильтурмы», которые позволяют использовать предустановленные стили, в том числе от сторонних пользователей.
Примеры сгенерированных изображений
Так выглядит кот в космосе по версии «Шедеврума», сгенерированный по запросу «cat in space, photorealistic, ultrarealistic».
Характеристики
Форма запроса | Текстовая |
Стоимость | Бесплатная |
Язык запросов | Русский, английский, казахский |
Ограничения | Нет |
Обязательная регистрация | Да |
Лимит генерируемых картинок | Нет |
Совмещение изображений | Нет |
Время обработки запроса | 30-60 секунд |
Кадрирование изображения | Да |
Вид изображений | Генерация нового изображения, генерация видео, генерация текста |
Плюсы и минусы
Плюсы
- Полностью бесплатна
- Большое коммьюнити, так как это соцсеть
- Можно обучаться промтингу на чужих изображениях
Минусы
- Часто нейросеть выдает непредсказуемый результат
- Работает только в мобильном приложении
9. Leonardo.AI
Сайт: https://leonardo.ai/
Нейросеть позволяет не только генерировать изображения по промту, но и редактировать определенные детали на готовой картинке. Еще у Leonardo есть функция Realtime Canvas — можно мышкой нарисовать любой объект, а нейросеть превратит его в изображение.
Помимо работы со статичными картинками, сервис умеет создавать анимацию и видео.
Примеры сгенерированных изображений
Так выглядят коты в космосе по версии Leonardo.AI, сгенерированные по запросу «cat in space, photorealistic, ultrarealistic».
Характеристики
Форма запроса | Текстовая |
Стоимость | От $0 до $60 в месяц |
Язык запросов | Английский |
Ограничения | При регистрации дается 150 токенов, обновляются каждый день. Генерация одного изображения стоит от 12 токенов в зависимости от настроек и сложности промта |
Обязательная регистрация | Да |
Лимит генерируемых картинок | До 12 изображений в день, далее от $12 в месяц за 8500 токенов |
Совмещение изображений | Нет |
Время обработки запроса | 10 секунд |
Кадрирование изображения | Да |
Вид изображений | Генерация нового изображения |
Плюсы и минусы
Плюсы
- Быстрая скорость генерации изображения
- Регистрация не требует карты
- Каждый день дается 150 токенов
- Можно натренировать ИИ-модель на собственной выборке изображений
Минусы
- Слабая детализация в некоторых изображениях
10. Artbreeder
Судя по функциям, Artbreeder создан для молодой аудитории. Помимо генерации изображения по текстовому промту, сервис позволяет создавать персонажей, совмещая различные лица и позы. Также есть функция смешивания любых изображений и текста, опция точной настройки деталей картинки и даже создания изображения из простых форм (кругов, прямоугольников
Примеры сгенерированных изображений
Так выглядит кот в космосе по версии Artbreeder, сгенерированный по запросу «cat in space, photorealistic, ultrarealistic».
Характеристики
Форма запроса | Текстовый промт, стороннее изображение |
Стоимость | от $0 до $39 в месяц |
Язык запросов | Английский |
Ограничения | Нет |
Обязательная регистрация | Да |
Лимит генерируемых картинок | 30 коллажей в месяц бесплатно, далее от $9 в месяц |
Совмещение изображений | Да |
Время обработки запроса | Меньше 10 секунд |
Кадрирование изображения | Да |
Вид изображений | Генерация нового изображения, обработка имеющегося |
Плюсы и минусы
Плюсы
- Нейросеть с одними из самых креативных функций
- Быстрая генерация картинок
- Есть бесплатная, но ограниченная версия
Минусы
- Периодически зависает, нестабильно работает
- В бесплатной версии позволяет генерировать мало изображений
- Слишком ограниченный набор функций в бесплатном тарифе
- Мало бизнес-применений
Как правильно составить запрос на генерацию изображения
Выбрать подходящую по функциям и бюджету нейросеть — не самое главное. Важно правильно составить промт и научиться работать с выбранным сервисом. Более подробную инструкцию по составлению промтов вы найдете в нашем тексте «Промты для нейросети: полезные советы по созданию запроса».
1. Определитесь с темой
Придумайте главный объект, который будет находиться в центре изображения и свойства, которыми он будет наделен: цвет, размер, настроение, форма
2. Объект не должен быть абстракцией
Если хотите, чтобы нейросеть точно воплотила ваш запрос, не используйте абстракции: любовь, дружба, красота. Лучше всего подходят конкретные вещи: дом, телефон, фейерверк, планета, собака.
3. Смешивайте объекты для интересного результата
Попробуйте такие запросы, как тигр-разбойник, машина в перьях, лиственница-ученый.
4. В зарубежных нейросетях пишите промты на английском
Российские сервисы Kandinsky и «Шедеврум» хорошо понимают русский язык, чего не скажешь о зарубежных аналогах. Можете воспользоваться бесплатным ChatGPT или Deepl для перевода промтов.
5. Описывайте стиль изображения
Чтобы придать изображению стилистическую окраску, указывайте, в каком стиле должен быть результат. Это может быть высококачественная фотография или аниме, стиль Пикассо или Бэнкси. Информация о стилях, в которых работает нейросеть, можно узнать из faq: например, в этом блоге можно изучить стили Midjourney.
6. Не ожидайте качественного результата с первого раза
Практически у всех современных нейросетей есть функция дорисовки или редактирования изображения — пользуйтесь этим. Например, если плохо получились человеческие пальцы, допишите в промте «detailed fingers», а если совсем не понравился результат, то воспользуйтесь помощниками по созданию промта: Promptomania, Phaser или Promptwave.
Обзор лучших нейросетей для генерации изображений
Составили сравнительную таблицу сервисов из нашего топа.
Нейросеть | Форма запроса | Стоимость | Язык запросов | Ограничения | Обязательная регистрация | Лимит генерируемых картинок | Совмещение изображений | Время обработки запроса | Кадрирование изображения | Вид изображений |
Midjourney | Текстовый промт, стороннее изображение, мультипромт (текст + изображение) | От $10 до $120 в месяц | Английский, испанский, французский, немецкий, итальянский, португальский, голландский | Для использования в России нужен ВПН и зарубежная карта | Да | 200 минут генерации в базовом тарифе | Да | 30 секунд | Да | Генерация нового изображения, обработка стороннего изображения |
Kandinsky | Текстовый промт, стороннее изображение | Бесплатно | Русский и английский | Нет | Да | Нет | Да | Дольше 1 минуты | Да | Генерация нового изображения, обработка стороннего изображения |
DALL·E | Текстовый промт | От $20 в месяц | Мультиязычная | Для использования в России нужен ВПН и зарубежная карта | Да | 40 изображений каждые 3 часа | Нет | 10 секунд | Да | Генерация нового изображения |
Microsoft Designer | Текстовый промт | Бесплатно | Английский | Для использования в России нужен ВПН | Да | Есть лимит по суточной генерации, но точных цифр нет | Да | 10 секунд | Да | Генерация нового изображения |
Jasper Art | Текстовый промт, стороннее изображение | $49 и $69 в месяц, есть семидневный триал | Английский | Для триала нужна зарубежная карта | Да | Нет | Нет | Менее 10 секунд | Да | Генерация нового изображения, обработка стороннего изображения |
DreamStudio SDXL | Текстовый промт, стороннее изображение | $10 за 1000 кредитов (примерно 500 изображений) | Английский | Нет | Да | 120 изображений бесплатно, далее $10 за 500 изображений | Нет | Менее 10 секунд | Да | Генерация нового изображения, обработка стороннего изображения |
NightCafe AI | Текстовый промт | от $0 до $50 в месяц | Английский | Нет | Нет | 8 изображений бесплатно, далее $6 за 200 изображений | Да | Менее 10 секунд | Да | Генерация нового изображения |
«Шедеврум» | Текстовый промт | Бесплатно | Русский, английский, казахский | Нет | Да | Нет | Нет | 30 секунд | Да | Генерация нового изображения |
Leonardo.AI | Текстовый промт | От $0 до $60 в месяц | Английский | При регистрации дается 150 токенов, обновляются каждый день. Генерация одного изображения стоит от 12 токенов в зависимости от настроек и сложности промта | Да | До 12 изображений в день бесплатно, далее от $12 в месяц за 8500 токенов | Нет | 10 секунд | Да | Генерация нового изображения |
Artbreeder | Текстовый промт, стороннее изображение | от $0 до $39 в месяц | Английский | Нет | Да | 30 коллажей в месяц бесплатно, далее от $9 в месяц | Да | Менее 10 секунд | Да | Генерация нового, обработка имеющегося |
Вопросы и ответы
Ответили на некоторые вопросы о генеративных нейросетях, которые могли возникнуть у вас во время прочтения статьи.
Можно ли использовать картинки, созданные нейросетью?
Некоторые нейросети разрешают коммерческое использование сгенерированных изображений или публикацию их в соцсетях. Другие категорически запрещают — например, это DALL·E или сервисы на основе модели Stable Diffusion. Рекомендуем изучить политику сервиса, на котором вы остановили свой выбор.
Как отличить изображение, которое сгенерировала нейросеть от фотографии?
Чаще всего нейросети допускают ошибки в генерации человеческих пальцев и черт лица — в особенности глаз. Обращайте внимание на нетипичное положение частей тела, странные зрачки или бросающуюся в глаза симметрию лица. Также ищите водяные знаки, некоторые сервисы стали накладывать их на изображения. Чтобы перепроверить себя, пользуйтесь специальными ИИ-детектерами, например таким. Однако такие сервисы могут вводить заблуждения. Не принимайте окончательное решение на основе их результатов.
Как нейросеть распознает лица?
Нейросеть обучают на огромных массивах информации. В случае с генераторами изображений — на миллионах фотографий и рисунков. Если по-простому, ИИ-тренеры показывают нейросети лицо человека и говорят: «Это лицо, вот брови, глаза, под ними нос, губы». Нейросеть запоминает все это в виде набора цифр, а затем воспроизводит.