Google выпустила Imagen 4: новая модель генерации картинок

Компания из Маунтин-Вью представила сразу две версии своего ИИ-художника, одна из которых стоит на 50% дороже базовой и обещает точно следовать самым сложным инструкциям пользователей.
Автор новостей
сгенерированное изображение города будущего
Пример генерации в Google Imagen 4 Источник: Hi-Tech Mail

Технологический гигант Google выпустил четвертое поколение своей нейросети Imagen для создания изображений по текстовым описаниям. Новинка получила название Imagen 4 и сразу две модификации — стандартную и Ultra.

Базовая версия предназначена для широкого круга задач и стоит 3 рубля за картинку. Продвинутая Imagen 4 Ultra обойдется в 5 рублей, но взамен обещает более точное следование инструкциям и лучшие результаты в сравнении с конкурентами.

Обе модели доступны через платный предварительный доступ в Gemini API, а также для ограниченного бесплатного тестирования в Google AI Studio. Система может создавать до четырех изображений размером 1024×1024 пикселя за один запрос, принимая промпты длиной до 480 токенов.

девушка сгенерированное изображение
Пример генерации в Google Imagen 4 Источник: Google

Разработчики сосредоточились на решении ключевых проблем предыдущих версий. Imagen 4 значительно лучше справляется с отрисовкой текста внутри изображений — надписи теперь получаются четкими и читаемыми. Это особенно важно для создания постеров, приглашений и рекламных материалов.

Фотореализм также вышел на новый уровень. Нейросеть теперь детально прорисовывает текстуры тканей, капли воды на поверхностях и шерсть животных. Улучшилась передача освещения и теней, что делает результат более естественным.

Несмотря на заявленные улучшения, мнения специалистов разделились. Обозреватель Engadget отметил, что модель действительно стала лучше, но не произвела впечатления по сравнению с лидерами рынка — DALL-E 3 и Midjourney 7. Изображения получаются качественными и точно следуют промптам, но выглядят «машинно сгенерированными» и лишены художественного шарма.

В рейтинге Artificial Analysis модель заняла пятое место, уступив GPT-4o, Flux.1 Kontext и Recraft V3. Тестировщики отмечают, что Imagen 4 особенно хороша в создании реалистичных сцен и обработке сложных промптов, но слабее в стилизованных и абстрактных работах.

люди на горе сгенерированное изображение
Пример генерации в Google Imagen 4 Источник: Google

Все созданные изображения автоматически получают невидимые цифровые водяные знаки SynthID для обеспечения прозрачности. Компания планирует ввести дополнительные тарифные планы в ближайшие недели, а пока пользователи могут запросить повышение лимитов скорости.

По умолчанию установлен лимит в 20 запросов в минуту на проект. Версия Ultra также поддерживает экспорт в разрешении 2K через Vertex AI.

Google позиционирует новинку как часть расширенного творческого стека, включающего модели Imagen, Veo и семейство Gemini. Компания делает ставку на привлечение как разработчиков, так и корпоративных клиентов через гибкое ценообразование и щедрые бесплатные лимиты.

Также ранее Google представила нейросеть для создания музыки. Рассказали о ней в статье.