Google Labs представил новый экспериментальный инструмент под названием Whisk, который кардинально упрощает процесс создания изображений с помощью генеративного ИИ. В отличие от привычных методов, где для генерации изображений требуется длинное текстовое описание, Whisk позволяет использовать визуальные подсказки. Пользователи могут просто перетащить изображения для объекта, сцены и стиля, чтобы создать уникальные комбинации, будь то эмалевые значки, цифровые иллюстрации или фантастические образы.
Система использует модель Gemini для создания детальных описаний загруженных изображений. Затем эти описания передаются в генеративную модель Imagen 3, которая генерирует новые творения, сохраняя суть выбранных элементов, но интерпретируя их по-своему. Такой подход позволяет микшировать и ремиксировать визуальные идеи, создавая неожиданные и креативные результаты.
Примеры изображений, созданных с помощью Whisk, впечатляют:
- Причудливый морж с клубничным узором и цветочной короной.
- Фантастическая рыба с городом на спине.
- Глазированный пончик, превращенный в яркий эмалевый значок.
- Мистическая кошка с рогами, отдыхающая на водной лилии.
Важное преимущество Whisk — это скорость и интуитивность процесса. Инструмент позволяет художникам и дизайнерам экспериментировать с десятками вариантов, меняя образы и стили на лету. Сгенерированные изображения можно дорабатывать, просматривать подсказки и добавлять текстовые детали для уточнения результата.
Команда Google Labs подчеркивает, что Whisk не является традиционным редактором изображений. Это инструмент для творческого исследования и визуального микширования, который помогает находить свежие идеи и креативные решения.
Доступ к Whisk пока открыт только для пользователей в США. Они уже могут попробовать его функциональность на labs.google/whisk и поделиться обратной связью. Следить за новыми экспериментами от Google можно также на платформах X, Reddit и Discord.
Читайте также нашу статью о нейросети от Google — Gemini 2.0.