Google представила Whisk — новый генератор изображений с функцией «ремикса»

Инструмент позволяет художникам и дизайнерам экспериментировать с десятками вариантов изображений, меняя образы и стили на лету.
Автор новостей
Whisk

Google Labs представил новый экспериментальный инструмент под названием Whisk, который кардинально упрощает процесс создания изображений с помощью генеративного ИИ. В отличие от привычных методов, где для генерации изображений требуется длинное текстовое описание, Whisk позволяет использовать визуальные подсказки. Пользователи могут просто перетащить изображения для объекта, сцены и стиля, чтобы создать уникальные комбинации, будь то эмалевые значки, цифровые иллюстрации или фантастические образы.

Система использует модель Gemini для создания детальных описаний загруженных изображений. Затем эти описания передаются в генеративную модель Imagen 3, которая генерирует новые творения, сохраняя суть выбранных элементов, но интерпретируя их по-своему. Такой подход позволяет микшировать и ремиксировать визуальные идеи, создавая неожиданные и креативные результаты.

Примеры изображений, созданных с помощью Whisk, впечатляют:

  • Причудливый морж с клубничным узором и цветочной короной.
Причудливый морж с клубничным узором и цветочной короной.
  • Фантастическая рыба с городом на спине.
Фантастическая рыба с городом на спине
  • Глазированный пончик, превращенный в яркий эмалевый значок.
Глазированный пончик, превращенный в яркий эмалевый значок
  • Мистическая кошка с рогами, отдыхающая на водной лилии.
Мистическая кошка с рогами, отдыхающая на водной лилии

Важное преимущество Whisk — это скорость и интуитивность процесса. Инструмент позволяет художникам и дизайнерам экспериментировать с десятками вариантов, меняя образы и стили на лету. Сгенерированные изображения можно дорабатывать, просматривать подсказки и добавлять текстовые детали для уточнения результата.

Команда Google Labs подчеркивает, что Whisk не является традиционным редактором изображений. Это инструмент для творческого исследования и визуального микширования, который помогает находить свежие идеи и креативные решения.

Доступ к Whisk пока открыт только для пользователей в США. Они уже могут попробовать его функциональность на labs.google/whisk и поделиться обратной связью. Следить за новыми экспериментами от Google можно также на платформах X, Reddit и Discord.

Читайте также нашу статью о нейросети от Google — Gemini 2.0.