Apple представила генератор картинок UniGen 1.5

Он отстает от конкурентов на 2 года.
Автор Hi-Tech Mail
Пример работы UniGen 1.5
Пример работы UniGen 1.5

Разработчики Apple Research выпустили UniGen 1.5 — ИИ-модель, предназначенную для генерации картинок по текстовому описанию. Эта модель способна «понимать» изображения, редактировать и создавать их с нуля.

Главной фишкой UniGen 1.5 является функция «додумывания». Генератор картинок может самостоятельно интерпретировать намерение пользователя на уровне текста перед тем, как приступать к работе. Простыми словами, если пользователь напишет запрос «убери задний фон и окрась объект в другой цвет», ИИ сначала переформулирует промпт для самого себя, чтобы он был более точным, конкретным и понятным для создания изображения.

UniGen 1.5

В Apple Research сообщили, что разработка этой функции было самым сложным в процессе создания UniGen 1.5. В тестах на взаимодействие с пользователем ИИ-модель превосходит почти все современные генераторы картинок.

Однако есть один нюанс — UniGen 1.5 выдает картинки плохого качества и в низком разрешении. Пока ИИ-модель плохо справляется с высокодетализированными картинками, сложными текстурами и надписями на фото. Сейчас уровень качества работ UniGen 1.5 примерно такое же, как у Midjourney, Kandinsky и DALL-E  двухгодовалой давности.

UniGen 1.5
UniGen 1.5

UniGen 1.5 является внутренним проектом Apple, поэтому протестировать ее нельзя. Не исключено, что вскоре UniGen 1.5 будут использовать для новых функций Apple Intelligence, например, для генерации изображений в приложении Image Playground.