
Разработчики Apple Research выпустили UniGen 1.5 — ИИ-модель, предназначенную для генерации картинок по текстовому описанию. Эта модель способна «понимать» изображения, редактировать и создавать их с нуля.
Главной фишкой UniGen 1.5 является функция «додумывания». Генератор картинок может самостоятельно интерпретировать намерение пользователя на уровне текста перед тем, как приступать к работе. Простыми словами, если пользователь напишет запрос «убери задний фон и окрась объект в другой цвет», ИИ сначала переформулирует промпт для самого себя, чтобы он был более точным, конкретным и понятным для создания изображения.

В Apple Research сообщили, что разработка этой функции было самым сложным в процессе создания UniGen 1.5. В тестах на взаимодействие с пользователем ИИ-модель превосходит почти все современные генераторы картинок.
Однако есть один нюанс — UniGen 1.5 выдает картинки плохого качества и в низком разрешении. Пока ИИ-модель плохо справляется с высокодетализированными картинками, сложными текстурами и надписями на фото. Сейчас уровень качества работ UniGen 1.5 примерно такое же, как у Midjourney, Kandinsky и DALL-E двухгодовалой давности.


UniGen 1.5 является внутренним проектом Apple, поэтому протестировать ее нельзя. Не исключено, что вскоре UniGen 1.5 будут использовать для новых функций Apple Intelligence, например, для генерации изображений в приложении Image Playground.

