
OpenAI представила функцию генерации изображений в своей новейшей модели GPT-4o, которая теперь доступна всем пользователям ChatGPT, включая бесплатный тариф. Hi-Tech Mail рассказывает о том, на что способен новый инструмент.
Что нового в генераторе изображений GPT-4o
OpenAI интегрировала функцию генерации изображений непосредственно в ChatGPT, сделав ее доступной по умолчанию для всех пользователей. Бесплатные аккаунты могут создавать до 1−3 изображений в день, в то время как подписчики Plus, Pro и Team получили расширенный доступ.

GPT-4o использует принципиально новый подход к созданию изображений. Вместо традиционного метода, применяемого в DALL-E 3, новая модель строит изображения последовательно, пиксель за пикселем, что обеспечивает более детализированные и точные результаты. Это позволяет генерировать фотореалистичные изображения с высокой точностью передачи текста и мельчайших деталей.
Как создать изображение с помощью ChatGPT-4o
Процесс создания изображений с GPT-4o предельно прост:
- Войдите в свой аккаунт ChatGPT через веб-сайт или мобильное приложение;
- Убедитесь, что выбрана модель GPT-4o;
- Начните новый чат и опишите желаемое изображение.
Вы можете запросить конкретный стиль, указать точные цвета с помощью hex-кодов или попросить прозрачный фон. Модель также отлично справляется с добавлением текста на изображения — функция, с которой раньше у ИИ-генераторов возникали проблемы.
Практическое применение GPT-4o для создания изображений
Новый генератор изображений открывает множество возможностей для творчества и бизнеса. Вот некоторые из них.
Дизайн и маркетинг

- Создание профессиональных логотипов для стартапов;
- Разработка фирменных персонажей и маскотов;
- Генерация инфографики с точным отображением текста;
- Дизайн маркетинговых материалов и флаеров.
Социальные медиа и веб-дизайн

- Создание готовых постов для социальных сетей;
- Разработка макетов веб-сайтов на основе текстовых описаний;
- Генерация фотореалистичных изображений продуктов и упаковки.
Творчество и образование

- Иллюстрации для рассказов и книг;
- Сложные графические дизайны и обложки журналов;
- Трансформация известных картин в 3D-реалистичные изображения.

Особенности и ограничения
GPT-4o генерирует изображения дольше, чем предыдущие модели — до одной минуты на создание одного изображения, но результат стоит ожидания. Система не создает контент насильственного или непристойного характера, политическую пропаганду или медицинские советы.
Важно отметить, что все изображения, созданные с помощью ChatGPT, содержат метаданные, идентифицирующие их как AI-генерированные. Это помогает бороться с потенциальным злоупотреблением технологии, например, для создания поддельных чеков или документов.

Интеграция с рабочим процессом
Одно из главных преимуществ генератора изображений GPT-4o — его интеграция в интерфейс чата. Это позволяет легко корректировать результаты с помощью простых текстовых запросов и использовать контекст предыдущего разговора.
Вы также можете загружать эталонные изображения и просить ChatGPT создать их вариации или использовать их элементы в новых композициях. Например, добавьте селфи и попросите преобразовать его в аниме-стиль.

С момента запуска функция генерации изображений GPT-4o вызвала огромный интерес пользователей. По словам CEO OpenAI Сэма Альтмана, спрос был настолько высоким, что «GPU компании плавились». Особую популярность приобрели изображения в стиле студии Ghibli, что даже вызвало вопросы о возможных проблемах с авторскими правами.
Новая функция генерации изображений в ChatGPT-4o представляет собой значительный шаг вперед в области искусственного интеллекта, делая создание качественного визуального контента доступным для всех. Но вместе с пользой технология также несет и вред для ряда профессий — и не только для художников и дизайнеров. Стало известно, что H&M нанимает цифровых клонов вместо людей. Рассказали об этом в статье.