НовостиОбзорыВсе о нейросетяхБытовая техника 2024ГаджетыТехнологииНаукаСоцсетиЛайфхакиFunПромокодыСтранные вопросыЭксперты

Как пользоваться нейросетью Midjourney в 2024 году

14 мая 2024
Midjourney (произносится как «Миджорни») — это нейросеть, которая позволяет создавать изображения на основе текстового описания. В этой статье мы расскажем об основных возможностях Midjourney и о том, как с ней работать.

Midjourney помогает профессиональным дизайнерам и обычным пользователям генерировать изображения. С ее помощью иллюстрируют персонажей игры, создают видеоролики и даже придумывают дизайн чехлов для iPhone за полмиллиона рублей. Рассказываем, как пользоваться Midjourney, чтобы создавать изображения.

Что такое Midjourney простыми словами

Нейросеть Midjourney способна создать картинку с помощью AI (ИИ, искусственный интеллект) на основе текстового описания, промта. Это работает так: вы пишете Midjourney что и в каком стиле хотите нарисовать, затем добавляете деталей, новых элементов — и получаете готовое изображение. Художникам и дизайнерам нравится Midjourney за бесконечное вдохновение, экономию времени и огромное разнообразие визуальных стилей

За доступ к Midjourney придется оформить подписку, а сама нейросеть работает не на обычном сайте, а в виде бота в Discord.

Полезная информация об использовании Midjourney

Разработчик
Midjourney, Inc.
Даты выходаИюль 2022 года
ТипИскусственный интеллект, основанный на модели трансформера
Основное назначение
Генерация изображения по текстовому описанию
ВерсииV1 (февраль 2022 года)
V2 (апрель 2022 года)
V3 (июль 2022 года)
V4 (ноябрь 2022 года)
V5 (март 2023 года)
V5.1 (май 2023 года)
V5.2 (июнь 2023 года)
V6 (декабрь 2023 года)
ЯзыкиМультиязычный, включая русский. Лучший результат — на английском языке
Стоимостьот $10 до $120 в месяц
Похожие сервисы
DALL-E от OpenAI
Stable Diffusion от Stability AI
Шедеврум от Яндекса
Kandinsky от Сбера
Gerwin AI

Пошаговая инструкция по использованию нейросети Midjourney

Нейросеть Midjourney работает на базе приложения Discord (читается как «Дискорд»). Поэтому вам нужно иметь аккаунт и получить приглашение в сообщество, то есть на сервер, если руководствоваться терминологией Discord. Сделать это можно, следуя пошаговой инструкции.

1. Подключаемся к серверу Discord

Сначала перейдите на официальный сайт Midjourney и нажмите кнопку Join the Beta — это перебросит вас на сайт Discord.

Если у вас уже есть аккаунт, и вы авторизованы, то нажмите «Принять приглашение». Если аккаунт есть, но вы не входили в него на сайте, нажмите «Уже зарегистрированы?» и введите данные. Если аккаунта нет, введите желаемое имя в соответствующее поле и нажмите «Продолжить». Следуйте инструкциям для регистрации аккаунта.

Если все сделано правильно, вы присоединитесь к серверу Midjourney. Для начала работы, зайдите в любой из чатов newbies. Если каналов на сервере нет, перезапустите приложение Discord или браузер.

2. Разбираемся, как устроен дискорд-сервер Midjourney

На канале вы увидите запросы других пользователей и полученные результаты. Это хорошая возможность ознакомиться с тем, что может предложить нейросеть. Чтобы начать генерировать собственные изображения, введите /imagine и кликните на предложенной команде prompt.

Теперь нужно придумать запрос. Начните вводить описание желаемого изображения (в помощь для генерации описания можно использовать бота ChatGPT). Писать можно и на русском языке, но на английском результаты получаются более качественные и предсказуемые. Слова разделяйте запятыми, а в конце можно указать технические параметры через два дефиса. Например, чтобы задать соотношение сторон изображений, нужно добавить «—ar 16:9»).

Обратите внимание, что есть список стоп-слов, которые нельзя использовать при работе. Помимо очевидных, в него почему-то входят Tik Tok, Jinping (имеется в виду китайский лидер Си Цзиньпин), а также Chairman Mao (думаем, что перевод тут не нужен).

Для теста возьмем следующий пример: «soviet santa claus, moscow, unreal engine, cinematic lighting, ultra realistic, —ar 16:9». В итоге появятся четыре разных изображения, созданных по текстовому описанию. Если они вас не устраивают, то можно поправить описание и сгенерировать еще раз. Или можно продолжить работать с ними дальше.

3. Настраиваем Midjourney

У Midjourney есть ряд настроек, их можно открыть с помощью команды «/settings». Они влияют на качество результата генерации.

  • Настройка версии — позволяет выбрать не только самую актуальную, но и предыдущие версии нейросети.
  • Качество изображения — настройка влияет на детализацию изображения, а не на его разрешение.
  • Настройки стиля — определяет, насколько точно сгенерированное изображение по стилю совпадает с текстовым промтом.
  • Настройки приватности — по умолчанию ваши промты и изображения видны всем пользователям «ветки».
  • Скорость генерации — в более дорогих планах скорость генерации выше.

4. Изучаем команды в Midjourney

Команды, перед которыми стоят два дефиса (в примере выше это —wallpaper), позволяют задать технические параметры изображения. Их всегда нужно указывать в конце. Некоторые параметры могут со временем меняться, так как проект активно дорабатывается. Так, с середины марта 2023 года нейросеть обновилась до 5-й версии, в которой повысилось качество и детализация, также Midjourney наконец научилась лучше отрисовывать руки и пальцы. Список популярных параметров, которые можно добавить к запросу:

КомандаЧто делаетПример
--v
Версия алгоритма, доступны значения от 1 до 5 (первая версия больше подходит для абстрактных изображений и текстур)
--v 4
--beta
Экспериментальный алгоритм, который выдает 2 результата вместо 4 и обрабатывается дольше

--hd
Альтернативный алгоритм, который больше подходит для абстрактных изображений и пейзажей

--stop
Останавливает генерацию изображения на указанном проценте от 10 до 100
--stop 25
--uplight
Использует более «щадящий» апскейл, то есть ближе к оригинальному изображению, аналогичен кнопке Light Upscale

--upbeta
Использует бета-апскейл, который изначально создает изображение более высокого разрешения, аналогичен кнопке Beta Upscale

--seed
Значение, которое используется для получения схожих результатов при каждом новом запросе. Можно указать любое целое число в промежутке от 0 до 4294967295. Если вы не выбрали значение, то оно устанавливается случайным образом. Узнать его можно, если переслать результат себе в личные сообщения
--seed 1248
--sameseed
При генерации все четыре изображения будут использовать одинаковый seed, что сделает их похожими

--q
Качество изображения, можно указать число от 0.25 до 5. По умолчанию используется 1 (равно минуте времени GPU). Чем выше число, тем больше ресурсов расходуется (не забываем про лимит в 25 GPU-минут)
--q .25
--s
Насколько сильной будет стилизация изображения. Значение по умолчанию равно 2500. Можно указать от 625 до 60000
--s 5600
--video
Создает и сохраняет видео с процессом генерации изображения, которое будет отправлено в личные сообщения. Нужно отреагировать на сообщение с эмодзи в виде конверта

--iw
Позволяет задать вес (то есть насколько сильно будет его влияние на результат) референсного изображения. Загрузите изображение в чат, затем скопируйте URL и вставьте его в строку для описания (то есть в prompt, который появляется после /imagine). По умолчанию значение равно .25, значение 1 делает вес изображения таким же важным, как и у описательного текста
--iw .25
--ar
Задает соотношение сторон
--ar 16:9
--no
Позволяет исключить объекты
--no cats
--wallpaper
Создается детальное и качественное изображение, можно использовать вместо ключевых слов вроде hyper detailed, micro details, enhanced quality, studio quality, 4K и подобных

Это не строгие правила, запрос можно формировать гораздо проще, без использования разделителей и с минимальным описанием. Когда человек дает Midjourney творческую свободу при создании картинок, нейросеть способна выдавать действительно достойный результат.

Выбрать параметры также можно в настройках. Напечатайте и введите команду /settings, чтобы открыть меню. В настройках дублируются некоторые из команд. Если их активировать, то не нужно будет набирать каждый раз вручную. Они будут подставляться в запрос автоматически.

5. Пишем запрос и генерируем изображение

Сообщество выработало определенную структуру и формат запроса:

  1. Первая часть описывает, что именно должно быть изображено.
  2. Вторая часть дает представление о стиле.
  3. Третья уточняет технические параметры.

Части нужно разделять двумя двоеточиями, а слова внутри — запятыми. Но не обязательно делить запрос именно на три части. Пример: Snegurochka, Snow Maiden:: USSR, Moscow, The Red Square, night, christmas lights:: unreal engine, cinematic lighting, ultra realistic: : —wallpaper.

В помощь начинающим пользователям и для облегчения работы с нейросетью можно порекомендовать специальные сайты и сервисы, которые предназначены для составления запроса и поиска новых параметров.

promptoMANIA — продвинутый сервис с готовыми шаблонами, в котором параметры проиллюстрированы. Однако придется потратить какое-то время, чтобы разобраться, так как у сервиса перегруженный интерфейс.

Prompter — оформлен в виде таблицы Google. Без знания английского им будет сложно пользоваться, так как нет визуальных подсказок.

Phraser — простой в освоении сервис, который позволит подобрать нужное описание и покажет примерный результат на основе похожих изображений.

Midjourney Prompt Helper — сервис с минималистичным интерфейсом. Пользоваться им не очень удобно из-за отсутствия визуальных референсов, но при достаточном знании языка можно подобрать идеи для описаний и новые ключевые слова.

6. Дорабатываем картинку

Разберем дальнейшую обработку изображения на примере запроса (без кавычек): «Detailing oil painting of christmas street, young woman —v 4 —ar 3:2 —upbeta —q 2». Пока не обращайте внимание на дополнительные команды, мы разберем их позже.

После того, как нейросеть выдаст четыре изображения, работа еще не закончена. Под картинками расположены дополнительные команды. Номер означает, к какому изображению будет применено действие: 1 — верхнее левое, 2 — верхнее правое, 3 — нижнее левое, 4 — нижнее правое.

  • U — увеличивает и улучшает выбранное изображение;
  • V — генерирует еще четыре похожих изображения на основе исходного;
  • значок с двумя стрелками — варианты генерируются заново.

Если вы решили дальше работать с изображением, нажмите «U». Система выдаст более детализированное изображение большего размера. В дальнейшем с ним тоже можно поработать, выбрав из нескольких вариантов:

  • Make Variations — создает похожие изображения;
  • Light Upscale Redo — легкая перерисовка исходного изображения;
  • Beta Upscale Redo — экспериментальный апскейл (то есть увеличение),
  • Detailed Upscale Redo — более серьезная перерисовка изображения;
  • Remaster — полностью перерисовывает изображение, основываясь на исходнике;
  • Upscale to Max — улучшение до максимального качества;
  • Web — открывает изображение в полном размере в отдельной вкладке браузера.

Предугадать, как будут выглядеть дальнейшие варианты, не так просто. При этом стоит понимать, что обработанные картинки не всегда будут лучше. Первые четыре варианта могут оказаться самыми удачными.

7. Сохраняем изображение

Чтобы ваши запросы не утонули в потоке сообщений, воспользуйтесь кнопкой «Почта», которая расположена в правом верхнем углу. Перейдите на вкладку «Упоминания», и вы увидите все ваши генерации.

Также можно попросить бота отправить результаты в личные сообщения. Для этого нужно отреагировать на пост с эмодзи в виде письма. Перейдите к сообщению и нажмите «Добавить реакцию», введите в поиске envelope и выберите соответствующий значок.

Чтобы сохранить файл, нажмите на изображение в чате и далее кликните на «Открыть оригинал». Картинка высокого разрешения откроется в новом окне браузера, откуда ее уже можно сохранить на компьютер.

Если вам нужна только одна картинка из четырех и в максимальном качестве, то нужно сделать апскейл (кнопка U). Получившееся изображение можно сохранить точно так же, через «Открыть оригинал».

Результаты генерации можно найти и на официальном сайте Midjourney. В этом случае нужно авторизоваться через Discord, изображения будут в личном кабинете. Найдите нужную картинку среди ранее созданных и кликните на значке с дискетой, чтобы сохранить ее. К сожалению, кнопки «Поделиться» нет.

Советы, как правильно составлять запрос в Midjourney

Помните, что нейросеть — всего лишь инструмент в руках человека. Красивые изображения редко получаются с первого раза. У Midjourney нет волшебной кнопки, которую нужно нажать, чтобы сделать шедевр. Даже 200 минут, который доступны на базовом тарифе могут очень быстро уйти в никуда, пока вы будете экспериментировать. Добиться желаемого результата можно, если научиться правильно писать запросы. Поэтому вначале лучше изучить советы и правила, чтобы повысить свои шансы на успех.

1. Нейросеть не всегда понимает сложные предложения, фразы и контекст

Старайтесь выражаться проще, иначе результаты могут быть далеки от того, как вы их себе представляли. Не пишите «Аленушка горюет по младшему брату», лучше выразиться так: «Молодая женщина сидит на берегу реки с печальным выражением лица». Такое описание бот должен понять однозначно, так как вы описываете конкретный образ, а вот кто такая Аленушка можно интерпретировать по-разному.

2. Используйте общеизвестные и популярные образы, которые легко найти на картинках в сети

В нашем случае нейросеть не поняла, кто такой Father Frost (английское название нашего Деда Мороза), но смогла нарисовать советского Санта-Клауса. Если обратиться к поиску по картинкам Google, то там тоже не все однозначно. Поэтому будет проще, если вы заранее изучите публикации по вашему запросу в поисковиках.

3. Чем точнее вы создадите запрос, тем ближе он будет к вашим ожиданиям

Если вы напрямую не прописали какой-либо параметр, то он генерируется случайным образом. Примерно как известный мем про штаны Арагорна: если Толкин не упоминал, что Арагорн носил штаны, значит, читатель может додумывать этот элемент по своему усмотрению.

4. Подмечайте удачные запросы других пользователей и меняйте их по своему усмотрению

Благодаря тому, что вы можете видеть запросы других пользователей (как и они ваши), никто не запрещает заимствовать удачные формулировки. C их помощью зачастую можно получить аналогичные по качеству результаты.

5. Задавайте стиль изображения

Будет ли это рисунок, компьютерная графика, реалистичная фотография. Также можно давать референсы в виде известных художников, чтобы нейросеть Midjourney подражала их стилю. Например, можно приписать к запросу: by Claude Monet.

6. Повторная генерация

Если первые созданные изображения получились неудачные, то лучше не тратить попытки сгенерировать их повторно и начать с нуля, подбирая новые уточняющие ключевые слова и удаляя лишние. Кроме того, иногда стоит попробовать наиболее простые формулировки без уточняющих деталей.

Примеры сгенерированных картинок

Стоимость подписки для использования Midjourney

Доступ к нейросети Midjourney возможен по подписке. Существуют четыре тарифа, которые можно оплачивать помесячно или сразу на год.

ПланСтоимостьЧто дает
Базовый
$10 (925 ₽) в месяц или $96 (8888 ₽)
200 минут для генерации, доступ к пользовательской галерее, права на коммерческое использование (например, можно генерить арты и персонажей для игры или создавать дизайн сайта), возможность одновременной генерации 3 картинок
Стандартный$30 (2775 ₽) в месяц или $288 (26 664 ₽) в год
Все что в базовой версии подписки, но 15 часов (вместо 200 минут) для генераций с наивысшим приоритетом и безлимит для работы в стандартном режиме (так называемый relax mode предполагает, что ваше задание помещается в очередь)
Профессиональный
$60 (5555 ₽) в месяц или $576 (53 328 ₽) в год
Все что выше, но 30 часов быстрой генерации, а также возможность одновременных заданий до 12
Мега$120 (11 110 ₽) в месяц или $1 152 (106 657 ₽) в год
Все что выше, но 60 часов быстрой генерации

Для личного пользования подойдет базовый план за 10 долларов в месяц, однако карты российских банков система не принимает, поэтому придется искать обходные пути. Как вариант, можно воспользоваться услугами посредников. В частности, в мессенджере Telegram есть боты, которые умеют работать с нейросетями (не только c Midjourney, но и другими, например, с ChatGPT).

Вопросы и ответы

У Midjourney много тонкостей, о которых нужно знать. Вот самые часто задаваемые вопросы о нейросети.

Можно ли в Midjourney соединить два изображения?

Да, Midjourney может объединять две картинки в одну. Например, объединить портреты двух человек. Создание такого изображения несколько отличается от стандартной генерации. Для этого в настройках нужно выставить Remix Mode, а затем загрузить в Discord два изображения и вставить ссылки в строку prompt. Нейросеть в результате сделает микс из двух картинок. Результаты могут быть неожиданными.

Можно ли пользоваться Midjourney бесплатно и без ограничений?

Первоначально нейросеть Midjourney была доступна бесплатно всем желающим, но затем разработчики приостановили пробный доступ на неопределенное время. Поэтому на текущий момент для работы с нейросетью нужна платная подписка.

Какие есть бесплатные аналоги Midjourney?

Бесплатных сервисов для генерации изображений по текстовому промту много. Из отечественных — «Шедеврум» от «Яндекса» или Kandinsky от «Сбера». Из зарубежных популярны Playground AI, DeepAI, Dalle Mini, ImageFX от Google. Большинство платных AI-генераторов изображений имеют триал или бесплатные версии с лимитом на количество выдаваемых работ.

Можно ли выставлять в социальные сети изображения, созданные Midjourney?

Да, можно. Согласно условиям Midjourney, человек обладает полными правами на изображение, которое он создал в сервисе и может делать с ними что пожелает. Но если вы хотите использовать сгенерированные картинки в коммерческих целях, придется оформить подписку Pro или Mega.

Денис Акатов