Как пользоваться нейросетью Midjourney

Midjourney (произносится как «Миджорни») — это нейросеть, которая позволяет создавать изображения на основе текстового описания. В этой статье мы расскажем об основных возможностях Midjourney и о том, как с ней работать.
Как подключиться к Discord
Ограничения и тарифы
Как доработать изображение
Как сохранить картинки
Общие советы
Структура и параметры запроса
Как соединить два изображения
Сервисы для составления запроса
Как подключиться к Discord
Ограничения и тарифы
Как доработать изображение
Как сохранить картинки
Общие советы
Структура и параметры запроса
Как соединить два изображения
Сервисы для составления запроса
Ещё

Как пользоваться Midjourney

Нейросеть Midjourney способна создать картинку с помощью AI (ИИ, искусственный интеллект) на основе текстового описания. Вам потребуется выполнить несколько простых шагов, прежде, чем вы сможете приступить к созданию изображений.

Как подключиться к серверу Discord и получить доступ к Midjourney

Нейросеть Midjourney работает на базе приложения Discord (читается как «Дискорд»). Поэтому вам нужно иметь аккаунт и получить приглашение в сообщество, то есть на сервер, если руководствоваться терминологией Discord. Сделать это можно, следуя пошаговой инструкции.

Сначала перейдите на официальный сайт Midjourney и нажмите кнопку Join the Beta — это перебросит вас на сайт Discord.

Если вы хотите зарегистрировать новый аккаунт, введите имя и нажмите «Продолжить», если у вас есть аккаунт, нажмите «Уже зарегистрированы?»
Если вы хотите зарегистрировать новый аккаунт, введите имя и нажмите «Продолжить», если у вас есть аккаунт, нажмите «Уже зарегистрированы?»

Если у вас уже есть аккаунт, и вы авторизованы, то нажмите «Принять приглашение». Если аккаунт есть, но вы не входили в него на сайте, нажмите «Уже зарегистрированы?» и введите данные. Если аккаунта нет, введите желаемое имя в соответствующее поле и нажмите «Продолжить». Следуйте инструкциям для регистрации аккаунта.

Так выглядит окно авторизации
Так выглядит окно авторизации

Если все сделано правильно, вы присоединитесь к серверу Midjourney. Для начала работы, зайдите в любой из чатов newbies. Если каналов на сервере нет, перезапустите приложение Discord или браузер.

Чаты расположены в левой части приложения
Чаты расположены в левой части приложения

Ограничения и тарифы

Первоначально нейросеть Midjourney была доступна бесплатно всем желающим, но затем разработчики приостановили пробный доступ на неопределенное время. Поэтому на текущий момент для работы с нейросетью нужна платная подписка. Ниже для справки мы приводим прежние условия и актуальную информацию.

Прежние условия (на текущий момент неактуально): каждому пользователю бесплатно дается 25 так называемых GPU-минут. На стандартном качестве этого хватит на генерацию 25 картинок. Но сюда входят не только новые генерации, но и доработка уже созданных изображений. Чтобы снять ограничения, нужно купить подписку. Также есть вариант завести новый аккаунт для Discord, но для этого потребуется и новый номер телефона.

Актуальные условия: доступ к нейросети Midjourney возможен по подписке. Есть три тарифа, которые можно оплачивать помесячно или сразу на год.

  1. Базовый план стоимостью $10 (780 ₽) в месяц или $96 (7488 ₽) в год дает 200 минут для генерации, доступ к пользовательской галерее, права на коммерческое использование (например, можно генерить арты и персонажей для игры или создавать дизайн сайта), возможность одновременной генерации 3 картинок.
  2. Стандартный план стоимостью $30 (2340 ₽) в месяц или $288 (22 464 ₽) в год обладает всеми преимуществами базовой версии подписки, но отличается тем, что дает 15 часов для генераций с наивысшим приоритетом и безлимит для работы в стандартном режиме (так называемый relax mode предполагает, что ваше задание помещается в очередь).
  3. Профессиональный план стоимостью $60 (4680 ₽) в месяц или $576 (44 928 ₽) в год дает уже 30 часов быстрой генерации, а также увеличивает возможность одновременных заданий до 12.

Для дома подойдет базовый план за 10 долларов в месяц, однако карты российских банков система не принимает, поэтому придется искать обходные пути. Как вариант, можно воспользоваться услугами посредников. В частности, в мессенджере Telegram есть боты, которые умеют работать с нейросетями (не только c Midjourney, но и другими, например, с ChatGPT).

Как сгенерировать изображение

На канале вы увидите запросы других пользователей и полученные результаты. Это хорошая возможность ознакомиться с тем, что может предложить нейросеть. Чтобы начать генерировать собственные изображения, введите /imagine и кликните на предложенной команде prompt.

При первом использовании выскочит сообщение, в котором нужно принять правила использования сервиса. Нажмите Accept ToS
При первом использовании выскочит сообщение, в котором нужно принять правила использования сервиса. Нажмите Accept ToS

Теперь нужно придумать запрос. Начните вводить описание желаемого изображения (в помощь для генерации описания можно использовать бота ChatGPT). Писать можно и на русском языке, но на английском результаты получаются более качественные и предсказуемые. Слова разделяйте запятыми, а в конце можно указать технические параметры через два дефиса (например, чтобы задать соотношение сторон изображений, нужно добавить «—ar 16:9»).

Обратите внимание, что есть список стоп-слов, которые нельзя использовать при работе. Помимо очевидных слов, в него почему-то входят Tik Tok, Jinping (имеется в виду китайский лидер Си Цзиньпин), а также Chairman Mao (думаем, что перевод тут не нужен).

Почему-то запрос Father Frost нейросеть не поняла, но как мог бы выглядеть советский Санта, вероятно, представляет. Первые два изображения получились неплохо
Почему-то запрос Father Frost нейросеть не поняла, но как мог бы выглядеть советский Санта, вероятно, представляет. Первые два изображения получились неплохо

Для теста возьмем следующий пример: «soviet santa claus, moscow, unreal engine, cinematic lighting, ultra realistic, —ar 16:9». В итоге появятся четыре разных изображения, созданных по текстовому описанию. Если они вас не устраивают, то можно поправить описание и сгенерировать еще раз. Или можно продолжить работать с ними дальше.

Как доработать изображение

Разберем дальнейшую обработку изображения на примере запроса (без кавычек): «Detailing oil painting of christmas street, young woman —v 4 —ar 3:2 —upbeta —q 2». Пока не обращайте внимание на дополнительные команды, мы разберем их позже.

Иногда лучше дать нейросети побольше свободы
Иногда лучше дать нейросети побольше свободы

После того, как нейросеть выдаст четыре изображения, работа еще не закончена. Под картинками расположены дополнительные команды. Номер означает, к какому изображению будет применено действие: 1 — верхнее левое, 2 — верхнее правое, 3 — нижнее левое, 4 — нижнее правое.

  • U — увеличивает и улучшает выбранное изображение;
  • V — генерирует еще четыре похожих изображения на основе исходного;
  • значок с двумя стрелками — варианты генерируются заново.
Изображение, после выполнения команды U
Изображение, после выполнения команды U

Если вы решили дальше работать с изображением, нажмите «U». Система выдаст более детализированное изображение большего размера. В дальнейшем с ним тоже можно поработать, выбрав из нескольких вариантов:

  • Make Variations — создает похожие изображения;
  • Light Upscale Redo — легкая перерисовка исходного изображения;
  • Beta Upscale Redo — экспериментальный апскейл (то есть увеличение),
  • Detailed Upscale Redo — более серьезная перерисовка изображения;
  • Remaster — полностью перерисовывает изображение, основываясь на исходнике;
  • Upscale to Max — улучшение до максимального качества;
  • Web — открывает изображение в полном размере в отдельной вкладке браузера.
Изображение после команды Remaster
Изображение после команды Remaster

Предугадать, как будут выглядеть дальнейшие варианты, не так просто. При этом стоит понимать, что обработанные картинки не всегда будут лучше. Первые четыре варианта могут оказаться самыми удачными.

Как сохранить картинки

Чтобы ваши запросы не утонули в потоке сообщений, воспользуйтесь кнопкой «Почта», которая расположена в правом верхнем углу. Перейдите на вкладку «Упоминания», и вы увидите все ваши генерации.

Также можно попросить бота отправить результаты в личные сообщения. Для этого нужно отреагировать на пост с эмодзи в виде письма. Перейдите к сообщению и нажмите «Добавить реакцию», введите в поиске envelope и выберите соответствующий значок.

Чтобы сохранить файл, нажмите на изображение в чате и далее кликните на «Открыть оригинал». Картинка высокого разрешения откроется в новом окне браузера, откуда ее уже можно сохранить на компьютер.

Если вам нужна только одна картинка из четырех и в максимальном качестве, то нужно сделать апскейл (кнопка U). Получившееся изображение можно сохранить точно так же, через «Открыть оригинал».

Результаты генерации можно найти и на официальном сайте Midjourney. В этом случае нужно авторизоваться через Discord, изображения будут в личном кабинете. Найдите нужную картинку среди ранее созданных и кликните на значке с дискетой, чтобы сохранить ее. К сожалению, кнопки «Поделиться» нет.

Как правильно написать запрос в Midjourney

Помните, что нейросеть — всего лишь инструмент в руках человека. Красивые изображения редко получаются с первого раза. У Midjourney нет волшебной кнопки, которую нужно нажать, чтобы сделать шедевр. Даже 200 минут, который доступны на базовом тарифе могут очень быстро уйти в никуда, пока вы будете экспериментировать. Добиться желаемого результата можно, если научиться правильно писать запросы. Поэтому вначале лучше изучить советы и правила, чтобы повысить свои шансы на успех.

Общие советы по работе с Midjourney

Нейросеть не всегда понимает сложные предложения, фразы и контекст. Старайтесь выражаться проще, иначе результаты могут быть далеки от того, как вы их себе представляли. Не пишите «Аленушка горюет по младшему брату», лучше выразиться так: «Молодая женщина сидит на берегу реки с печальным выражением лица». Такое описание бот должен понять однозначно, так как вы описываете конкретный образ, а вот кто такая Аленушка можно интерпретировать по-разному.

Используйте общеизвестные и популярные образы, которые легко найти на картинках в сети. В нашем случае нейросеть не поняла, кто такой Father Frost (английское название нашего Деда Мороза), но смогла нарисовать советского Санта-Клауса. Если обратиться к поиску по картинкам Google, то там тоже не все однозначно. Поэтому будет проще, если вы заранее изучите публикации по вашему запросу в поисковиках.

Похож скорее на генерала Мороза
Похож скорее на генерала Мороза

Чем точнее вы создадите запрос, тем ближе он будет к вашим ожиданиям. Если вы напрямую не прописали какой-либо параметр, то он генерируется случайным образом. Примерно как известный мем про штаны Арагорна (если Толкин не упоминал, что Арагорн носил штаны, значит читатель может додумывать этот элемент по своему усмотрению).

У этого изображения цвет волос девушки был четко прописан. Результат соответствует ожиданиям
У этого изображения цвет волос девушки был четко прописан. Результат соответствует ожиданиям

Подмечайте удачные запросы других пользователей и меняйте их по своему усмотрению. Благодаря тому, что вы можете видеть запросы других пользователей (как и они ваши), никто не запрещает заимствовать удачные формулировки. C их помощью зачастую можно получить аналогичные по качеству результаты.

Задавайте стиль изображения. Будет ли это рисунок, компьютерная графика, реалистичная фотография. Также можно давать референсы в виде известных художников, чтобы нейросеть Midjourney подражала их стилю. Например, можно приписать к запросу: by Claude Monet.

Если первые созданные изображения получились неудачные, то лучше не тратить попытки сгенерировать их повторно и начать с нуля, подбирая новые уточняющие ключевые слова и удаляя лишние. Кроме того, иногда стоит попробовать наиболее простые формулировки без уточняющих деталей.

Структура и параметры запроса для Midjourney

Сообщество выработало определенную структуру и формат запроса:

  1. Первая часть описывает, что именно должно быть изображено.
  2. Вторая часть дает представление о стиле.
  3. Третья уточняет технические параметры.

Части нужно разделять двумя двоеточиями, а слова внутри — запятыми. Но не обязательно делить запрос именно на три части. Пример: Snegurochka, Snow Maiden: : USSR, Moscow, The Red Square, night, christmas lights: : unreal engine, cinematic lighting, ultra realistic,: : --wallpaper.

Команды, перед которыми стоят два дефиса (в примере выше это --wallpaper), позволяют задать технические параметры изображения. Их всегда нужно указывать в конце. Некоторые параметры могут со временем меняться, так как проект активно дорабатывается. Так, с середины марта 2023 года нейросеть обновилась до 5-й версии, в которой повысилось качество и детализация, также Midjourney наконец научилась лучше отрисовывать руки и пальцы. Список популярных параметров, которые можно добавить к запросу:

  • --v (пример: --v 4) — версия алгоритма, доступны значения от 1 до 5 (первая версия больше подходит для абстрактных изображений и текстур);
  • --beta — экспериментальный алгоритм, который выдает 2 результата вместо 4 и обрабатывается дольше;
  • --hd — альтернативный алгоритм, который больше подходит для абстрактных изображений и пейзажей;
  • --stop 10 — останавливает генерацию изображения на указанном проценте от 10 до 100;
  • --uplight — использует более «щадящий» апскейл, то есть ближе к оригинальному изображению, аналогичен кнопке Light Upscale;
  • --upbeta — использует бета-апскейл, который изначально создает изображение более высокого разрешения, аналогичен кнопке Beta Upscale;
  • --seed (пример: --seed 1248) — значение, которое используется для получения схожих результатов при каждом новом запросе. Можно указать любое целое число в промежутке от 0 до 4294967295. Если вы не выбрали значение, то оно устанавливается случайным образом. Узнать его можно, если переслать результат себе в личные сообщения.
  • --sameseed — при генерации все четыре изображения будут использовать одинаковый seed, что сделает их похожими;
  • --q (пример: --q .25)— качество изображения, можно указать число от 0.25 до 5. По умолчанию используется 1 (равно минуте времени GPU). Чем выше число, тем больше ресурсов расходуется (не забываем про лимит в 25 GPU-минут);
  • --s — насколько сильной будет стилизация изображения. Значение по умолчанию равно 2500. Можно указать от 625 до 60000.
  • --video — создает и сохраняет видео с процессом генерации изображения, которое будет отправлено в личные сообщения. Нужно отреагировать на сообщение с эмодзи в виде конверта.
  • --iw (пример: --iw .25)— позволяет задать вес (то есть насколько сильно будет его влияние на результат) референсного изображения. Загрузите изображение в чат, затем скопируйте URL и вставьте его в строку для описания (то есть в prompt, который появляется после /imagine). По умолчанию значение равно .25, значение 1 делает вес изображения таким же важным, как и у описательного текста;
  • --ar — задает соотношение сторон, например --ar 16:9;
  • --no — позволяет исключить объекты, например --no cats;
  • --wallpaper — создается детальное и качественное изображение, можно использовать вместо ключевых слов вроде hyper detailed, micro details, enhanced quality, studio quality, 4K и подобных.

Это не строгие правила, запрос можно формировать гораздо проще, без использования разделителей и с минимальным описанием. Когда человек дает Midjourney творческую свободу при создании картинок, нейросеть способна выдавать действительно достойный результат.

Выбрать параметры также можно в настройках. Напечатайте и введите команду /settings, чтобы открыть меню. В настройках дублируются некоторые из команд. Если их активировать, то не нужно будет набирать каждый раз вручную. Они будут подставляться в запрос автоматически.

Как соединить два изображения

Midjourney может объединять две картинки в одну (например, объединить портреты двух человек). Создание такого изображения несколько отличается от стандартной генерации. Для этого в настройках нужно выставить Remix Mode, а затем загрузить в Discord два изображения и вставить ссылки в строку prompt. Нейросеть в результате сделает микс из двух картинок. Результаты могут быть неожиданными.

Сервисы для составления запроса

В помощь начинающим пользователям и для облегчения работы с нейросетью можно порекомендовать специальные сайты и сервисы, которые предназначены для составления запроса и поиска новых параметров.

  • romptoMANIA → — продвинутый сервис с готовыми шаблонами, в котором параметры проиллюстрированы. Однако придется потратить какое-то время, чтобы разобраться, так как у сервиса перегруженный интерфейс.
  • Prompter → — оформлен в виде таблицы Google. Без знания английского им будет сложно пользоваться, так как нет визуальных подсказок.
  • Phraser → — простой в освоении сервис, который позволит подобрать нужное описание и покажет примерный результат на основе похожих изображений.
  • Midjourney Prompt Helper → — сервис с минималистичным интерфейсом. Пользоваться им не очень удобно из-за отсутствия визуальных референсов, но при достаточном знании языка можно подобрать идеи для описаний и новые ключевые слова.