Как генерировать шедевры в нейросети Midjourney: пошаговая инструкция

Midjourney — это нейросеть, которая позволяет создавать изображения на основе текстового описания. Она доступна бесплатно всем желающим, однако количество генераций ограничено. Это руководство поможет вам ознакомиться с основными возможностями Midjourney и не потратить попытку впустую.

Как пользоваться Midjourney

Как получить доступ к Midjourney

Midjourney работает на базе приложения Discord. Поэтому вам нужно иметь аккаунт и получить приглашение в сообщество. Сделать это можно, следуя пошаговой инструкции.

Сначала перейдите на официальный сайт Midjourney и нажмите кнопку Join the Beta — это перебросит вас на сайт Discord.

Если вы хотите зарегистрировать новый аккаунт, введите имя и нажмите «Продолжить», если у вас есть аккаунт, нажмите «Уже зарегистрированы?»

Если у вас уже есть аккаунт, и вы авторизованы, то нажмите «Принять приглашение». Если аккаунт есть, но вы не входили в него на сайте, нажмите «Уже зарегистрированы?» и введите данные. Если аккаунта нет, введите желаемое имя в соответствующее поле и нажмите «Продолжить». Следуйте инструкциям для регистрации аккаунта.

Так выглядит окно авторизации

Если все сделано правильно, вы присоединитесь к серверу Midjourney. Теперь нужно зайти в любой из чатов newbies. Если каналов нет, перезапустите приложение Discord или браузер.

Чаты расположены в левой части приложения

Ограничения и тарифы

Каждому пользователю бесплатно дается 25 так называемых GPU-минут. На стандартном качестве этого хватит на генерацию 25 картинок. Но сюда входят не только новые генерации, но и доработка уже созданных изображений.

Чтобы снять ограничения, нужно купить подписку. За $10 (650 рублей) в месяц вы получите 200 попыток, за $30 (1950 рублей) — неограниченное количество попыток. Карты банков России не подойдут, поэтому придется искать обходные пути. Также есть вариант завести новый аккаунт для Discord, но для этого потребуется и новый номер телефона.

Как сгенерировать изображение

На канале вы увидите запросы других пользователей и полученные результаты. Это хорошая возможность ознакомиться с тем, что может предложить нейросеть. Чтобы начать генерировать собственные изображения, введите /imagine и кликните на предложенной команде prompt.

При первом использовании выскочит сообщение, в котором нужно принять правила использования сервиса. Нажмите Accept ToS

Теперь нужно придумать запрос. Начните вводить описание желаемого изображения. Писать можно и на русском языке, но на английском результаты получаются более качественные и предсказуемые. Слова разделяйте запятыми, а в конце можно указать технические параметры через два дефиса (например, «—ar 16:9» задает соотношение сторон изображений).

Обратите внимание, что есть список стоп-слов, которые нельзя использовать. Помимо очевидных слов, в него почему-то входят Tik Tok, Jinping (имеется в виду китайский лидер Си Цзиньпин), а также Chairman Mao (думаем, что перевод тут не нужен).

Почему-то запрос Father Frost нейросеть не поняла, но как мог бы выглядеть советский Санта, вероятно, представляет. Первые два изображения получились неплохо

Для теста возьмем следующий пример: «soviet santa claus, moscow, unreal engine, cinematic lighting, ultra realistic, —ar 16:9». В итоге появятся четыре разных изображения, созданных по текстовому описанию. Если они вас не устраивают, то можно поправить описание и сгенерировать еще раз. Или можно продолжить работать с ними дальше.

Как доработать изображение

Разберем дальнейшую обработку изображения на примере запроса (без кавычек): «Detailing oil painting of christmas street, young woman —v 4 —ar 3:2 —upbeta —q 2». Пока не обращайте внимание на дополнительные команды, мы разберем их позже.

Иногда лучше дать нейросети побольше свободы

После того, как нейросеть выдаст четыре изображения, работа еще не закончена. Под картинками расположены дополнительные команды. Номер означает, к какому изображению будет применено действие: 1 — верхнее левое, 2 — верхнее правое, 3 — нижнее левое, 4 — нижнее правое.

  • U — увеличивает и улучшает выбранное изображение;
  • V — генерирует еще четыре похожих изображения на основе исходного;
  • значок с двумя стрелками — варианты генерируются заново.
Изображение, после выполнения команды U

Если вы решили дальше работать с изображением, нажмите «U». Система выдаст более детализированное изображение большего размера. В дальнейшем с ним тоже можно поработать, выбрав из нескольких вариантов:

  • Make Variations — создает похожие изображения;
  • Light Upscale Redo — легкая перерисовка исходного изображения;
  • Beta Upscale Redo — экспериментальный апскейл, изначально генерирует более высокое разрешение;
  • Detailed Upscale Redo — более серьезная перерисовка изображения;
  • Remaster — полностью перерисовывает изображение, основываясь на исходнике;
  • Upscale to Max — улучшение до максимального качества;
  • Web — открывает изображение в полном размере в отдельной вкладке браузера.
Изображение после команды Remaster

Предугадать, как будут выглядеть дальнейшие варианты, не так просто. При этом стоит понимать, что обработанные картинки не всегда будут лучше. Первые четыре варианта могут оказаться самыми удачными.

Как сохранить картинки

Чтобы ваши запросы не утонули в потоке сообщений, воспользуйтесь кнопкой «Почта», которая расположена в правом верхнем углу. Перейдите на вкладку «Упоминания», и вы увидите все ваши генерации.

Также можно попросить бота отправить результаты в личные сообщения. Для этого нужно отреагировать на пост с эмодзи в виде письма. Перейдите к сообщению и нажмите «Добавить реакцию», введите в поиске envelope и выберите соответствующий значок.

Чтобы сохранить файл, нажмите на изображение в чате и далее кликните на «Открыть оригинал». Картинка высокого разрешения откроется в новом окне браузера, откуда ее уже можно сохранить на компьютер.

Если вам нужна только одна картинка из четырех и в максимальном качестве, то нужно сделать апскейл (кнопка U). Получившееся изображение можно сохранить точно так же, через «Открыть оригинал».

Результаты генерации можно найти и на официальном сайте Midjourney. В этом случае нужно авторизоваться через Discord, изображения будут в личном кабинете.

Как правильно составлять запросы в Midjourney

Удачные изображения редко получаются с первого раза. Чтобы сделать шедевр, нужно совершить множество попыток. К сожалению, лимит не позволит экспериментировать, однако если вы будете следовать правилам, то шансы на успех гораздо выше.

Общие советы

Нейросеть не всегда понимает сложные предложения, фразы и контекст. Старайтесь выражаться проще, иначе результаты могут быть далеки от того, как вы их себе представляли. Не пишите «Аленушка горюет по младшему брату», лучше выразиться так: «Молодая женщина сидит на берегу реки с печальным выражением лица».

Используйте общеизвестные и популярные образы, которые легко найти на картинках в сети. В нашем случае нейросеть не поняла, кто такой Father Frost (английское название нашего Деда Мороза), но смогла нарисовать советского Санта-Клауса.

Похож скорее на генерала Мороза

Чем точнее вы создадите запрос, тем ближе он будет к вашим ожиданиям. Если вы напрямую не прописали какой-либо параметр, то он генерируется случайным образом. Примерно как известный мем про штаны Арагорна (если Толкин не упоминал, что Арагорн носил штаны, значит читатель может додумывать этот элемент по своему усмотрению).

У этого изображения цвет волос девушки был четко прописан. Результат соответствует ожиданиям

Подмечайте удачные запросы других пользователей и меняйте их по своему усмотрению. Благодаря тому, что вы можете видеть запросы других пользователей (как и они ваши), никто не запрещает заимствовать удачные формулировки. Иногда это может привести к аналогичным по качеству результатам.

Задавайте стиль изображения. Будет ли это рисунок, компьютерная графика, реалистичная фотография. Также можно давать референсы в виде известных художников, чтобы нейросеть подражала их стилю. Например, можно приписать к запросу: by Claude Monet.

Если первые изображения получились неудачные, то лучше не тратить попытки сгенерировать их повторно и начать с нуля, подбирая новые уточняющие ключевые слова и удаляя лишние. Кроме того, иногда стоит попробовать наиболее простые формулировки без уточняющих деталей.

Структура и параметры запроса

Сообщество выработало определенную структуру запроса:

  1. Первая часть описывает, что именно должно быть изображено.
  2. Вторая часть дает представление о стиле.
  3. Третья уточняет технические параметры.

Части нужно разделять двумя двоеточиями, а слова внутри — запятыми. Но не обязательно делить запрос именно на три части. Пример: Snegurochka, Snow Maiden: : USSR, Moscow, The Red Square, night, christmas lights: : unreal engine, cinematic lighting, ultra realistic,: : —wallpaper.

Команды, перед которыми стоят два дефиса (в примере выше это —wallpaper), позволяют задать технические параметры изображения. Их всегда нужно указывать в конце. Некоторые параметры могут со временем меняться, так как проект активно дорабатывается. Список популярных параметров:

  • —v (пример: —v 4) — версия алгоритма, доступны значения от 1 до 4 (первая версия больше подходит для абстрактных изображений и текстур);
  • —beta — экспериментальный алгоритм, который выдает 2 результата вместо 4 и обрабатывается дольше;
  • —hd — альтернативный алгоритм, который больше подходит для абстрактных изображений и пейзажей;
  • —stop 10 — останавливает генерацию изображения на указанном проценте от 10 до 100;
  • uplight — использует более «щадящий» апскейл, то есть ближе к оригинальному изображению, аналогичен кнопке Light Upscale;
  • —upbeta — использует бета-апскейл, который изначально создает изображение более высокого разрешения, аналогичен кнопке Beta Upscale;
  • —seed (пример: —seed 1248) — значение, которое используется для получения схожих результатов при каждом новом запросе. Можно указать любое целое число в промежутке от 0 до 4294967295. Если вы не выбрали значение, то оно устанавливается случайным образом. Узнать его можно, если переслать результат себе в личные сообщения.
  • —sameseed — при генерации все четыре изображения будут использовать одинаковый seed, что сделает их похожими;
  • —q (пример: —q .25) — качество изображения, можно указать число от 0.25 до 5. По умолчанию используется 1 (равно минуте времени GPU). Чем выше число, тем больше ресурсов расходуется (не забываем про лимит в 25 GPU-минут);
  • —s — насколько сильной будет стилизация изображения. Значение по умолчанию равно 2500. Можно указать от 625 до 60000.
  • —video — сохраняет видео с процессом генерации изображения, которое будет отправлено в личные сообщения. Нужно отреагировать на сообщение с эмодзи в виде конверта.
  • —iw (пример: —iw .25) — позволяет задать вес (то есть насколько сильно будет его влияние на результат) референсного изображения. Загрузите изображение в чат, затем скопируйте URL и вставьте его в строку для описания (то есть в prompt, который появляется после /imagine). По умолчанию значение равно .25, значение 1 делает вес изображения таким же важным, как и у описательного текста;
  • —ar — задает соотношение сторон, например —ar 16:9;
  • —no — позволяет исключить объекты, например —no cats;
  • —wallpaper — создается детальное и качественное изображение, можно использовать вместо ключевых слов вроде hyper detailed, micro details, enhanced quality, studio quality, 4K и подобных.

Это не строгие правила, запрос можно формировать гораздо проще, без использования разделителей и с минимальным описанием. В этом случае нейросеть может выдавать достойный результат.

Выбрать параметры также можно в настройках. Напечатайте и введите команду /settings, чтобы открыть меню. Здесь дублируются некоторые из команд. Если их активировать, то не нужно будет набирать каждый раз вручную. Они будут подставляться в запрос автоматически.

Как соединить два изображения

В настройках нужно выставить Remix Mode, а затем загрузить в Discord два изображения и вставить ссылки в строку prompt. Нейросеть в результате сделаем микс из двух картинок. Результаты могут быть неожиданными.

Сервисы для составления запроса

Для составления запроса и поиска новых параметров можно использовать специальные сервисы.

  • PromptoMANIA — продвинутый сервис, в котором параметры проиллюстрированы. Однако придется потратить какое-то время, чтобы разобраться, так как у сервиса перегруженный интерфейс.
  • Prompter — оформлен в виде таблицы Google. Без знания английского им будет сложно пользоваться, так как нет визуальных подсказок.
  • Phraser — простой в освоении сервис, который позволит подобрать нужное описание и покажет примерный результат на основе похожих изображений.
  • Midjourney Prompt Helper — сервис с минималистичным интерфейсом. Пользоваться им не очень удобно из-за отсутствия визуальных референсов, но при достаточном знании языка можно подобрать новые ключевые слова.
Обзоры новинок
Подробности о главных премьерах
Обнаружили ошибку? Выделите ее и нажмите Ctrl+Enter.
Подпишитесь на нас