НовостиОбзорыВсе о нейросетяхБытовая техника 2024ГаджетыТехнологииНаукаСоцсетиЛайфхакиFunПромокодыСтранные вопросыЭксперты

Промты для нейросети: полезные советы по созданию запроса

10 мая 2024
Кажется, взаимопонимание с нейросетями умеют находить только айтишники. На самом деле общаться с ChatGPT или Midjourney может каждый — достаточно знать базовые правила и промты для нейросетей. Рассказываем о них в этой статье.

Если вы хоть раз пробовали писать запрос (промт) к нейросети, то знаете, как часто можно получить неудовлетворительный результат. Многие по привычке общаются с чат-ботом как с человеком или с поиском Google или Яндекса. Но у нейросетей есть установленные правила, по которым они воспринимают команды человека — примерно как компьютер интерпретирует компьютерный код.

Эти правила называются промтами. Специалисты уже выделяют профессию промт-инженера — человека, профессионально составляющего запросы к нейросетям. И даже считают промтинг новым программированием. Более того, некоторые уже начали зарабатывать на промтах. Например, продают свои запросы на маркетплейсах.

Промт — это текстовый запрос к нейросети для получения какого-либо результата, например генерации текста или изображения. В Яндексе вместо промта используют слово «подводка», а в Сбере «затравка».

Согласно гайду от Google по их чат-боту Gemini, в создании промтов есть несколько рекомендаций:

  • Использовать естественный язык. Писать так, как будто разговариваешь с человеком. Выражать мысли целиком полными предложениями.
  • Быть точным и последовательным. Говорить, что необходимо сделать (сделать выжимку, написать, изменить тональность, создать). Дать как можно больше контекста.
  • Избегать запутанности. Излагать запрос полным и точным языком. Избегать жаргона.
  • Вести диалог. Постоянно улучшать промты, если результаты вас не удовлетворяют или вы видите пространство для улучшения. Использовать итеративный процесс.

Как написать промт для создания картинки

Хороший промт для графической нейросети состоит из четырех частей: формат изображения, объект, действие и стилистика.

1. Определите тему

Для начала нужно примерно понять, что вы хотите от нейросети. Можно составлять запросы из одного-двух слов, но результат вряд ли будет соответствовать вашим ожиданиям — нейросеть «додумает» детали самостоятельно.

2. Опишите детали

Постарайтесь как можно тщательнее сформулировать описание того, что вы хотите видеть на изображении: объект, его свойства, задний фон, действие, мелкие детали, стиль, настроение.

Основной объект

Это главный элемент вашего изображения, то, что должно быть изображено. Рекомендуем задавать нейросети конкретные образы: кот, дом, самолет, дерево, волшебник, город, часы, ягоды, планета, завод. Нейросеть обучали на базе картинок из интернета, поэтому результат будет ограничен вашим воображением и тем, что есть в сети.

Если хотите точности в распознавании своего запроса, лучше не использовать абстракции и то, что существует в нашем воображении. Нейросеть будет по-разному понимать такие вещи, как любовь, дружба, мечты, справедливость, гнев, время. Это не значит, что нельзя попросить нейросеть изобразить эти понятия — описывайте, как это выглядит со стороны. Например, не «любовь между мужчиной и женщиной», а «мужчина и женщина сидят рядом, держась за руки, смотрят друг другу в глаза и улыбаются».

Односложные объекты могут быстро наскучить, поэтому экспериментируйте с сочетанием необычных понятий и концептов: голубь-сумоист, кот-астронавт, хачапури-лего, торт-ракета.

Еще можно нарисовать несколько объектов: три мыши, пять тарелок борща. Но учтите ограничения: нейросети до сих пор плохо считают количество чего-либо и могут ошибаться. К тому же, чем больше однотипных объектов, тем хуже детализированными они окажутся.

Задний фон

Основному объекту нужен фон — иначе нейросеть будет сама дорисовывать детали вокруг. Советуем сразу придумывать контекст, в котором находится главный элемент вашего изображения. Это может быть действие, предметы вокруг, характеристика самого объекта. Например, вместо обычного промта «голубь» напишите «голубь-байкер в бандане и черной кожаной куртке мчится на мотоцикле по ночному неоновому городу».

Настроение

Чтобы придать настроение главному объекту или всему изображению, используйте прилагательные: мечтательный, сухой, восторженный, старый, уютный, злой, взволнованный, дорогой, модный, смелый, плоский, плоский дизайн, плоская заливка, дружелюбный, пушистый. Для этого воспользуйтесь любым словарем прилагательных.

Цветовая палитра

Изображению можно задать цветовую палитру — это хорошо дополняет настроение объекта. Например, можно использовать однотонную палитру, двухтонную (duotone), черно-белую, различные цветовые сочетания или художественные цвета неон или сепия.

3. Укажите стиль рисования

Нейросеть обучали на картинках разных художественных стилей. Существует огромное количество стилей — кубизм, экспрессионизм, минимализм, психоделика, необарокко, — поэтому ориентируйтесь на инструкции по стилям. Например, на этот гайд по стилям Midjourney. Или эту официальную инструкцию.

Также можно указать художников, в стиле которых будет выполнена ваша картинка. Например, Илья Репин, Ваг Гог или Бэнкси. Есть большая таблица художников, которую ведут энтузиасты, просматривайте ее.

4. Уточните требования

Для каждой нейросети есть набор команд, которые увеличивают проработанность картинки, меняют соотношение сторон или добавляют приоритет определенным словам в промте. Например, в Midjourney исправлять артефакты можно с помощью добавления слов «detailed и highly detailed» к объектам, которые плохо получились на изображении. В Kandinsky от Сбера уже есть пресеты разрешений: 1:1, 16:9 и другие, тогда как в Midjourney нужно специально писать —ar 4:3 или —ar 3:2.

Еще можно добавить перспективу, с которой будет сгенерировано изображение. Например, в Midjourney это делается добавлением таких выражений, как close-up, motion blur, wide angle, selfie.

5. Экспериментируйте

Многие генеративные нейросети позволяют стилизовать, смешивать фото между собой, а также использовать фото как референс. Пользуйтесь этим, чтобы получить интересные результаты. Например, можно загрузить уже сгенерированную картинку и на основе нее с помощью нового промта получить совершенно другой результат.

Примеры готовых промтов

photorealistic image of abstract jelly fish on black background, transparent plastic material

photorealistic image of female model in a collection by paco rabanne in the 90's in collab with martin margiela the color palette is black grey silver metal white off white and a little bit of washed out blue hued pink light, fabrics are metal organdy transparent silk mesh and leather, full body shot

futuristic beautiful cyborg head with chrome helmet connected by cables and wires and led metallic features surrounded by tribal chrome shaped elements, 3D render, artwork in the style of Hajime Sorayama, Caravaggio, Jessica Rossier and Natalia Rak. Symmetrical composition, black studio background, blur and soft light, pink red white and silver colors

a pixe; art of a corals on land, playful cartoonish scenes, in the style of robotics kids, infrared, --ar 64:31

chrome, sculpture, head of david, glowing scythe, pink and blue colors --ar 16:9

photorealistic image of female model in a collection by paco rabanne in the 90's in collab with martin margiela the color palette is black grey silver metal white off white and a little bit of washed out blue hued pink light, fabrics are metal organdy transparent silk mesh and leather, full body shot --ar 16:9

photorealistic image of A 25 years old man, in futuristic chrome eye mask in style of balenciaga , offwhite, balenciaga style, short Iroquois mullet blue dyed hair, black background, black oversized t-shirt , balenciaga models, Medium Shot, Natural Lighting, Kodak vision3 500, black background, cyber inserts on the face, in style of fashion magazines, in style of dazed magazine, unreal engine, in style of ghost in shells

a pixe; art of a corals on land, playful cartoonish scenes, in the style of robotics kids, infrared

abstract chrome and organic shapes, sculpture, plant, glowing scythe, by Kenneth Anger, poster

futuristic beautiful cyborg head with chrome helmet connected by cables and wires and led metallic features surrounded by tribal chrome shaped elements, 3D render, artwork in the style of Hajime Sorayama, Caravaggio, Jessica Rossier and Natalia Rak. Symmetrical composition, light studio background, blur and soft light, pink pearl white and silver colors, pink and blue colors --ar 16:9

Как написать промт для создания текста

Базовые принципы создания промта для текстовых нейросетей похожи — будь это ChatGPT, Giga Chat от Сбера или YandexGPT. Рассказываем о самых главных.

1. Определите цель текста

Как в случае с графическими генеративными нейросетями, для текстовых чат-ботов нужно придумать сценарий, в котором он может вам помочь. Это может быть помощь в написании письма, переработке текста или составление плана тренировок.

2. Используйте главную формулу промтинга

Главная формула для составления промта для текстовой нейросети: цель текста + задача + роль + контекст, детали и лимиты.

Цель текста: ради чего вы составляете запрос к нейросети. Другими словами, конечный результат, в котором вам поможет чат-бот. Например, «я хочу написать сопроводительное письмо на вакансию».

Задача: что вы просите нейросеть сделать, ее задача. Она должна быть максимально конкретной. Продолжая пример с сопроводительным письмом: «Ты должен составить текст сопроводительного письма для серьезной издательской компании».

Роль: в качество кого должна выступить нейросеть. Это значительно повышает степень ее погружения и качество ответа. Например, «лучший в мире HR-специалист, который специализируется на IT-отрасли», «повар с 20-летним стажем» или «главный тренер сборной команды-чемпиона мира по футболу».

Контекст, детали и лимиты: все, что может понадобиться нейросети для точного ответа. Если не указывать детали, чат-бот может многого не учесть. Например, при составлении промта на генерацию плана путешествий задайте нейросети ваш бюджет, пожелания, погоду в регионе пребывания, количество человек и другие детали, от которых можно зависеть результат.

3. Пользуйтесь лайфхаками

Например, не ведите диалог на разные темы в одном чате — создавайте новые для каждой задачи. Корректируйте ответы нейросети в ходе диалога: просите сократить или расширить текст, убрать абстракции или добавить новые детали. Еще один лайфхак, повышающий качество ответов: сказать нейросети, что от ее ответа зависит ваша карьера или вы дадите ей 20 долларов за ответ.

4. Задавайте стили ответов

ChatGPT можно попросить отвечать в определенном стиле в зависимости от вашей задачи: разговорный, деловой, юмористический, информационный. Также можно попросить нейросеть вжиться в роль известного человека и отвечать в его стиле. Например, в стиле харизматичного повара Гордона Рамзи или в расслабленном стиле Снуп Догга.

5. Экспериментируйте с возможностями нейросетей

Возможности генеративных чат-ботов значительно выше, чем многие о них думают. ChatGPT можно использовать в роли психолога, партнера по мозговому штурму или личного ассистента, который ведет ваш календарь.

6. Проводите фактчекинг

Мы не рекомендуем слепо верить информации, которую вам выдают нейросети, ведь они могут ошибаться. Более того, не рекомендуем с их помощью искать информацию в интернете (кроме специализированных сервисов типа Perplexity). Не зря подобные сервисы сами предупреждают, что могут выдавать ошибки.

Примеры готовых промтов

Помощники в создании промтов для генерации картинок

С первого раза ни у кого не получится составить максимально точный и правильный промт. Для этого рекомендуем воспользоваться гайдлайнами и специальными сервисами.

1. Promptomania

Бесплатная платформа сообщества ИИ-художников, которая предлагает онлайн-конструктор промтов, для разных моделей: CF Spark, Midjourney, Stable Diffusion. Можно позаимствовать различные художественные стили, есть функцию разбивки составные изображения на отдельные фрагменты для более точно генерации промта.

2. Phraser

Также помогает пользователям создавать промты для различных генеративных ИИ-сервисов, таких, как DALL-E или Midjourney. Процесс создания промта на Phraser — один из самых детализированных среди других сервисов.

3. Сообщество энтузиастов Midjourney

Целая онлайн-энциклопедия по Midjourney на русском языке. Также помогает сгенерировать качественный промт с выбором стилей.

4. Promptwave

Похожая платформа генерации промтов, где, помимо прочего, можно увидеть реальные примеры пользовательских изображений и какие промты они использовали.

5. AI Prompt Generator

Платный сервис генерации промтов. Отличается тем, что можно сразу выбрать вид изображения, для которого вы создаете промт: графическая иллюстрация, портретное изображение, картина, логотип и т. д.

Конструкторы промтов для генерации текстов

Для текстовых нейросетей существует множество подборок уже заготовленных и проверенных промтов. Можете взять их за основу, чтобы улучшать свои промты.

1. Awesome-chatgpt-prompts

Готовая подборка удачных промтов для ChatGPT и подобных сервисов, созданная энтузиастов на GitHub. Все промты составлены от имени какой-то профессии — «действуй как дата-инженер», «действуй как психолог» — и содержат подробное описание конкретного действия.

2. ChatGPT Prompt Generator

Конструктов промтов на русском языке. Нужно заполнить основные поля с ключевой информацией и сервис выдаст готовый промт.

3. Aiseo

Похожий инструмент составления промтов, только на английском языке.

4. Подборка Writesonic

Большой список готовых промтов на английском языке от одноименного генеративного чат-бота.

Идеальный промт: обзор полезных советов

Принципы создания промтов одинаковы для разных нейросетей. Изучив их, можно сразу тренироваться и находить собственные методики. Вот главные советы.

Не пишите запрос как ко взрослому человеку. Общайтесь с нейросетью как с амбициозным, но неопытным стажером или услужливым ребенком. Разжевывайте абстракции, описывайте как можно больше контекста, прямо говорите, что делать.

Задавайте роль. Это наделяет нейросеть профессиональными «способностями» повара, тренера, юриста, инвестиционного аналитика, что поможет добиваться более качественных результатов.

Добавляйте контекст. Проще всего представить, будто вы рассказывайте ситуацию своему другу.

Опишите последовательность шагов. Если вы примерно представляете, по какому алгоритму следует выполнить задачу — расскажите об этом нейросети, помогите ей правильно исполнить задачу в формате «сначала ты делаешь это, затем это, а потом это».

Приводите примеры. Предоставьте примеры, похожие на тот результат, который вы хотите получить. Так нейросеть поймет, какие варианты решения задачи будут подходящими, а какие нет.

Дорабатывайте промт. Не бросайте общение с нейросетью при первой неудачной генерации. Помните, что это неопытный стажер, которому нужно подсказывать, как правильно решить задачу.

Вопросы и ответы

Информации выше должно хватить для базового понимания, как создать промты. Если хотите углубиться в тему, отвечаем на главные вопросы.

Можно ли создавать промты с помощью ChatGPT?

Конечно, ChatGPT хорошо подходит для создания промтов. Задайте ChatGPT роль эксперта в составлении промтов для нужной вам нейросети и подробно объясните, что хотите сделать. Не забудьте добавить как можно больше деталей, чтобы чат-бот составил релевантный промт. Можно начать с этого:

«Представь, что ты графический дизайнер, создающий креативные изображения для Midjourney. Midjourney — это ИИ-приложение, которое может генерировать изображения на основе текстовых подсказок. Я опишу тебе концепцию того, что хочу нарисовать, а ты сгенерируешь пять разных промтов, которые я смогу ввести в Midjourney. Убедись, что они креативные».

Что значит в промте двойное двоеточие «:»?

Двойное двоеточие разделяет словосочетание в промте на два отдельных понятия, чтобы нейросеть воспринимала их по отдельности. Например, если в Midjourney ввести «hot dog», нейросеть нарисует хот-дог (сосиску в булочке). Но если поставить двойное двоеточие «hot: dog», результатом будет горячая собака — скорее всего, нейросеть нарисует огненную собаку. Лайфхак: можно придать большее значение одной из частей словосочетания, поставив число сразу после двойного двоеточия. Например. в промте «hot:2 dog» доминировать будет слово «горячий», поэтому огонь на сгенерированной картинке станет сильнее.

Что такое негативные промты для нейросетей?

Это промты, которые говорят нейросети, чего не должно быть на сгенерированном изображении. Иногда негативный промт используют, чтобы убрать неудачный артефакт: замыленную руку, деформированные пальцы или сторонний объект. Но некоторые пользуются методом «от обратного» и создают длинные негативные промты. Например, чтобы получить изображение красивой женщины, в «negative prompt» пишут отталкивающие характеристики: плохая анатомия, лишние руки и ноги, непропорционально большая голова, без волос и т. д.

Должны ли отличаться промты для разных нейросетей?

Нет, на самом деле достаточно запомнить главные принципы составления промтов для нейросетей — в большинстве случаев они работают по схожим принципам. Главное — не сдаваться при первых неудачных попытках. С нейросетью, как и с любым носителем чужого языка, не получится поговорить без подготовки.

Денис Акатов