Как пользоваться нейросетью Stable Diffusion в 2024 году

Stable Diffusion который год удерживает лидирующие позиции среди графических нейросетей. Конкуренты убирают бесплатные тарифы, в то время как пользоваться этой программой пока еще можно бесплатно. Рассказываем, как пользоваться Stable Diffusion в 2024 году
Что это
Информация
Что умеет
Как пользоваться
Плюсы и минусы
Значение настроек
Советы
Примеры
Вопросы и ответы
Что это
Информация
Что умеет
Как пользоваться
Плюсы и минусы
Значение настроек
Советы
Примеры
Вопросы и ответы
Ещё
Stable Diffusion
Источник: Hi-Tech Mail.ru

Творчество нейросетей не обошло стороной практически ни одну компанию, создающую контент для публикации в интернете. Но вот проблема — большинство популярных нейросетей, таких, как Midjourney, оставили только платные абонентские подписки и тарифы. В статье рассказываем, как пользоваться ничем не уступающим Stable Diffusion в 2024 году и не платить ни копейки за подписку.

Что такое Stable Diffusion простыми словами

Stable Diffusion — это программа на основе искусственного интеллекта для генерации изображений на основе введенных пользователем текстовых запросов. Является аналогом популярных нейросетей Midjourney и DALL-E, но, в отличии от них, Stable Diffusion можно использовать бесплатно.

Сравнение трех изображений от нейросетей с одинаковым промтом
Сравнение результатов трех нейросетей с одинаковым промтомИсточник: Aitechtogether

В публичный доступ программу Stable Diffusion выпустили 22 августа 2022 года, ее разработала компания Stability.Ai с лицензией Creative ML OpenRail-M. Такая лицензия допускает коммерческое и некоммерческое использование продукта. Нейросеть имеет открытый исходный код, что позволяет скачать ее на Github и использовать на своем компьютере. Но есть и нюанс — у пользователя должен быть мощный компьютер и навыки программирования для работы с полной версией Stable Diffusion.

Кому может пригодиться Stable Diffusion:

  • веб-дизайнерам;
  • иллюстраторам;
  • художникам;
  • геймдизайнерам;
  • SMM-специалистам;
  • таргетологам и рекламщикам.

Полезная информация о нейросети Stable Diffusion


Stable Diffusion
Другие нейросети
Метод генерации изображений
Скрытая диффузия. Нейросеть не тратит время на ухудшение исходного изображения «шумами» и работу с пикселями для обратного воссоздания. Она сразу работает со сжатыми версиями изображений, использует ассоциативные данные о расположении пикселей для распознавания и на основе этих данных приступает к генерации нового изображения.
Обратная диффузия. Нейросеть берет исходное изображение, на котором обучалась, добавляет к нему «шумы» до полной неузнаваемости изображения, а затем путем подавления шума пытается воссоздать изображение, отдаленно похожее на исходное.
Возможность скачать исходные файлы и запустить нейросеть на своем компьютере
ДаНет
Необходимость ждать очередь при генерации
Нет (при установке на компьютер)
Всегда
Ограничение по количеству генераций
Нет (при установке на компьютер)
Да (при использовании через офф сайт)
Зависит от нейросети
Возможность генерировать бесплатно
Нет (при использовании через офф сайт)
Да (при использовании других способов из статьи)
Зависит от нейросети
Понимание русского языка в промтах
Да, но лучшие результаты достигаются при формулировании запросов на английском языке
Зависит от нейросети

Что умеет Stable Diffusion

Stable Diffusion не перестает развиваться и обучаться, разработчики постоянно выпускают свежие версии и добавляют новые функции.

Вот некоторые из тех, что уже доступны в 2024 году.

  1. Генерировать изображения на основе промтов, или по-простому — текстовых запросов, пользователя.
  2. Генерировать изображения на основе загруженного изображения.
  3. Подражать стилям известных художников.
  4. Дорисовывать детали изображения или фон.
  5. Заменять объекты на изображении на другие.
  6. Генерировать изображения с похожим сюжетом и персонажами для создания покадровой анимации и видеороликов.
  7. Отрисовывать объекты для компьютерных игр и работать совместно с игровым движком Unreal Engine.
  8. Превращать наброски и зарисовки в реалистичные изображения с множеством деталей и прорисованным фоном.

4 способа начать пользоваться Stable Diffusion

Помимо исходной версии Stable Diffusion, устанавливаемой на компьютер, есть и другие варианты использования. Они не требуют навыков программирования и специальных знаний. Рассмотрим подробнее каждый из способов.

1. Через официальный сайт или приложения

Наличие открытого исходного кода у нейросети дает разработчикам уникальные возможности:

  • самостоятельно модернизировать исходную версию;
  • размещать исходную или доработанную версию на удаленном сервере;
  • открывать доступ любым пользователям платно или бесплатно, так как лицензия позволяет коммерческое использование нейросети;
  • самостоятельно выставлять тарифы на использования пользователям.

По этой причине пользоваться Stable Diffusion в России можно через сайты, приложения, Discord или Telegram-ботов.

Официальный российский сайт Stable Diffusion

Использование Stable Diffusion через официальный сайт в России не является бесплатным, но позволяет получить все возможности нейросети, используя браузер.

Стоимость использования Stable Diffusion на сайте начинается от 990 рублей за 1000 токенов (это внутренняя валюта для генераций).

Тарифы на официальном русском сайте Stable Diffusion
Тарифы на официальном русском сайте Stable DiffusionИсточник: Hi-Tech Mail.ru

ClipDrop

ClipDrop является официальным сайтом компании Stability AI. Часть функций в нем уже сейчас платная, в том числе версия Stable Diffusion XL, но можно генерировать изображения бесплатно с помощью Stable Diffusion XL Turbo, находящейся на стадии бета-тестирования.

Авторизоваться на сайте можно с помощью аккаунта Google.

Результат генераций Stable Diffusion на версии SDXL Turbo: дракон дышит огнем, рядом напуганные люди
Результаты генераций на версии SDXL TurboИсточник: Hi-Tech Mail.ru

Dream Studio

Dream Studio — сайт с облегченной версией Stable Diffusion. Предоставляет бесплатные кредиты на генерацию изображений. После их использования пользователь может докупить 1000 кредитов, которых хватит примерно на 5000 изображений за $10.

Помимо ввода промта в Dream Studio можно настроить уточняющие параметры: указать размер изображения, количество созданных вариантов, стиль генерации, точность соответствия запросу — все это будет увеличивать количество кредитов за одну генерацию, но повышать качество результата.

Авторизация происходит через аккаунт Google или Discord.

Результаты генераций изображения огнедышащего дракона в Dream Studio
Результаты генераций в Dream StudioИсточник: Hi-Tech Mail.ru

Hugging Face

Hugging Face — сервис, на который пользователи самостоятельно загружают свои вариации версий Stable Diffusion.

Генерации на любой модели бесплатные, но на платформе присутствуют версии с ошибками, очень долгой генерацией или выдающие ошибку вместо результата. Версия, на которой удалось сгенерировать без ошибок: Stable Diffusion XL от cbensimon.

Результат генерации изображения огнедышащего дракона в сервисе Hugging Face
Результат генерации в сервисе Hugging FaceИсточник: Hi-Tech Mail.ru

Mage.Space

Mage.Space — сервис с простым интерфейсом, доступными базовыми версиями Stable Diffusion и возможностью платно подключить дополнительные модули, стили и настройки.

Авторизоваться можно через аккаунт Google или X (Twitter).

Результат генерации изображения огнедышащего дракона в сервисе Mage.Space
Результат генерации в сервисе Mage.SpaceИсточник: Hi-Tech Mail.ru

Playground Ai

Playground Ai — бесплатный и безлимитный сервис для генерации изображений, поддерживающий не только работу с Stable Diffusion, но и Playground v2. Позволяет выставлять множество настроек, выбирать размеры изображения, количество созданных картинок за одну генерацию и многое другое.

Авторизоваться можно с помощью аккаунта Google.

Результат генерации изображения огнедышащего дракона в сервисе Playground Ai
Результат генерации в сервисе Playground AiИсточник: Hi-Tech Mail.ru

Dezgo

Dezgo — сервис для генерации изображений не только Stable Diffusion, но и с разными моделями:

  • Absolute Reality;
  • AnyLora;
  • Dreamix;
  • Dream Shaper;
  • Epic Diffusion;
  • Nightmare Shaper;
  • Real Cartoon 3D;
  • Real Cartoon Anime;
  • Real Dream;
  • RPG;
  • и другие.

Сервис обновляется и добавляет новые модели и функции для генераций, дает инструменты для дорисовки изображений, удаления фона, генерации изображения в разных стилях и форматах, например, набросков и каракулей, и многое другое. Среди нюансов можно выделить не самые последние версии нейросетей, из-за этого результат может быть хуже ожидаемого.

Личный кабинет в сервисе имеется, но для генераций авторизация не требуется.

Результат генерации изображения огнедышащего дракона в сервисе Dezgo
Результат генерации в сервисе DezgoИсточник: Hi-Tech Mail.ru

Google Collab

Google Collab — это проект Google, позволяющий запустить код Stable Diffusion на вычислительных мощностях вычислительных машин сервиса. Этот способ подойдет, если есть необходимость работать с кодом Stable Diffusion напрямую, есть навык программирования, но свой компьютер не проходит по системным требованиям.

Пользоваться Stable Diffusion таким методом можно без ограничений и абсолютно бесплатно. Единственный минус — при каждом запуске придется ждать, пока сервис запустит программу, скачает модели и загрузит библиотеки.

2. Через программу с графическим интерфейсом

Если вариант генерации на сайтах по каким-то причинах не подходит, можно отдать предпочтение программам на ПК. Рассмотрим самые популярные.

Программа Easy Diffusion 3.0 от CMDR2

Easy Diffusion 3.0 — программа, в которой можно выбрать модель Stable Diffusion, включая SDXL, получить все привычные функции исходной версии, дополнительные настройки, простой интерфейс и легкую установку в пару кликов. Программа не требует специальных навыков, но требовательна к конфигурации компьютера и его мощности. Чем мощнее компьютер — тем быстрее будут выполняться запросы и генерироваться изображения. CMDR2 — имя пользователя, который выложил программу.

Системные требования:

  • Windows: видеокарта NVIDIA (минимум 2 ГБ ОЗУ).
  • Linux: видеокарта NVIDIA или AMD (минимум 2 ГБ ОЗУ).
  • Mac: на базе процессоров М1 и М2.
  • Минимум 8 ГБ системной оперативной памяти.
  • Не менее 25 ГБ свободного места на жестком диске.
Интерфейс программы Easy Diffusion 3.0 со сгенерированной картинкой космонавта на коне
Интерфейс программы Easy Diffusion 3.0Источник: Github

Diffusion Bee для MacOS

Diffusion Bee — программа для генераций изображения на Mac, поддерживающая все передовые функции Stable Diffusion:

  • текст в изображение;
  • изображение в изображение;
  • дорисовка и добавление объектов;
  • увеличение качества изображения с помощью апскейлинга;
  • модели, обученные с помощью DreamBooth, локальная генерация без отправки в облако или на сервер;
  • дополнительные расширенные настройки генераций;
  • доступ к комьюнити в discord.

Требования:

Для установки необходим Mac на базе процессора Intel или M1/M2.

  • Для Intel: MacOS 12.3.1 или новее.
  • Для M1/M2: MacOS 11.0.0 или новее.

Скачать можно на официальном сайте или Github.

Интерфейс программы Diffusion Bee со сгенерированными вариантами изображения совы
Интерфейс программы Diffusion BeeИсточник: Github

NMKD

NMKD Stable Diffusion GUI — графический интерфейс для работы со SD. Имеет небольшое количество стандартных настроек, генерацию изображения по тексту, по другому изображению, дорисовку деталей, генерацию бесшовных текстур в играх и многое другое.

Рекомендуемые требования:

  • Графический процессор: NVIDIA с 8 ГБ видеопамяти.
  • Оперативная память: 16 ГБ ОЗУ.
  • Диск: 12 ГБ на SSD (рекомендуется дополнительно 5 ГБ для временных файлов).
Интерфейс приложения NMKD с вариантами изображения портрета мужчины в очках
Интерфейс приложения NMKDИсточник: NMKD

3. Через консоль

Работа с нейросетью через консоль — вариант для опытных пользователей, имеющих навыки программирования, самостоятельной установки и настройки программ. Дополнительно при скачивании консоли может возникнуть необходимость искать и устанавливать узкоспециализированные модели для генераций.

Свежие версии и инструкции по установке Stable Diffusion можно найти на Github разработчика Stability AI.

Результаты генераций Stable Diffusion: собака в красном берете на голове и космонавт сидящий на коне
Результаты генераций Stable DiffusionИсточник: Github

4. Через Telegram-бот

Работать с нейросетью в упрощенном формате без установки приложений на ПК и перехода на сайты можно с помощью телеграм-ботов.

Алгоритм работы с ботом:

  1. Открываем бот Devoid Diffusion.

  2. Если работа ведется с компьютера, нажимаем «Open in web».

Заглавная страница телеграм-бота Devoid Diffusion с компьютера
Открытие бота с компьютераИсточник: Hi-Tech Mail.ru
  1. Запускаем бота нажатием на «Start» и подписываемся на канал по ссылке — это условие без которого бот работать не будет. Если канал мешает, можно сразу выключить уведомления.

Запуск телеграм-бота Devoid Diffusion
Запуск бота Источник: Hi-Tech Mail.ru
  1. Выбираем в меню режим генерации по запросу «/gen».

Выбор режима генерации по запросу из списка в телеграм-боте Devoid Diffusion
Выбор режима генерации по запросуИсточник: Hi-Tech Mail.ru
  1. Ожидаем конца генерации, бот обычно пишет через сколько секунд картинка будет готова.

Ввод запроса и ожидание генерации изображения в телеграм-боте Devoid Diffusion
Ввод запроса и ожидание генерацииИсточник: Hi-Tech Mail.ru
  1. Получаем готовый результат.

Итоговый результат генерации по запросу в телеграм-боте Devoid Diffusion: замок на высокой скале омываемой морем
Итоговый результат генерацииИсточник: Hi-Tech Mail.ru

Плюсы и минусы разных способов использования

Название способа
ПлюсыМинусы
Сайт1. Использование через браузер.
2. Не требует установки на ПК.
3. Не нужны специальные навыки.
4. Не важна конфигурация и мощность компьютера — генерация происходит на удаленном сервере.
5. Простой интерфейс.
6. Быстрые генерации на удаленном сервере.
1. Не всегда актуальные и свежие версии нейросети.
2. Не везде есть расширенные настройки.
3. Некоторые сайты работают по принципу ленты соцсети и генерации видят другие пользователи.
4. Есть очередь ожидания генераций.
Программы для ПК
1. На мощном компьютере будут быстрые генерации.
2. Генерации хранятся на компьютере и будут приватными.
3. Не требуют навыков программирования.
4. Имеют удобный графический интерфейс для работы
5. Нет очередей ожидания генерации.
1. Нужна установка на ПК.
2. Зависимы от мощности ПК.
3. Не будут работать на слабых ПК.
4. С минимальными системными требованиями будут работать медленно.
5. Не всегда работают с последними версиями нейросети и обновляются.
Телеграм-бот1. Доступен с телефона и ПК.
2. Не требует установки.
3. Упрощенный интерфейс.
4. Не нужны навыки программирования.
5. Частично понимает запросы на русском языке.
1. Есть очередь ожидания генераций.
2. Нет расширенных настроек.
3. Нет многих стандартных режимов.
Консоль1. Всегда свежие и оригинальные версии, не модернизированные другими пользователями.
2. Возможность самому модернизировать и дописывать код программы.
3. Полная свобода действий.
4. Лицензия на коммерческое и некоммерческое использование.
5. Нет никаких очередей генерации.
6. Все генерации хранятся на компьютере и приватны.
1. Нужны навыки программирования.
2. Настраивать программу придется самостоятельно.
3. При выходе новой версии ее снова надо будет скачивать и настраивать с нуля, обновления текущей без участия программиста не происходят.
4. Зависимы от мощностей компьютера.

Значение настроек в генераторах Stable Diffusion

На разных сайтах, приложениях, программах для ПК, в чат-ботах могут быть разные настройки для нейросети.

Рассмотрим самые популярные и часто встречающиеся:

  • Prompt — промт или, по-простому, запрос пользователя. Поле куда вводится задача для генерации, уточняющие детали, указания по стилю, содержанию и т. д.
  • Negative prompt — фильтр для нейросети, в котором перечисляются стоп-слова со списком того, что не должно использоваться при генерации.
  • Image count / number of images — количество изображений, созданных за одну генерацию.
  • Image to image / Upload image — поле для загрузки изображения, на основе которого будет генерация.
  • Image demensions / resolution — размеры изображения.
  • Model — модель, используемая для генерации.
  • Prompt Guidance — показатель насколько точно итоговый результат будет соответствовать запросу. Чем выше значение, тем более качественный выйдет результат, но времени на генерацию будет затрачено значительно больше.

Советы, как правильно составлять запрос в Stable Diffusion

Навык формулировать правильные запросы для нейросети оказывает решающее влияние на конечный результат. Если запрос не корректный, в нем не хватает деталей и вводных данных, то никакие расширенные настройки или фильтры изображение не спасут.

Составляя запрос, стоит держать в голове следующие советы.

  1. Нейросети лучше понимают английский язык. Какая бы хорошая не была локализация, английский, чаще всего, — это язык разработчиков. На этом языке большинство нейросетей создаются и обучаются.
  2. Используйте больше конкретики. Нейросети пока что не научились додумывать, читать между строк, понимать намеки и метафоры, поэтому чем более четкий и подробный запрос — тем лучше результат.
  3. Дайте конкретику по стилям, подражанию художникам. Нейросети обучаются на миллионах картинок и часть этих картинок — работы известных художников. Stable Diffusion способен распознавать эти стили в запросах и воспроизводить их при генерации. Список художников и примеров их работ, на которых обучалась Stable Diffusion. Список художников современности от Google.
  4. Просматривайте успешные запросы других пользователей. Поиск нужного запроса методом собственных проб и ошибок может занять много времени, куда быстрее вдохновиться чужими референсами и создать свой запрос с той же структурой, отредактированный под собственные нужды.

  5. Придерживайтесь формулы при составлении запроса: «объект, фон, стиль, дополнительные детали».

Где:
Объект — описание основного объекта, персонажа, предмета;
Фон — описание окружения основного объекта;
Стиль — стиль картинки или имя художника, которому стоит подражать. Например, аниме, реализм или Винсент ван Гог.
Дополнительные детали — качество картинки, уровень детализации, наличие шумов и прочее.

Примеры изображений, сгенерированных нейросетью Stable Diffusion

Примеры изображений котов спецназовцев, сгенерированных нейросетью Stable Diffusion
Коты спецназовцыИсточник: Neyrosety
Примеры изображений белки под водой, сгенерированных нейросетью Stable Diffusion
Белка под водойИсточник: Neyrosety
Примеры изображений пирамид, сгенерированных нейросетью Stable Diffusion
ПирамидыИсточник: Neyrosety
Примеры изображений персонажей для компьютерных фэнтези игр, сгенерированных нейросетью Stable Diffusion
Персонажи для компьютерных фэнтези игрИсточник: Neyrosety
Примеры изображений роботов, сгенерированных нейросетью Stable Diffusion
РоботыИсточник: Neyrosety

Вопросы и ответы

Если после прочтения статьи у вас остались вопросы по использованию нейросети Stable Diffusion, постараемся еще раз кратко ответить на самые популярные из них.

Можно ли пользоваться Stable Diffusion бесплатно?

Stable Diffusion имеет открытый исходный код и любой может его скачать себе на компьютер и использовать бесплатно для коммерческих и не коммерческих нужд.

Платные тарифы есть на официальном сайте представителей Stability AI и у других сайтов, сервисов и приложений, предоставляющих пользователям удобный графический интерфейс и специальные возможности. При работе с такими приложениями и сайтами пользователю не требуются навыки программирования и скорость генераций не зависит от мощности собственного компьютера. За предоставление этого сервиса владельцы сайтов и приложений назначают абонентскую плату.

Есть ли аналоги у Stable Diffusion?

Самый популярный аналог — Midjourney, но она имеет несколько существенных минусов:

  • нет бесплатных тарифов;
  • нельзя оплатить подписку картой из России, нужно использовать обходные пути.

Помимо Midjourney можно выделить:

Какой компьютер нужен для программы Stable Diffusion?

Нейросеть постоянно совершенствуется и обновляется, требования к мощности «железа» также растут от версии к версии.

Минимальные системные требования для работы нейросети на момент написания статьи:

  • видеокарта NVIDIA GeForce, не менее 4 Гб;
  • 16 Гб оперативной памяти;
  • ОС Windows 10+;
  • 10+ Гб на жестком диске или SSD.

Чем слабее будут характеристики ПК — тем медленнее генерации.

Может ли СМИ использовать изображения, сгенерированные Stable Diffusion?

Stable Diffusion имеет лицензию Creative ML OpenRail-M, которая допускает использование для коммерческих и некоммерческих целей.

Изображения, созданные нейросетями, не нарушают ничьи авторские права. Согласно российскому законодательству и статье 1257 Гражданского кодекса РФ, автором произведения науки, литературы или искусства признается гражданин, творческим трудом которого оно создано. Лицо, указанное в качестве автора на оригинале или экземпляре произведения либо иным образом, считается его автором, если не доказано иное.

  • Нейросеть — машина, и без грамотных запросов, команд и корректировок от человека не способна самостоятельно создать произведение.
  • Разработчик нейросети — никак не влияет на конечный результат, который получится после ввода запроса.
  • Автор произведений, на которых обучалась нейросеть, — имеет авторские права на эти произведения, но не имеет прав на произведения созданные на их основе и переработанные, так как он не является участником творческого труда по их созданию.

На основании статьи 1257 ГК РФ авторство может быть признано за человеком, по запросу которого было создано произведение, т.к. текущее законодательство не имеет указаний о том, что отсутствие новизны, уникальности и оригинальности может быть основанием для того, чтобы признать произведение созданным без использования творческого труда.

Более точных законов и правовых актов в области авторских прав на результаты генераций нейросетей в РФ в 2024 году нет.