Генерация изображений при помощи ИИ — одна из самых новых возможностей искусственного интеллекта, поражающая сейчас людей. В данной работе нам помогал популярный ИИ-генератор Stable Diffusion. Принцип работы самообучаемой нейронки основывается на постоянном "изучении" примеров, в данном случае – картин художников, их стилей.
Напомним, Stable Diffusion — это программа с открытым исходным кодом от группы Stability AI. Нейросеть стала доступна для широкой публики в конце августа 2022 года. Она генерирует изображения по текстовому описанию с удивительной точностью. Помимо этой нейронки, пользователям доступны два аналогичных инструмента: DALL-E 2 и Midjourney.
Как все это работает (коротко и простым языком)
За основу создания нейронный сетей взят человеческий мозг, где в процессе сложного взаимодействия между нейронами, соединенными между собой синаптической связью, обеспечивается выполнение огромного количества разных функций и задач организма.
Точно так же искусственная нейронная сеть состоит из искусственных нейронов, которые взаимодействуют для решения конкретной задачи. Искусственные нейроны — это программные модули, называемые узлами, а искусственные нейронные сети — это программы или алгоритмы, которые используют вычислительные системы (компьютеры) для выполнения математических вычислений.
При контролируемом обучении специалисты по работе с данными предлагают искусственным нейронным сетям помеченные наборы данных, которые заранее дают правильный ответ. Например, сеть глубокого обучения, обучающаяся распознаванию лиц, обрабатывает сотни тысяч изображений человеческих лиц с различными терминами, связанными с этническим происхождением, страной или эмоциями, описывающими каждое изображение. В нашем же случае Stable Diffusion имеет огромную накопленную базу по произведениям великих художников. Получая текстовой запрос, она «подмешивает» его в уже накопленную базу и выдает результат.
Нейронная сеть медленно накапливает знания из наборов данных, которые заранее дают правильный ответ.