К 2028 году рынок музыкальных ИИ-приложений увеличится более, чем в 10 раз. Люди все чаще делегируют технологии создание саундтреков, музыки для рекламы, джинглов
Музыка по алгоритму
Технически уже сейчас нейросеть может анализировать лучшие произведения гениальных композиторов, изучать алгоритмы построения разных жанров и, по результатам анализа, создавать музыкальные произведения высокого качества. У нас уже есть нейросеть AIVA, которая имеет официальный статус композитора, зарегистрированного во французском обществе авторов SACEM. Вдохновляясь великими авторами, она создает академическую музыку, которую используют в качестве саундтреков к фильмам и видеоиграм. Но вопрос в том, воспринимают ли люди ее произведения как шедевр? Пока что однозначный ответ — нет.

Музыкальным шедевром обычно признают нечто новое по мелодизму, построению и аранжировке. Хотя нейросеть теоретически способна создать нечто оригинальное благодаря элементу случайности в генерации, такие новшества, как правило, оказываются оторванными от культурного контекста, физиологии восприятия и эмоционального опыта человека. Это делает их малопонятными и трудно воспринимаемыми. Но мы как человечество приближаемся к решению этой задачи благодаря большим языковым моделям, которые способны усваивать все больше информации — от истории музыки до поведенческих паттернов слушателей. Однако, несмотря на прогресс, мы все еще далеки от того, чтобы нейросеть могла осмысленно создавать музыкальные открытия, резонирующие с человеческой культурой и эмоциями.
Как ИИ генерирует музыку
Качество «музыкального ИИ» зависит от пула произведений, использованных для обучения модели. Как правило, в обучающую выборку входят классические произведения, современные композиции разных жанров и специально размеченные MIDI-файлы (musical instrument digital interface), содержащие информацию о нотах, ритмах, темпах и аккордах. Эти данные проходят этап предварительной обработки: нормализацию, сегментацию, фильтрацию по качеству и удаление шумов (лишних данных). После этого они преобразуются в формат, пригодный для подачи в нейросеть — например, в виде последовательностей токенов, аналогичных тем, что применяются в языковых моделях. Такой подход позволяет алгоритмам учиться на больших объемах музыкального материала и находить закономерности, необходимые для генерации новых композиций. Нейросеть генерирует треки и песни на основе исходных знаний, и если она «поняла», на что должна ориентироваться, то вероятность генерации качественной музыки будет высокой.

Если при обучении большой языковой модели не просто использовать лучшее из классической музыки, а ещё и назначать этим образцам повышенные веса (весовые коэффициенты), модель будет стремиться ориентироваться именно на них. Такой подход позволяет повысить вероятность генерации композиций высокого уровня, поскольку ИИ обучается уделять больше внимания именно выдающимся музыкальным примерам. И сейчас среди музыкальных нейросетей хорошо зарекомендовали себя Soundraw, AIVA, FlaxCleap, Soundfu и др.
Что считается шедевром
Так принято называть произведения искусства, которые признаются образцом наивысшего мастерства. И в признании их шедеврами должно сойтись несколько составляющих. Например, произведения Леонардо да Винчи можно скопировать так, что и не отличишь от подлинника. Но реплика не станет шедевром. Потому что это да Винчи совершил революцию, изобразив Мадонну живой женщиной (на тот момент в средневековье было принято рисовать иконописно), а не тот, кто сделал качественную копию. Ее не коснулась кисть мастера в тот особенный период его жизни, когда он ее творил, в ней нет аутентичности и исторического контекста, и ее можно купить, в отличие от оригинала. Поэтому гениальность определяется не только техникой мазка, композицией, мастерским использованием перспективы и цвета. Главное — эмоции, вызванные произведением искусства, новаторство (например, «Весна священная» композитора Игоря Стравинского является шедевром за счет ритмических инноваций, которые повергли публику в шок) и уникальная энергетика ее творца.
Нам нужен автор
Технологии ИИ давно проникли в сферу искусства. Во многих фильмах, которые получили высокие рейтинги, часть работ была выполнена с помощью применения нейронных сетей. Например, в «Аватаре» ИИ-инструменты использовались для рендеринга (то есть отрисовки) сцен. А в «Мстителях. Финал» ИИ омолаживал актеров. Но по большому счету, если фильм получил хороший отклик и зритель остался доволен, то большинство людей не задается вопросом, кто его сделал — человек или ИИ.

Схожая ситуация может перенестись и на музыку. В недалеком будущем композиторы могут привыкнуть использовать нейросети как обычный рабочий инструмент. Тенденция уже очевидна — к 2028 году рынок музыкальных ИИ-приложений увеличится более, чем в 10 раз, при среднегодовых темпах роста 60%. Очевидно, что использование ИИ в этой сфере искусства станет таким же обыденным, как в генерации текстового и визуального контента. Тем более, что они работают по одним и тем же алгоритмам, и в этой сфере нет необходимости с нуля «изобретать велосипед».
Однако человечество все-таки воспринимает искусство на глубоком эмоциональном и физиологическом уровне, где важную роль играют личные переживания автора. А языковые модели этого компонента лишены. Поэтому на данном этапе есть сомнение в том, что люди смогут назвать шедевром симфонию или фугу, написанную ИИ. Во-первых, потому что машина не несет в себе личного опыта и эмоций создателя, важных для восприятия искусства. Во-вторых, ИИ многим внушает страх за будущее, в котором компьютеры и роботы оставят людей без средств к существованию. В таком контексте, большинству людей не очень бы хотелось присваивать нейросети статус гения.

Если экстраполировать этот страх на оценку музыкальных произведений, то, возможно, ИИ и не суждено создать шедевр, который признает человечество. Потому что вряд ли люди способны испытать к нему такую же эмпатию, какую вызывает творение человеческого гения. У нейросети никогда не будет сложного периода в жизни, как у композитора, когда он создал какой-то шедевр. Например, третья «Героическая» симфония Бетховена особенно ценна тем, что была написана в период тяжелого личного кризиса автора, связанного с его прогрессирующей глухотой. Это произведение — триумф человеческого духа над жизненными обстоятельствами. Поэтому, скорее всего, музыке всегда будет необходим человеческий аспект, чтобы ее восприняли как шедевр.
Где вы, музыкальные ИИ-шедевры
Как мы выяснили, их пока что просто нет. Хорошо, что и «предводитель» всех нейросетей — ChatGPT с нами в этом вопросе не спорит:

Сегодня ИИ без человека не может сгенерировать даже простую песню, не говоря уж о шедевре. Вероятность получения качественной ИИ-музыки тем выше, чем больше понимает в хорошей музыке человек, работающий с нейросетью. И хорошо, если человек, творящий музыку, имеет высшее музыкальное образование. Поэтому, конечно, речи о том, что нам как человечеству перестанут быть нужны композиторы, окончившие консерваторию, не идет. Возможно, когда-нибудь нейросеть и поразит нас тем, что напишет что-то гениальнее, чем «Времена года» Антонио Вивальди или «Лунная соната» Бетховена. Но на данном этапе развития ИИ и восприятия людьми искусства, великого музыкального шедевра от нейросетей ждать не приходится.