Искусственный интеллект на пути создания музыкального лейбла: ИИ-дайджест недели

Кто выйдет победителем из спора: ИИ или человек? Умеют ли нейросети петь и разбираются ли в фотошопе? Ответы на вопросы и все самые любопытные новости из мира ИИ — в дайджесте виртуального техноблогера Mr.Metapreneur для Hi-Tech Mail.ru.

Mr.Metapreneur — виртуальный техноблогер. Ведет блог в Telegram, где рассказывает о пользе современных технологий и разъясняет, как ИИ может усиливать человека. Для создания этого дайджеста автор использовал сервис, объединяющий несколько ИИ-инструментов: YesChat в качестве новостного агрегатора, нейросеть для работы с текстом НейроТекстер и DALL-E для создания изображений.

Виртуальный техноблогер Mr.Metapreneur
Виртуальный техноблогер Mr.MetapreneurИсточник: Mr.Metapreneur

Можно ли переспорить GPT-4

Недавнее исследование Федеральной политехнической школы Лозанны (EPFL) и Итальянского фонда Бруно Кесслера показало, что большие языковые модели, такие, как GPT-4, могут быть убедительнее людей.

Ученые изучили, насколько высока сила убеждения GPT-4 в сравнении с людьми в ходе дебатов.

Участников исследования разделили на группы и дали задание обсуждать спорные темы. Так провели четыре вида дебатов: между людьми, между человеком и искусственным интеллектом, между людьми с использованием персональных данных оппонента, и между человеком и искусственным интеллектом с персональными данными оппонента.

Человек и искусственный интеллект
Изображение создано с помощью DALL-E

Таким образом исследователи обнаружили, что GPT-4 с доступом к личным данным человека смог увеличить уровень согласия оппонента на 81,7%. Этот результат гораздо выше, чем в обычных дебатах между людьми.

Такой высокий уровень убедительности ИИ объясняется тем, что языковая модель умело использует личную информацию оппонента и создает персонализированные и убедительные аргументы.

Тем временем исследователи опасаются, что злоумышленники используют силу убеждения нейросетей и личные данные интернет-пользователей в преступных целях. Поэтому эксперты рекомендуют операторам онлайн-платформ предпринять шаги по противодействию распространению стратегий убеждения, основанных на искусственном интеллекте.

Виртуальные медработники

Варианты ИИ-медработников на сайте Hippocratic AI
Варианты ИИ-медработников на сайте Hippocratic AIИсточник: Hippocraticai

Коммуникативные навыки искусственного интеллекта, включая способность убеждать, могут приносить и пользу. NVIDIA и Hippocratic AI, стартап в области искусственного интеллекта в здравоохранении, разработали виртуальных медицинских работников. Они могут распознавать устную речь, отвечать на вопросы пациентов и поддерживать беседу в дружелюбной манере.

Виртуальные медсестры предназначены для выполнения задач с низким уровнем риска. Например, они могут давать советы по питанию, консультировать перед процедурами, обеспечивать уход и наблюдение за пациентами, а также объяснять важность приема лекарств. Однако они не используются для диагностики заболеваний.

На сайте Hippocratic AI вы можете подобрать медицинского работника под ваши конкретные потребности. Услуги нейромедсестры предоставляются за плату в размере $9 в час.

Такие ИИ-медсестры не являются полной заменой медработникам, однако они помогают снизить нагрузку на персонал больниц, выполняя широкий спектр задач. Уже 40 медицинских компаний начали тестирование технологии.

Искусственный интеллект и фотошоп

Пример использования Firefly Services
Пример использования Firefly ServicesИсточник: Adobe

Компания Adobe анонсировала Firefly Services — набор из более чем 20 новых генеративных и креативных API-интерфейсов, инструментов и сервисов.

API-интерфейс — это совокупность инструментов и функций, благодаря которым одна компьютерная программа может взаимодействовать с другой. Он позволяет расширять функциональность приложения, связывая его с другими программами.

Таким образом, Firefly Services представляет собой комплексный набор генеративного искусственного интеллекта и креативных API-интерфейсов, автоматизирующих рабочие процессы. В него входят инструменты для удаления фона, быстрой обрезки изображений и автоматического выравнивания горизонта на фотографии, а также доступ к основным функциям Photoshop. Все они управляются искусственным интеллектом. С помощью Firefly Services также можно редактировать текстовые слои, пометки содержимого и применения пресетов, например, из Lightroom.

Предполагается, что эти новые инструменты помогут дизайнерам ускорить создание контента, а также избавит их от рутинных задач вроде кадрирования изображений.

Чистый звук

Робот сводит звук на студии звукозаписи
Изображение создано с помощью DALL-EИсточник: DALLE 3

Искусственный интеллект теперь помогает облегчить обработку не только визуальных, но и аудио-материалов.

Немецкая компания AI-coustics разработала инструмент на основе искусственного интеллекта, который делает голоса более четкими и убирает лишние фоновые шумы на аудио- и видеозаписях.

Технология AI-coustics будет использоваться как для улучшения речи в реальном времени, так и для улучшения записи. Планируется также внедрить ее в звуковые панели, смартфоны и наушники, чтобы автоматически улучшать четкость голоса в реальном времени. В будущем это, вероятно, позволит создавать звукозаписи и музыку без дорогостоящего оборудования и посещения специализированных студий. Сейчас у AI-coustics есть веб-приложение и API для обработки аудио- и видеозаписей.

Музыкальные эксперименты

Робот играет на синтезаторе
Изображение создано с помощью DALL-E

Возможности искусственного интеллекта в работе со звуком, конечно, не ограничиваются коррекцией и улучшением качества аудиозаписей. Нейросети давно умеют создавать музыку и продолжают совершенствоваться в этом направлении.

Американский стартап Suno AI представил новую версию генератора музыки — Suno AI v3. Эта нейросеть создает музыкальные композиции на основе текстовых подсказок (промптов) пользователя.

С мощью V3 можно создавать композиции длительностью до 2 минут. По сравнению со своими предшественниками, она точнее воспринимает подсказки человека. Теперь Suno AI v3 воспроизводит музыку радио-качества, пользователям также доступно большее количество стилей и жанров генерируемой музыки.