Эволюция взаимодействия с машинами
Чтобы понять, почему ИИ-агенты стали технологическим трендом, нужно разобраться в эволюции самого термина. В инженерии агент — это нечто способное взаимодействовать с окружающей средой, поведением которого можно управлять с помощью программирования. Помните робота из «Ну, погоди»? Он автономно передвигался, стрелял «глазами», мигал лампочками

С появлением генеративных моделей, способных «думать» и принимать решения самостоятельно, понятие агента обрело новый смысл. Программа, использующая генеративную модель, стала для инженеров чем-то большим, чем классический софт, потому что она, подобно роботу из мультфильма, научилась анализировать информацию и действовать на ее основе, при этом взаимодействуя с пользователем на естественном языке без ограничений в формулировках. Термин «ИИ-агент» быстро подхватили маркетологи и СМИ, превратив это в хайповую тему. Но если углубиться в эволюцию взаимодействия пользователя с «машинами», можно отследить важные этапы развития информационных систем на пути к ИИ-агентам.
Возьмем для наглядного примера смартфоны. Сначала были приложения с множеством кнопок и меню, где пользователь должен был сам понимать, как пройти от точки А к точке Б, ориентируясь в лабиринте различных интерфейсов и тоглов. Учитывая постоянно растущее количество приложений, возникла потребность в более простом и естественном способе взаимодействия. Так появились виртуальные ассистенты (Siri от Apple, Маруся от VK, Алиса от Яндекса и другие), позволяющие отдавать команды голосом или текстом. Однако голосовые и чат-боты, несмотря на свою полезность, были основаны на четких итерактивных сценариях и лишь выполняли инструкции пользователя, не принимая самостоятельных решений.

ИИ-агенты — это следующая итерация в развитии интерфейсов взаимодействия пользователя с информационными системами. Генеративный ИИ предоставил пользователям новую возможность общения с компьютерными программами на естественном языке без ограничения в языках и формулировках, сделал возможным выполнение сложных программных операций с минимальными затратами как для разработчиков, так и для пользователей. Для конечного пользователя ИИ-агент — это тоже своего рода программа, но наделенная «интеллектом» генеративной модели. Он не просто отвечает на вопросы, как виртуальный ассистент, а самостоятельно действует в цифровом мире от имени пользователя, выполняя многоступенчатые задачи.
Как же работают ИИ-агенты?
В отличие от традиционных виртуальных ассистентов и классических программ, они не просто отвечают на запросы пользователей: ИИ-агенты могут получать и анализировать данные, взаимодействовать с внешними системами и общаться с пользователями на естественном языке, не используя при этом конкретные паттерны, то есть фактически без ограничения контекста диалога. Под определение ИИ-агента подходит огромное количество программ и отдельных программных компонентов, но не стоит задаваться вопросом о том, что является агентом, а что — нет. Постарайтесь найти то, что поможет решать именно ваши задачи, остальное — вторично.
ИИ-агенты основаны на четырехэтапном подходе генерации ответа пользователю.

Восприятие
Сначала агент получает информацию из различных источников. В зависимости от задачи они могут включать в себя:
- Историю взаимодействия с пользователем;
- API, получающие данные из внешних систем;
- Базы знаний. Например, корпоративная база знаний компании, где хранится вся информация о процессах в отделе HR;
- Интернет.
Обработка
Получив данные, ИИ-агент должен их понять. Чтобы принять решение, агенты анализируют собранные данные с помощью продвинутых моделей машинного обучения. Например, на основе прошлых взаимодействий и текущего контекста они могут давать клиентам персонализированные рекомендации по продуктам. Используя подход RAG (Retrieval Augmented Generation), агент может получить доступ к собственным источникам данных и предоставить точные, релевантные результаты.
Принятие решений
ИИ-агенты интегрируются с внешними инструментами и данными для выполнения задач на основе сгенерированных планов. Границы могут быть установлены пользователем. Например, агент для обслуживания клиентов может обрабатывать заявки до определенного приоритета, выше которого агент ИИ передаст заявку агенту-человеку. Или он может использовать специальную бизнес-логику, например решать, является ли лид квалифицированным, на основе формулы, разработанной отделом продаж.
Действие
Действия, которые может предпринять ИИ-агент, не ограничены. Он может отправить простой текстовый ответ, например «Эти 3 аккаунта демонстрируют признаки потенциального оттока». А может инициировать вызов API, чтобы, например, получить данные об инвентаризации в режиме реального времени из складской системы или инициировать запрос на сброс пароля.
Некоторые агенты ИИ даже взаимодействуют с внешними приложениями, например автоматизируют рабочие процессы в CRM-системах, обновляют записи о клиентах. Такие агенты могут выполнять целые рабочие процессы ИИ от начала и до конца.
ИИ-агент как инструмент решения задач
Ключевая задача любой компьютерной программы — решать пользовательскую задачу, причем качественно и удобно для человека. ИИ-агент дает именно такую возможность: имея под «капотом» генеративный искусственный интеллект он позволяет пользователю общаться с машиной буквально на человеческом языке и при этом быстро решать по-настоящему сложные задачи.
Помните законы робототехники Айзека Азимова? «Первый закон категорически запрещает роботу вредить людям, второй — приказывает роботу подчиняться людям до тех пор, пока это не станет противоречить первому закону…». Машины работают на нас, а не наоборот, поэтому нам стоит подбирать решения, исходя из их применимости для конкретной задачи и удобства работы, не углубляясь в аспекты реализации.
Как использовать ИИ-агентов в повседневных задачах?

Чтобы проиллюстрировать возможности ИИ-агентов, мы не стали далеко ходить и попросили наших коллег и самых активных пользователей поделиться своим опытом работы с мультиагентной платформой Jay Flow.
ИИ-агенты в разработке
Практическое использование ИИ-агентов для решения задач при разработке ПО выглядит следующим образом — на доске появляется контекст проблемы или задачи в виде заметок, на которых может быть как часть исходного кода, логи, структура файлов или информация общими словами.
По ходу решения задачи LLM способна синтезировать некую законченную мысль, которая может использована сама по себе или для продолжения решения, улучшения или объяснения.

ИИ-агенты в психологии
Искусственный интеллект в психологии активно используется для разбора различных психологических трудностей как обычными пользователями, так и специалистами в области ментального здоровья. Агенты помогают довольно точно определять возможные причинно-следственные связи в поведении человека, лучше понимать его мотивы, мысли и эмоции. Кроме того, агенты помогают проводить тренировку коммуникативных навыков — например, в рамках ролевой игры, где агент используется как тренажер и дает корректирующую обратную связь.
Психологи часто пользуются системами ИИ для выбора конкретных практик, которые можно использовать в работе с клиентом. И (что очень важно) — для предотвращения собственного выгорания: ИИ-агент способен оказать моральную поддержку и понимание сложных эмоций, которые могут возникнуть у психолога по отношению к клиенту.
ИИ-агенты в маркетинге
Для создания рекламной кампании маркетолог описывает ЦА и желаемый результат, после чего система задействует разных ИИ-агентов: один генерирует концепцию и передает согласованную информацию следующему агенту, который генерирует рекламные тексты, далее за дело берется агент, генерирующий визуальные материалы. В итоге маркетолог получает готовый набор рекламных материалов, адаптированных под заданную целевую аудиторию и ориентированных на достижение поставленной цели.
Это только несколько примеров того, как можно использовать ИИ-агентов в повседневных задачах. На данный момент индустрия только исследует новую для себя технологию, поэтому важно экспериментировать, получать опыт и превращать гипотезы в работающие решения.