Пользователи по всему миру активно применяют искусственный интеллект, способный «понимать» человеческий язык — текстовые нейросети. ChatGPT уже обошел по популярности Google Chrome, за год количество посещений сайта проекта выросло вдвое, до 3,7 млрд визитов.
Сервисы на основе ИИ, подобные ChatGPT или GigaChat, способны общаться с пользователями в режиме диалога и генерировать по запросу тексты, изображения, программный код. Они используются для решения бытовых задач, учебы и работы. Например, с помощью нейросетей можно запланировать отпуск, составить меню на неделю или программу тренировок. В учебе студенты используют ИИ для написания дипломов и некоторые российские вузы уже официально разрешили это делать. В работе ИИ применять сложнее: обычные нейросети часто не подходят для таких задач. Причина простая — нейросеть способна работать лишь с теми данными, которые были загружены в нее при обучении, и может решать только те задачи, для которых она была создана.
В этом случае на помощь может прийти технология RAG. Аббревиатура RAG расшифровывается как Retrieval Augmented Generation — генерация на основе найденной информации. Нейросети можно предоставить должностные инструкции, результаты исследований, информацию о клиентах компании и покупках — практически что угодно.

В основе подобных инструментов лежат большие языковые модели (Large Language Model, сокр. LLM) — наборы нейросетей, обученных на базе гигантских массивов текстов. В отличие от обычного поиска по ключевым словам, они умеют распознавать не только явные упоминания, но и косвенные ссылки, ассоциации и намеки, а также способны самостоятельно делать выводы и рассуждать на различные темы.
Как это работает
Как правило, пользователь, заходя на сайт, видит обычное чат-окно, в которое может написать вопросы в свободной форме. Далее в работу вступает RAG-система. Она обрабатывает запрос и усиливает его дополнительной информацией для решения задачи. В зависимости от целей бизнеса, в систему можно интегрировать такие данные, как сведения о доходах и расходах компании, финансовая и налоговая отчетность, технические документы, справочники и прочие базы знаний.
Работа происходит в несколько шагов:

Шаг 1. Пользователь формулирует запрос. Например, сотрудник поддержки спрашивает ИИ-ассистента: «Помоги сформировать инструкцию для решения проблемы: что делать если сломался редуктор давления на трубе с горячей водой, а стрелка датчика не меняет своего положения».
Шаг 2. Система обращается к базе данных и получает нужные знания, которые максимально подходят к запросу пользователя. Но сотруднику не нужна вся эта информация — его запрос был узким и конкретным, поэтому он не видит «обогащенный запрос».
Шаг 3. Нейросеть получает запрос пользователя с обогащенными знаниями и генерирует ответ. Например, он может выглядеть так:
Этап 1: Оценить ситуацию.
Проверьте, есть ли вода. Если воды нет вообще, возможно, проблема связана с общим водоснабжением или перекрытием крана на входе.
Убедитесь, что система находится под давлением. Если давление отсутствует, то датчик может просто не реагировать.
Этап 2: Перекройте воду.
Закройте главный кран подачи воды. Это предотвратит возможные утечки и дальнейшие повреждения системы.

Этот пример иллюстрирует возможности RAG-технологии. Конечно, в большинстве случаев специалист не будет перекладывать на алгоритм такие сложные и ответственные задачи, как принятие интерпретацию данных и структурирование ответа. Наиболее вероятный сценарий — поиск данных и выполнение типовых рутинных задач.
Допустим, сотрудник бухгалтерии ушел в отпуск и забыл передать коллегам статус договора. Другой работник может ввести в чат вопрос: «что дальше делать с документом LR30220?». Система самостоятельно найдет информацию в электронном документообороте и сделает вывод — например, что договор требует правок и пересогласования.
Для этого она сперва проанализирует множество доступных ей данных: инструкций с описанием предпосылок о выделенном статусе, информации о форматах файлов, которые могут быть пересогласованы, и так далее.
Пользователь может получить ответ, выглядящий примерно следующим образом:
«Для повторного согласования счета-фактуры нужно внести изменения с помощью кнопки “Редактировать”. Для удобства замечания будут отображены комментариями к тексту. После внесения замечаний закройте документ. Для повторного направления на согласование нажмите кнопку “Повторить согласование”. Обратите внимание: Счет-фактура LR30220 связана с договором DC-3300323, что потребует дополнительного визирования с отделом сбыта».
Преимущество RAG-технологии еще и в ее скорости. В некоторых случаях быстрота обработки данных критична для бизнеса: например, от того, как быстро специалист поддержки найдет решение проблемы, напрямую зависит лояльность клиента, а в промышленной сфере в случае поломки оборудования быстрое реагирование может быть вопросом безопасности.
Подход RAG выручает, когда нейросетям не хватает данных

У больших языковых моделей есть слабость — их знания ограничены теми данными, на которых они были обучены. Чаще всего это общедоступная информация из интернета, опубликованная в сети до определенной даты. Этого недостаточно, чтобы разработать бота, который поможет врачу подобрать лечение, или приложение для работы с финансовой документацией конкретной компании.
Для эффективного функционирования подобных систем необходимо, чтобы нейросеть могла оперировать знаниями, недоступными в открытых источниках. Например, такими как история болезни пациента или данные об оплатах.
Чтобы создать специализированный бот для определенной компании и ее бизнес-цели, большую языковую модель нейросети внедряют архитектуру RAG, которая позволяет дополнять ответы модели актуальными и специализированными данными, будь то информация о трудовых книжках сотрудников или история болезней пациентов. То есть внедрение подхода RAG позволяет обучить нейросеть отвечать на очень узкие запросы, касающиеся только определенной компании.
Подход RAG особенно востребован в компаниях, которые оперируют чувствительной информацией, требующей высокой степени защиты. Банковский сектор, медицинские учреждения и государственные структуры могут извлечь значительную пользу из этой технологии благодаря ее способности безопасно обрабатывать и оперативно обновлять данные. В будущем технология RAG станет доступной для большего числа компаний и организаций и позволит существенно ускорить поиск информации внутри корпоративных документов.
Например, компании смогут формировать собственные базы знаний для сотрудников, которые будут давать ответы на вопросы, используя общие и узкоспециализированные инструкции.