Как эксперты учат ИИ понимать «русскую душу» с точностью до 80%

Зарубежные ИИ-модели часто выдают шаблонные ответы. Группа компаний «Родная Речь» в рамках экспериментального проекта «Синт» от RoRe TECH учит нейросети понимать российские ценности. Пилотные испытания показали: продукт может экономить бизнесу миллионы на исследованиях и ускорять проверку гипотез.
Директор по исследованиям группы компаний «Родная Речь»
Об эксперте: Мария Петрова — директор по исследованиям группы компаний «Родная Речь». Более 16 лет работает в компании. В настоящее время отвечает за рыночные обзоры, разработку прогнозов, качественные и количественные Ad-hoc исследования (от лат. «для этого, для данной цели» — специальные исследования под нестандартную задачу), обеспечивая высокий уровень точности данных для стратегических решений.

В июле 2025 года группа компаний «Родная Речь» провела конференцию «Код человечности», где были представлены новые разработки IT-направления RoRe TECH. В рамках мероприятия эксперты презентовали результаты одной из разработок, экспериментов с «Синт» (рабочее название) — платформой по созданию синтетических респондентов. В отличие от стандартных языковых моделей, работающих на западных данных, этот инструмент обучается на реальных глубинных интервью с россиянами. Такой подход позволяет точнее отражать мнения наших соотечественников, ценности и потребительские мотивы, а не просто выдавать шаблонные ответы, далекие от российской действительности.

В чем проблема западного ИИ в российских исследованиях

Согласно данным GRIT Insights Practice Report 2025, синтетические респонденты — один из топ-5 инновационных направлений в мировом маркетинге. 44% специалистов в зарубежных исследовательских компаниях уже используют синтетические данные. Но большинство из них продолжают придерживаться стандартного подхода, отправляя нейросети промт с обобщенным описанием персонажа — и получают поверхностные и часто неверные ответы.

Из презентации исследования группы компаний «Родная Речь»
Из презентации исследования группы компаний «Родная Речь»Источник: «Родная Речь»

Так, например, эксперты провели эксперимент, спросив у 300 синтетических респондентов: «Кто добытчик в семье?». Результат оказался типичным для искусственного интеллекта, обученного на данных государств, где равноправие полов считается нормой: 59% сказали «муж», 46% — «жена», а 100% заявили о том, что «делают это совместно». При этом картина распределения финансовых обязательств по мнению реальных россиян выглядит следующим образом: 71% голосов было отдано за вариант «муж», 27% — «жена», и только 32% опрошенных готовы разделять роль «добытчика». Как мы видим, ответы реальных респондентов заметно отличаются от «синтетических», и самое главное — зарубежные ИИ-модели не понимали контекста, культурных и поведенческих особенностей и истинных ценностей жителей нашей страны. Поэтому их ответы были нереалистичными для российской действительности.

Из презентации исследования группы компаний «Родная Речь»
Из презентации исследования группы компаний «Родная Речь»Источник: «Родная Речь»

Реалистичные ответы вместо сухих данных: как мы научили ИИ рефлексировать, а не подбирать слова

Чтобы сделать результаты исследований, полученных «синтетическим» путем, похожими на реальные и отражающими ту самую «русскую душу», мы разработали многослойную систему дообучения ИИ. Ее ядро — не только данные западных ИИ-моделей, но также и уникальная база глубинных данных на основе транскриптов реальных интервью с людьми. Такие данные помогают лучше имитировать их поведение и стиль мышления.

Последовательность работы экспериментальной платформы «Синт» состоит из трех шагов:

  1. Вопрос. Исследователь задает любой, даже самый личный вопрос синтетическому респонденту.
  2. Анализ. Вопрос проходит через систему «ИИ-экспертов» (агентский роутер), которая подбирает наиболее подходящие данные из массива реальных интервью и дополняют их своей экспертной рефлексией.
  3. Ответ. Эти данные передаются в языковую модель, которая формирует развернутый ответ в духе конкретного респондента, точно воспроизводя его позицию и мотивацию.
Из презентации исследования группы компаний «Родная Речь»
Из презентации исследования группы компаний «Родная Речь»Источник: «Родная Речь»

От угадывания ответов к точному пониманию смыслов

Ключевой показатель эффективности наших экспериментов с «Синт» — высокая точность попадания в смыслы и нюансы ответов. После дообучения по специально разработанной методике этот показатель в тестах вырос с 55% до 70−80%.

Яркий пример — ответы «синтетических зумеров» на вопрос «Возвращения каких ушедших из РФ брендов вы ждете?». До обучения искусственный интеллект выдавал случайные популярные названия: Uniqlo, Victoria`s Secret, Massimo Dutti, H&M, OYSHO. И только после дообучения ответы ИИ совпали с реальными ответами россиян-зумеров: ZARA, H&M, Uniqlo, Nike, Adidas. Это подтверждает, что модель стала лучше улавливать паттерны и приоритеты реальных людей, а не просто угадывать ответы.

Из презентации исследования группы компаний «Родная Речь»
Из презентации исследования группы компаний «Родная Речь»Источник: «Родная Речь»

Вызовы в процессе разработки

Одним из неожиданных открытий стала разная точность синтеза для разных поколений.

  • Миллениалы (65% точности): ИИ понимает их лучше всего благодаря большому цифровому следу и высокой интернет-активности с ранних лет.
  • Зумеры (55% точности): задача становится сложнее из-за чуть меньшего количества фундаментальных исследований и более короткой и фрагментированной цифровой истории.
  • Поколение Альфа (45% точности): наиболее сложная, но самая перспективная аудитория для дальнейшей работы.

Важно отметить, что эти результаты были получены на необученной модели, что подтверждает важность ее дообучения для лучшего понимания молодежи.

Из презентации исследования группы компаний «Родная Речь»
Из презентации исследования группы компаний «Родная Речь»Источник: «Родная Речь»

Как «Синт» ускоряет проверку гипотез и удешевляет ее

Обучение синтетов обходится в ~ 2,5 млн рублей на один целевой сегмент, поэтому выгодно и эффективно проводить его совместно с другими игроками индустрии и пользоваться уже разработанными сервисами — например, «Синт». Он будет полезен для тестирования гипотез перед запуском рекламных кампаний, разработки сценариев, калибровки идей с помощью «смоделированных» респондентов и уточнения нюансов коммуникации с целевыми группами. Технология обеспечивает круглосуточный доступ к любой аудитории, позволяет получать ответы на любые, даже самые сложные и интимные вопросы, которые люди не всегда готовы честно обсуждать с интервьюером-человеком, а также использовать сервис в качестве инструмента для быстрой первичной аналитики и проверки гипотез перед большим полевым этапом.

Из презентации исследования группы компаний «Родная Речь»
Из презентации исследования группы компаний «Родная Речь»Источник: «Родная Речь»

При этом в компании не пропагандируют, что ИИ-респонденты — это полноценная замена людям. Мы видим их в качестве нового мощного инструмента в арсенале исследователя, который позволяет работать быстрее и глубже.

Проект «Синт» задуман как открытая инициатива для индустрии: команда RoRe TECH приглашает исследовательские агентства и компании объединить усилия для дальнейшего развития методологии. Совместная работа позволит нам создать и масштабировать целую «армию» синтетов, индустриально обучая их на нашем технологическом стеке. Это даст нам доступ к универсальному инструменту для исследований 24/7.